计算机视觉技术原理范文

栏目:文库百科作者:文库宝发布:2023-12-22 17:38:57浏览:1182

计算机视觉技术原理

计算机视觉技术原理篇1

关键词:计算机;视觉技术;交通工程

中图分类号:TP391 文献标识码:A 文章编号:1674-7712 (2014) 04-0000-01

一、引言

随着科技的发展,计算机替代人的视觉与思维已经成为现实,这也是计算机视觉的突出显现。那么在物体图像中识别物体并作进一步处理,是客观世界的主观反应。在数字化图像中,我们可以探寻出较为固定的数字联系,在物体特征搜集并处理时做到二次实现。这既是对物体特征的外在显现与描绘,更是对其定量信息的标定。从交通工程领域的角度来看,该种技术一般应用在交管及安全方面。监控交通流、识别车况及高速收费都是属于交通管理的范畴;而对交通重大事件的勘察及甄别则是交通安全所属。在这个基础上,笔者对计算机视觉系统的组成及原理进行了分析,并形成视觉处理相关技术研究。

二、设计计算机视觉系统构成

计算机视觉处理技术的应用是建立在视觉系统的建立基础上的。其内部主要的构成是计算机光源、光电转换相关器件及图像采集卡等元件。

(一)照明条件的设计。在测量物体的表征时,环境的创设是图像分析处理的前提,其主要通过光线反射将影像投射到光电传感器上。故而要想获得清晰图像离不开照明条件的选择。在设计照明条件时,我们通常会视具体而不同处理,不过总的目标是一定的,那就是要利于处理图像及对其进行提取分析。在照明条件的设定中,主动视觉系统结构光是较为典型的范例。

(二)数据采集的处理。如今电耦合器件(CCD)中,摄像机及光电传感器较为常见。它们输出形成的影像均为模拟化的电子信号。在此基础上,A模式与D模式的相互对接更能够让信号进入计算机并达到数字处理标准,最后再量化入计算机系统处理范围。客观物体色彩的不同,也就造就了色彩带给人信息的差异。一般地黑白图像是单色摄像机输入的结果;彩色图像则需要彩色相机来实现。其过程为:彩色模拟信号解码为RGB单独信号,并单独A/D转换,输出后借助色彩查找表来显示相应色彩。每幅图像一旦经过数字处理就会形成点阵,并将n个信息浓缩于每点中。彩色获得的图像在16比特,而黑白所获黑白灰图像则仅有8比特。故而从信息采集量上来看,彩色的图像采集分析更为繁复些。不过黑白跟灰度图像也基本适应于基础信息的特征分析。相机数量及研究技法的角度,则有三个分类:“单目视觉”、“双目”及“三目”立体视觉。

三、研究与应用计算机视觉处理技术

从对图像进行编辑的过程可以看出,计算机视觉处理技术在物体成像及计算后会在灰度阵列中参杂无效信息群,使得信息存在遗失风险。成像的噪声在一定程度上也对获取有效信息造成了干扰。故而,处理图像必须要有前提地预设分析,还原图像本相,从而消去噪音。边缘增强在特定的图像变化程度中,其起到的是对特征方法的削减。基于二值化,分割图像才能够进一步开展。对于物体的检测多借助某个范围来达到目的。识别和测算物体一般总是靠对特征的甄别来完成的。

四、分析处理三维物体技术

物体外轮扩线及表面对应位置的限定下,物体性质的外在表现则是其形状。三维物体从内含性质上来看也有体现,如通过其内含性质所变现出来的表层构造及边界划定等等。故而在确定图像特征方面,物体的三维形态是最常用的处理技术。检测三维物体形状及分析距离从计算机视觉技术角度来看,渠道很多,其原理主要是借助光源特性在图像输入时的显现来实现的。其类别有主动与被动两类。借助自然光照来对图像获取并挖掘深入信息的技术叫做被动测距;主动测距的光源条件则是利用人为设置的,其信息也是图像在经过测算分析时得到的。被动测距的主要用途体现在军工业保密及限制环境中,而普通建筑行业则主要利用主动测距。特别是较小尺寸物体的测算,以及拥有抗干扰及其他非接触测距环境。

(一)主动测距技术。主动测距,主要是指光源条件是在人为创设环境中满足的,且从景物外像得到相关点化信息,可以适当显示图像大概并进行初步分析处理,以对计算适应功率及信息测算程度形成水平提高。从技术种类上说,主动测距技术可分为雷达取像、几何光学聚焦、图像干扰及衍射等。除了结构光法外的测量方法均为基于物理成像,并搜集所成图像,并得到特殊物理特征图像。从不同的研究环境到条件所涉,以结构光法测量作为主要技术的工程需求较为普遍,其原理为:首先在光源的设计上由人为来进行环境考虑测算,再从其中获取较为全面的离散点化信息。在离散处理后,此类图像已经形成了较多的物体真是特征表象。在此基础上,信息需要不断简化与甄别、压缩。如果分析整个物体特征信息链,则后期主要体现在对于数据的简化分析。如今人们已经把研究的目光转向了结构光测量方法的应用,体现在物体形状检测等方面。

(二)被动测距技术。被动测距,对光照条件的选择具有局限性,其主要通过对于自然光的覆盖得以实现。它在图像原始信息处理及分析匹配方面技术指向较为突出。也通过此三维物体之形状及周围环境深度均被显露。在图像原始信息基础上的应用计算,其与结构光等相比繁杂程度较高。分析物体三维特性,着重从立体视觉内涵入手,适应物体自身特点而存在。不过相对来说获得图像特征才是其适应匹配的条件保障。点、线、区域及结构纹理等是物象特征的主体形式。其中物特较为基础与原始的特征是前两个特征,同时它们也是其他相关表征的前提。计算机系统技术测量基本原理为对摄像机进行构建分析,并对其图像表征进行特征匹配,以得到图像不同区间的视觉差异。

五、结束语

通过对计算机视觉技术的研究,悉知其主要的应用领域及技术组成。在系统使用的基础上深入设计,对系统主要构成环节进行分析。从而将三维复杂形态原理、算法及测量理论上升到实际应用。随着社会对于计算机的倚赖程度增加,相信该技术在建筑或者其他领域会有更加深入的研究及应用。

参考文献:

[1]段里仁.智能交通系境在我国道路空通管理中的应用[J].北方工业时报,2012(06).

[2]王丰元.计算机视觉在建筑区间的应用实例分析[J].河北电力学报,2011(04).

[3]李钊称.主动测距技术在计算机数据分析中的作用探析[J].计算机应用,2010(08).

计算机视觉技术原理篇2

一、计算机视觉检测技术含义

计算机的视觉又叫做机器视觉,通过利用计算机或者是其他的一些机械设备来帮助人们视线事物到图片的过程,从而进行三维世界的感知活动。计算机的快速发展,离不开神经心理学,心理学和认知科学方面的研究和发展,计算机视觉检测技术的发展方向就是对周围的三维空间进行感知和分析。一旦能够拥有这种能力,计算机不仅能感知到周围的总体环境,而且,还能够具有对物体进行描述,识别理解和储存的能力。

二、计算机视觉检测的基本原理

要实现人工智能对视觉的计算机处理是很重要的方面在计算机视觉应用领域中如果要让我们的计算机明白图像的信息就必须经过一系列的处理过程―――数字图像处理.数字图像的处理包括5个步骤:图像预处理(去除噪声)、分割处理分割后区域、测量、图像判读、图像技术.根据抽象程度和处理方法的不同图像技术可分为三个层次:图像处理、图像分析和图像理解.这三个层次的有机结合也称为图像工程.而计算机视觉(Computer vision)则是用计算机实现人的视觉功能对客观世界三维场景的感知、识别和理解.视觉检测按其所处理的数据类型又大致可分为二值图像、灰度图像、彩色图像和深度图像的视觉检测.另外还有X射线检测、超声波检测和红外线检测。

作为新兴检测技术计算机视觉检测充分利用了计算机视觉研究成果采用像传感器来实现对被测物体的尺寸及空间位置的三维测量能较好地满足现代制造业的发展需求.与一般意义上的图像处理相比计算机视觉检测更强调精度、速度和无损性以及工业现场环境下的可靠性.例如基于三角法的主动视觉测量理具有抗干扰能力强、效率高、精度合适等优点非常适合制造业生产现场的在线、非接触产品检测及生产监控.对人类视觉感知能力的计算机模拟促进了计算机视觉技术的产生和发展制造业上获取这些信息的目的有:(1)计算出观察点到目标物体的距离;(2)得出观察点到目标物体的运动参数;(3)甚至可以判断出目标物体的内部特性;(4)推断出目标物体的表面特征有时要求形成立体视觉。

三、亚像素检测技术

随着工业检测等应用对精度要求的不断提高,像素级精度已经不能满足实际检测的要求,因此需要更高精度的边缘提取算法,即亚像素算法。亚像素级精度的算法是在经典算法的基础上发展起来的,这些算法一般需要先用经典算法找出边缘像素的位置,然后使用周围像素的灰度值作为判断的补充信息,利用插值、拟合等方法,使边缘定位于更加精确的位置。现在的亚像素提取算法很多,如重心法、概率论法、解调测量法、多项式插值法、滤波重建法、矩法等。由于这些算法的精度、抗噪声能力和运算量各不相同,他们的应用场合也是各不相同的。

边缘是图像的基本特征,所谓边缘是指图像中灰度存在阶跃或尖顶状变化的像素的集合,边缘广泛存在于物体与物体、物体与背景之间。图像测量是通过处理被测物体图像中的边缘而获得物体的几何参数的过程,边缘的定位精度直接影响最终的测量结果。因此,图像边缘提取方法是检测的基础和关键之一。在视觉测量领域中,早期使用的都是像素级边缘检测方法,例如常用的梯度算子、Lapacian算子和门式算子等。以上的边缘检测方法的精度可以达到像素级精度,即可以判断出边缘位于某个像素内,但不能确定边缘在该像素内的更精确的位置。如果一个像素对应的实际长度较大,就会产生较大的误差,传统的整像素边缘检测方法就不再适用。

四、计算机视觉检测技术在机加工零件检测中的应用要素与过程

(一)曲阵CCD相机

面阵CCD是本项目图像采集系统中的主要设备之一,其主要功能是采集实验图像。该CCD相机主要由CCD感光芯片、驱动电路、信号处理路、电子接口电路和光学机械接口等构成。

(二)工业定焦镜头

在图像测量系统中,镜头的主要作用是将目标聚焦在图像传感器的光敏面上。镜头的质量直接影响到图像测量系统的整体性能,合理选择并安装光学镜头是图像测量系统设计的重要环节。

(三)数字图像采集卡

随着数字信号处理技术和嵌入式处理器技术在图像采集卡中的应用,使得图像采集卡向高速度、多功能和模块化方向不断发展。这类图像采集卡不仅具有高速图像采集功能,同时还具备部分图像处理功能,因此又可以称之为图像处理卡。

(四)标定板

为提高测量精度,需要进行摄像机标定。标定过程中,采用NANO公司的CBC75mm}.0型高精度标定板,外形尺寸为75mmx75mmx3.0mm,图形为棋盘格,其尺寸为2.0mmx2.0mm,精度为1级,即图形尺寸精度与图形位置精度为。

(五)背光源

背光方式只显示不透明物体的轮廓,所以这种方式用于被测物需要的信息可以从其轮廓得到的场合。因此,为精确提取轴的图像中的边缘特征,需采用背光源。为使图像边缘更锐利,光源颜色选择红色。

五、结语

随着计算机技术和光电技术的发展,已经出现了一种新的检测技术―基于计算机视觉的检测技术,利用CCD摄像机作为图像传感器,综合运用图像处理等技术进行非接触测量的方法,被广泛地应用于零件尺寸的精密测量中。本文以面阵CCD为传感器,研究了零件在线测量的方法,实现了零件尺寸的图像边缘亚像素定位测量,对面阵CCD在高精度测量方面的应用作了进一步的探索和研究,为面阵CCD在复杂零件尺寸高精度测量的实现打下了基础。

【参考文献】

[1]马颂德,张正友.计算机视觉:计算机理论与计算基础[M].北京:科学出版社,1988.

计算机视觉技术原理篇3

关键词:计算机动画;二维和三维;现代电影;艺术实践;新影视文化

中图分类号:J218.7

文献标识码:A

文章编号1005-5312(2010)08-0060-01

一、关于计算机动画

原始意义上的动画是指:以一定的速度连续播放一些静止画面时,人类因“视觉暂留”的特性产生错觉,可以清楚的看到一个角色的动态或是一个活灵活现的画面。

计算机动画是指采用图形与图像的处理技术,借助于编程或动画制作软件生成一系列的画面,其中当前帧是前一帧的部分修改。计算机动画采用连续播放静止图像的方法产生物体运动的效果。

计算机动画的关键技术体现在计算机动画制作软件及硬件上,它的制作软件目前很多,不同的动画效果,取决于不同的计算机动画软、硬件的功能。虽制作的复杂程度不同,但动画的基本原理是一致的。由于制作手段上的不同,计算机动画分为两类:二维动画和三维动画。二维动画的技术基础是“分层”技术。动画师将运动的物体和静止的背景分别绘制在不同的透明胶片上,然后叠加在一起拍摄。这样不仅减少了绘制的帧数,同时还可以实现透明、景深和折射等不同的效果。三维动画主要依赖电脑图像生成技术(简称CG),所以又被称为电脑动画。1995年第一部完全由电脑制作的动画电影是《玩具总动员》(Troy-Story)。二维动画和三维动画都是集众多艺术门类于一身的艺术表现形式。

二、现代电影里的计算机动画

对于二维动画片来说,《千与千寻》的画面效果更加引人注意。令人目不暇接的华丽视觉,炫丽的画面会带给你强烈的心灵震撼,优美的音乐于精彩的故事中就如诗中画画中诗,在音乐中你的面前是美丽的画面,从精美的画面中你会更加感受到音乐的优美,两者相得益彰。

对于三维动画片来说,皮克斯(Pixar・Animation?Studios)是3D动画的霸主。不容置疑,绝佳的创意与完美的技术使皮克斯成为了电脑动画领域的领头羊。截止于2004年11月,皮克斯已经与合作伙伴迪斯尼联手推出了六部成功的电脑动画片:1995年的《玩具总动员》,1998年的《虫虫危机》、1999年的《玩具总动员2》、2001年的《怪物公司》,2003年的《海底总动员》,《超人特攻队》。

现代数字特技介入电影之后,利用计算机图形图像技术完成的非现实的形象与真人的表演数不胜数。最早把二维动画形象和真人表演结合到一起的近代的较著名的影片是1988年公映的《谁陷害了兔子罗杰》、1996年的《空中大灌篮》和2003年的《华纳巨星总动员》。

随后,二维动画形象与真人表演的真人动画片接踵而至,连绵不断,如《极速赛车手》作为一部经典动漫影片,沃卓斯基兄弟极力将其打造为一部尽显原著视觉精髓的真人动画。沃卓斯基兄弟运用了一种被称为“21/2维立体技术”的视觉逐行压层技术来处理片中上万的视觉镜头。这些景所处的位面因为各自的移动而产生立体效果,这就象我们从小就看过的最简单的动画原理,就好比创造会动的拼贴画一样。对于三维动画的应用,《金刚》毫无疑问是个杰作,它改编自1933年的同名经典电影。为了让场面达到逼真效果,在以1933年纽约为背景的戏中,导演彼得・杰克逊用到大量上世纪30年代的服装、汽车和交通工具。

三、将计算机动画应用于电影中

在制作前期,创作团队需要根据电影剧本创作和情节设置的需要,对将置入电影里的角色的真实原形进行长时间临摹。对角色形象、结构,乃至习性和习惯动作都要有一个系统的观察临摹,再进行艺术夸张,再进行提炼,画出关键的特点动作,再在这些关键张之间按照角色的性格不同所需要的不同节奏画出数量不等的中间张。这样创作角色,更符合剧情发展节奏感强,动作流畅且个性鲜明,是一种有意味艺术形式的视觉符号。

四、计算机动画在电影中的前景

就现代电影创作而言,计算机的新技术主要包括:以计算机技术为核心的制作技术。比如20世纪末的计算机三维模型建模技术以及与之相匹配的动画技术就是全新的、革命性的成像技术。其次,新技术的基础是一些早已发明的技术和设备,只是尚未在电影创作中充分使用,或虽然使用过,但尚未产生新颖的效果,比如全息摄影技术就是利用早已完全普及的照相技术,以结构式的成像方式形成一种的成像技术,这种技术拓展,为电影影像创作增加了新颖的效果新技术的。

计算机视觉技术原理篇4

【关键词】计算机图形学;相关技术;发展

一、计算机图形学的相关技术介绍

(一)数学基础技术

计算机图形学与数学基础知识有很紧密的联系,一定程度上是数学基础支撑着整个计算机图形学的发展。数学基础技术内容主要包括曲线曲面、几何造型、集合等等,其中最关键的曲线曲面理论中包含很多的知识,曲线曲面理论利用自身的优势很好地解决了实际存在的一些数学问题,受到广泛的认可和应用。但是有的理论知识还处在不断完善的阶段,还不能真正投入到实际的应用中。而分形几何学的引进促进了计算机图形学的创新和发展,原本的图形学只能表现一些简单的事物,由于分形几何学的引进,可以体现各种形态的事物,扩宽了图形学的发展领域。

(二)计算机科学技术

计算机图形学与计算机科学技术肯定有密切的关联,计算机图形学是在计算机技术发展的环境下产生。因此,图形学的发展一定要依靠先进的计算机技术才能实现。计算机的硬盘、显示器、分辨率甚至于计算机本身的性能都会直接影响图形学的发展。计算机图形学现在发展的重点放在图形的软件设计、图形数据结构以及数据库技术上,计算机科学技术是图形学发展的基础和前提。

(三)动画技术

计算机动画技术是计算机图形学应用得最为广泛的一种技术,现在很多的动画视频以及造型都是通过动画技术实现。计算机动画技术简单地说就是利用计算机本身的优势,将原本静止的画面生动化和真实化。它可以利用鼠标随意移动图形的位置,还可以改变画面的大小和色彩,根据设计要求来调整原本的画面,设计出不一样的视觉效果,现在很多的平面广告技术主要依靠动画技术实现,带给受众非同寻常的视觉体验,吸引大家的关注。

(四)可视化技术

可视化技术一般被称为数据的可视性,普遍用于气象数据的分析、海洋数据的分析以及地质勘探的数据分析等等,利用计算机将数据和图形结合在一起,让数据以更加直观的方式呈现出来。图形学的可视化技术只需要输入相关的数据就可以形成相应的图形以及数据分析,现在图形学的可视化技术开始应用到医学图像的处理中,但是由于受到技术条件的限制还不能有效分析医学数据。

(五)虚拟现实的技术

虚拟现实的技术是指将屏幕中的画面以一种真实地形式呈现出来,让观众感觉处在现实生活中一样,现在我们观看的3D电影大多利用的是这种技术。计算机根据人类肉眼观看习惯和规律来设置相应的画面,从不同的角度满足观众的视觉需要,让观众在不同场景的转换中恍如在不同时空中穿梭。这种技术最大的优势就是将原本静止的画面以最生动真实的形式表现出来,给静止的画面注入了生命。

二、计算机图形学的发展趋势

(一)计算机动画设计

早在20世纪60年代,计算机图形学就有了一定的发展,给我们的生活带来了很大的改变,但是由于受到计算机技术的限制,实际应用领域受到限制。计算机动画追求的是画面的生动性和连续性,将一些独立静止的画面用不同的帧串联在一起,形成一幅生动的动画作品。计算机图形利用动画技术被广泛地应用到游戏、影视以及广告作品中,设计的动画场面不仅很好地将动作与情节结合在一起,带给观众巨大的视觉冲击,还能利用动画设计将整部作品的意义升华。例如大家十分熟悉的《阿凡达》这部作品就是利用计算机动画技术带给观众不一样的感受,不仅是好莱坞大片,很多的动画片也使用了动画技术,让小朋友在动画片中感受乐趣。

(二)教学应用

近几年计算机图形学在教学中的应用也越来越广泛,生动的图形能够帮助学生更好地消化知识点。计算机图形学可以将教材上复杂的知识点以生动形象的图像直观地呈现出来,这样的教学方式不仅能够减轻老师和学生的压力,还能很好地激发学生学习的兴趣,加深对知识点的认识和理解。例如,利用计算机图形学的相关技术形成数学模型或者是物理模型,学生通过对模型的学习掌握相关的知识点。

(三)图形显示

计算机图形学依靠本身的可视化技术可以将数据和图形有效地结合在一起,图形显示是计算机图形学发展的一个主要方向。现在很多的气象图、地形图以及资源分布图中都使用了图形学,相关部门利用这些图形能够在最短的时间内掌握想要了解的信息,有助于决策的科学性和合理性。现在很多行业的发展都要借助这些精密的地图,特别是工程建设以及旅游资源开发等等,通过这些图形显示制定最佳的工作方案。

(四)网络生成技术

网络生成技术是今后发展的主要方向,可以分为结构化网格和非结构化网格两种形式。

1、结构化网格

结构化网格的方式又可以称为映射法,这种方法是利用映射的原理和映射函数等将网格映射到一个独立的空间中,再利用多种方式将网格与物体本身相脱离,最后形成一个全新的物体。

2、非结构化网格

生成非结构化网格的方式有很多种,相比较结构化网格而言更加方便,在实际的应用中也会更加实用。生成非结构化网格的方法主要有布点、分解、栅格,其中应用得最多的就是布点以及栅格,非结构化网格今后的发展方向是全自动网格划分以及三维网格。现在二维网格的发展已经相对成熟和稳定,三维网格也开始投入研究和运用,这些都为全自动网格的划分方式提供了有利的条件,全自动网格划分方式的形成,可以大大提高工作效率。

三、总结

科学技术的发展很大程度上推动了计算机图形学的发展,同时图形学的研究和应用也带动了相关学科的进步和完善,随着图形学在社会经济发展中的作用越来越明显,它已经成为当代社会进步和发展不可缺少的一部分。但是在实际应用中还是要正确对待图形学,根据自身的具体情况有针对性地运用图形学的相关技术,实现社会的健康发展。

参考文献

[1]马丽莉,罗坤,刘以成.计算机图形学相关专利技术综述[J].电视技术,2013(2).

[2]杨敏.计算机图形学与图形图像处理技术浅析[J].电子制作,2013(8).

计算机视觉技术原理篇5

Abstract: For now the defects of fire monitor’s location technology in large space building, the binocular stereovision is applied to orientating fire in these buildings, the problem of real-time of fire monitor is well solved,having very high use value.

关键词:高大空间建筑双目立体视觉火源定位

Key Words: Large Space Building, Binocular Stereovision, Fire Location

中图分类号:G267文献标识码:A 文章编号:

1.概述

改革开放以来,我国各种民用建筑类型都得到了长足的发展。特别是近年来高大空间建筑日益增多。高大空间建筑由于建筑结构的特殊性和使用功能的复杂性,导致其防火分隔很困难,常规的灭火设施功能难以施展。针对这一情况,人们对适合于此类建筑的灭火技术进行了大量的研究,已有相关产品(智能消防炮)应用到实际工程中。目前消防炮定位技术主要集中在红外线、紫外线火灾探测器的扫描搜索定位以及基于机器视觉技术进行火灾空间自动定位,这一方法是利用安装在炮管上的单目摄像机进行扫描定位。然而这两种装置完成对一个火源的定位,需要把探测器调整到两个理想位置,硬件调整所需时间较算法实现所需时间要长的多,因而系统定位过程所需时间主要花费在探测器位置调整上,因而具有明显滞后性,不符合火灾扑救实时性要求[1]。针对这一情况,本文采用双目立体视觉定位技术来实现火源定位来弥补滞后性问题,具有很高的利用价值。

2.双目立体视觉定位基本理论介绍

2.1双目立体视觉原理[3]

双目立体视觉(Binocular Stereo Vision)是机器视觉的一种重要形式,它是基于视差原理并利用成像设备从不同的位置获取被测物体的两幅图像,通过计算图像对应点间的位置偏差,来获取物体三维几何信息的方法。己知两摄像机之间的位置关系,便可以获取两摄像机公共视场内物体的三维尺寸及空间物体特征点的三维坐标。

2.2摄像机模型

摄像机采集到的图像二维信息,要想根据这个二维信息得到物体实际的三维信息,就要建立图像坐标系与世界坐标系之间的映射模型。本文用经典针孔摄像机模型来描述这一关系,如图1所示。其中XWYWZW为世界坐标系,XCYCZC为摄像机坐标系,xy为图像物理坐标系,uv为图像像素坐标系。

图1 摄像机针孔模型

上述模型存在以下关系:

(2-1)

M1为内部参数矩阵,M2为外部参数矩阵。

2.3双目立体视觉三维测量原理

双目立体视觉三维测量是基于视差原理,图2所示为简单的平视双目立体成像原理图,两摄像机的投影中心连线的距离,即基线距为B。两摄像机在同一时刻观看空间物体的同一特征点P,分别在“左眼”和“右眼”上获取了点P的图像,它们的图像坐标分别为Pleft=(Xleft,Yleft),Pright =(Xright,Yright)。假定两摄像机的图像在同一个平面上,则特征点P的图像坐标的Y坐标相同,即Yleft = Yright ,则由三角几何关系得到:

(2-2)

图2 双目立体成像模型

则视差为:D =Xleft-Xright。由此可计算出特征点P在摄像机坐标系下的三维坐标为:

(2-3)

因此,左摄像机像面上的任意一点只要能在右摄像机像面上找到对应的匹配点,就可以确定出该点的三维坐标。这种方法是点对点的运算,像面上所有点只要存在相应的匹配点,就可以参与上述运算,从而获取其相应的三维坐标。

3.双目立体视觉定位关键技术

双目立体视觉系统包括图像采集、摄像机标定、特征提取和立体匹配等部分,其中最关键的是摄像机标定和立体匹配这两项技术[2]。

所谓摄像机标定,就是确定摄像机内外参数M1、M2的过程,本文使用Zhang Z.Y.提出的基于2D平面靶标的摄像机标定方法[3]。

立体匹配其基本原理是从两个视点观察同一景物以获取立体像对,匹配出相应像点,从而计算出视差并获得三维信息。从各具特色的双目立体匹配算法框架来看,算法有效性主要依赖3 个因素,即选择准确的匹配基元(决策变量)、寻找相应的匹配准则(目标函数和约束条件)和构建能够准确匹配所选基元的稳定算法(求解过程)。

在本文中,考虑到火灾火焰定位报警这种实时性要求较高的场合,我们采用的匹配算法主要是局部匹配算法中的区域匹配法。区域匹配是直接对图像像素进行匹配,匹配结果不受特征检测精度和密度的影响,可得到较高的定位精度,使得区域匹配的鲁棒性有很大提高,同时也能满足实事性需求。匹配准则利用双目立体视觉中的极线几何约束条件。

4.实验平台

4.1硬件平台实现

采用陕西维视数字图像技术有限公司提供的系统开发平台方案搭建硬件平台,整个系统总体构架如图3所示。

图3 硬件系统总体架构

该系统介绍如下,用两部微型高清晰黑白工业相机获得火灾图像,该两部摄像机摄像机水平平行放置。经两路工业高清图像采集卡(MV-采集后送至台式电脑,该采集卡支持VB、VC、DELPHI二次开发,提供开发实例源代码。带软压存储软件,支持多种操作系统。利用安装在电脑里的开发软件(Visual C++ 2008 + OpenCV 2.0)来实现摄像机标定以及火源空间定位软件的开发工作。利用开发的软件计算出火源空间三维坐标后,电脑给机器视觉可精确控制运动高速云台发出指令,来验证定位的准确性和实时性。该云台可通过运动控制卡(内置)来精

确控制。控制范围水平面不小于-157度到+157度,垂直平面内不小于-36度到+36度,控制精度0.0129°,60步/s-1000步/s数字化加速度控制,运动速度可控可调,用于自动控制、自动跟踪、视觉仿真等机器视觉平台的搭建,可以二次开发。

4.2软件平台实现

OpenCV(open source Computer vision Library)[4]是Intel公司开发的开源计算机视库,它由一系列C函数和少量C++类构成,实现了图像处理和计算机视觉方而的很多通用算法,具备强大的图像和矩阵运算能力。它拥有包括300多个c/c++函数的跨平台的中、高层API,不依赖于其它的外部库(尽管也可以使用某些外部库),通过调用OpenCV算法库,研究者们可以在前人己完成的成熟算法基础上迅速开展自己的工作。作为一个基本的计算机视觉、图像处理和模式识别的开源项目,OpenCV可以直接应用于很多领域,作为二次开发的理想工具。

该平台基于 Windows7操作系统,利用Visual C++ 2008 开发了一个基于OpenCV2.0的火源定位系统。

图4软件平台模块功能图

图5是在本系统在OpenCV下生成的Tsukuba三维重建图,由此可见我们便可以借助三维重建的方法,达到对火灾火源空间定位。

图5 Tsukuba图相对的三维重建图

5.结论

随着经济和社会的不断发展进步,大空间建筑越来越多,随之带来的高大空间建筑的火灾扑救问题受到更多的关注。本文针对目前消防炮定位技术的不足,提出了双目摄像机立体视觉空间火源定位技术,将定位和联动独立开来,可以更实时地实现定点灭火,把火灾造成的损失减小到最小程度,必将具有广阔的应用前景和使用价值。

参考文献

[1]侯杰,钱稼茹等.高大空间建筑火灾探测及扑救技术发展思考[J].华中科技大学学报(城市科学版),2008,25(4):196-201.

[2] 原思聪,刘金颂等.双目立体视觉中的图像匹配方法研究[J].计算机工程与应用,2008,44(8):75-77.

[3] Zhang Zhenyou. A flexible new technique for camera calibration[J]. IEEE Transactions on pattern Analysis and Machine Intelligence,2000,22(11):1330-1334.

计算机视觉技术原理篇6

[关键词] 计算机;数字技术;电影;发展

计算机技术的发展,使我们生产、生活的各个方面都发生着巨大的改变,在电影的领域也是如此。电影与科技发展密切相关,我们甚至可以说,电影发展史便是电影技术的发展史。每一次电影世界里的大变革,往往是以科学技术为先导的,其里程碑式的作品必定是新科技成果的展现并取得较大成功的范例。没有任何一门艺术形式像电影这样与电脑技术有着如此息息相关的联系。计算机数字技术的发展,为电影创作提供了丰富的手段,为电影创作者提供了广阔的创作空间,其想象力得以充分的发挥,从而为我们带来视觉盛宴。

毋庸置疑,电影已经进入了数字时代,数字技术是指借助一定的设备将各种信息转换为计算机能识别的符号系统,之后再借助电脑对信息进行运算、传送、还原的技术。大量使用数字技术的科幻大片《阿凡达》的导演詹姆斯•卡梅隆说:“视觉娱乐影像制作的艺术和技术正在发生着一场革命。这场革命给我们制作电影和其他视觉媒体节目的方式带来了如此深刻的变化,以至于我们只能用出现了一场数字化文艺复兴运动来描述它。”[1]

在数字技术中,有一项是电影界最常用的,也是能给我们与传统电影画面完全不同的绚丽画面、宏大场景的,就是3D技术。“3D是three-dimensional的缩写,就是三维图形。在计算机里显示3D图形,就是说在平面里显示三维图形。不像现实世界里,真实的三维空间,有真实的距离空间。计算机里只是看起来很像真实世界,因此在计算机显示的3D图形,就是让人眼看上去就像真的一样。”众所周知,计算机屏幕显示的是平面的,也就是二维的,我们之所以能够看到三维图像,是因为3D成像原理是依据人两眼的视觉差,人眼看到的东西总是近大远小,从而形成立体感,另外,人的两眼球之间会有一段大概8厘米左右的距离。所以,想要使人看到3D影像,必须让左眼和右眼看到不同的影像,在计算机屏幕上因色彩灰度的不同而使人眼产生视觉上的错觉,画面实际上也有一段差距,所有这些只是模仿人类真实双眼看到的情况。从另一个方面看,可以说电脑3D技术是虚拟三维技术,它只是看起来像三维罢了,利用计算机的运算达到视觉立体效果,使二维平面变为立体的,是非实体、虚拟的。而这种虚拟会给观众带来真实感,自然需要计算机无数次的精密运算、专业人员无数次的修改等。

总之,计算机技术与电影艺术的广泛结合,给我们带来了巨大的冲击力,现在普遍使用的3D技术所带来的视觉享受,在以往的电影中是无法找到的,计算机技术加入电影世界,形成了令人震撼的表现力,也带来了前所未有的吸引力。随着3D技术广泛应用于电影,现在的电影与传统领域的电影已经大大不同,观众已经适应了这种视觉张力,哪部电影没有这样的图画,会让人感到什么地方不一样。随着计算机技术的发展,电影随之会有更大的发展空间。

数字技术对传统电影的改变,主要表现在制作方式、表现手段、生成方式、电影题材、存储介质、接受渠道、观众心理等方面,另外,电影之外的附属品,如电影审美价值判断以及电影本体论等也都产生了巨大影响。数字技术在电影中的运用无疑是电影产业产生以来的重要变化之一。可以说,数字技术是对电影产生重大影响的技术革命,以下我们从计算机数字技术带来丰富的电影样式、使得虚拟世界的表现逼近真实、使传统电影的叙事性弱化、转而以画面、音效等吸引观众等三个方面来论述说明。

第一,计算机数字技术带来丰富的电影样式,使电影极大地延伸了题材范围,使新的表现对象进入电影文本。科幻电影、动画片、灾难片、动作片、探险片等,有了计算机数字技术的加入,都得到了巨大的发展。数字技术使科幻世界成为视觉真实,并使科幻片确立了牢固地位。数字技术让动画片获得了新生,传达了与传统动画片不同的内涵,动画片不仅仅是儿童的专利,已经跻身于主流电影行列。数字技术让虚拟世界真实再现,为观众提供了巨大的想象空间。

计算机数字技术催生了动画片,并使之发展与成熟。动画片在数字技术的支持下获得了新的生存空间,众所周知的20世纪40年代,迪斯尼曾经创造了一个动画黄金时代,我们耳熟能详的、经典的如《米老鼠和唐老鸭》《猫和老鼠》《白雪公主》《木偶奇遇记》等。但这些传统的经典在没有数字技术介入之前,都是从教育的角度去创作的。数字技术介入之后,动画片不再只是儿童的专利了。1995年迪斯尼与皮克斯动画联合推出的《玩具总动员》是第一部全部采用三维动画技术制作的动画片,片中所有的图像全部在电脑中生成。令人震惊的是《玩具总动员》上映后,仅3天时间就获取了5 700万美元的票房收入,充分证明了,这部动画片不仅仅是面对儿童市场,它也成为迪斯尼公司赚钱最快的动画片。

计算机数字技术,还使得动画世界中出现了真人的形象,动画与真人的结合表演,开拓出了一个崭新的艺术空间,给观众更丰富的视觉体验,电影形式得到了丰富和发展。计算机数字技术不仅把动画人物与真人表演完美融合在了一起,更重要的是它让传统的二维动画具有三维立体感。例如,《侏罗纪公园》运用3D技术创造出了各种活灵活现的恐龙,而这些恐龙与真人的表演,就像它们真的存在于那里。为了使虚拟的环境中创造出逼真的视觉效果,这部电影运用了110台高性能电脑和数百名电脑工程师,建立了2 000多个关节可以灵活转动的立体模型。其人物表情的丰富与皮肤的质感、技术创造的逼真效果、高超的造型、有层次的色彩等,使得这部影片赢得了3亿6千万美元的票房收入。

总之,这些由计算机数字技术带来的新表现领域,采用多种形式的计算机技术,或是三维的动画技术,或是二维、三维相结合的手法,使得动画片达到了逼真的艺术效果,并获得了广大成人观众的认可。人的无限想象能力,在这些影片中得到了实现并能够得到完美的展现。在计算机营造动画人物技术上的创新,完善电影的技术手段,发展影片的画面美观等方面的种种努力,使得这些以追求逼真画面、表现人类想象及技术展示为目标的动画片渐趋成为大人们的专利。我们不得不说,计算机数字技术让传统动画片焕发出新的生命力,并使之获得了较高的地位,在主流电影类型中占有一席之地。

第二,计算机数字技术的应用,使得虚拟世界的表现逼近真实。虚拟现实是1989年由美国的兰尼尔最早提出的,他认为,“虚拟现实是用计算机技术生成一个逼真的三维视觉、听觉、触觉或嗅觉等感觉世界,让用户可以从自己的视点出发,利用自然的技能和某些设备对这一虚拟世界客体进行浏览和交互考察。”[2]电影《阿凡达》的上映,为人们提供了直接接触虚拟世界的机会,越来越多的人开始了解并熟悉虚拟现实技术。它不仅给观众带来了一场震撼的视觉盛宴,也给电影世界带来了一场虚拟风暴。“虚拟现实技术是由交互式计算机仿真组成的一种媒体,能够感知参与者的位置和动作,替代或者增强一种或者多种感觉反馈,从而产生一种精神沉浸于或者出现在仿真环境中的感觉。”

我们可以说,虚拟现实技术是一门复杂的综合技术,它涵盖了众多学科的众多技术,如计算机图形学、仿真学、多媒体技术、网络技术、人工智能技术、传感技术等。虚拟现实技术中最主要的是表演捕捉技术,简单来说,表演捕捉技术就是通过捕捉演员的表演,再将真人演出影像与电脑动画结合,使虚拟人物符合人类的表情,创造出真实的虚拟人物表演,使动画的虚拟人物造型、表情等接近真人。捕捉的对象包括演员的肢体动作、面部表情,它们可以自由套进不同的虚拟角色中,创造更广阔的表演空间。例如,面部表情的捕捉,在演员表演时,头上戴上精密摄像仪器,将演员面部表情传给计算机,精密到连眼神上的细微变化都不会错过。这些数据经过计算机的一系列运算,再传输给虚拟角色,使之具有真人的各种表情、动作。

总之,虚拟现实技术使电影制作方式打破了传统的电影制作的模式。在这种模式下,影片的前期准备、中期拍摄和后期制作可以同时进行。我们在电影世界中,能够获得空前的听觉上、视觉上、情感上、想象上的审美体验,电脑的参与、科技的发展,使得人们在惊叹的同时享受美。

第三,计算机数字技术使得传统电影的叙事性弱化,转而以画面、音效等吸引观众。传统的电影都是以新奇的故事和曲折的情节来吸引观众,其中的佼佼者必定是在情节上能够得到广泛的认可,情感上得到广泛的一致。计算机数字技术的发展,为电影带来的全新的视野,故事的叙事性逐渐弱化,取而代之的是宏大的场景、虚拟的空间、非凡的人物等等画面和音效的全方位的冲击,给人以视听新感受。这种巨大的转变,一方面为观众带来了全新的体验,一种新的美学享受;另一方面,传统题材与形式的电影似乎丧失了生命力,变得毫无魅力。数字技术介入电影制作,不仅使传统的故事情节主线从影片创作的中心开始向边缘退位,它也让我们给电影重新定位,电影已经不是靠几个演员、几台摄影机就能制作出来的了,而是需要借助精良的设备、高超的技术,来完成多方面的综合,达到现实与虚拟的结合。数字技术的参与,使电影可以更大程度地展示美学特性。现在是视觉媒体的时代,电影应该顺势而为,新的计算机数字技术允许电影向真实性的极限挑战,创造新的银幕奇观,最终给人们带来前所未有的视觉体验。

现今的电影市场上,很难看到没有数字技术参与的电影。因为,计算机技术已经并迅速地改变着电影的一切。电影的制作、载体的形式、传输的手段,无一不融入电脑技术。电影的发行和放映也不再以原始物理的方式进行。令人目不暇接的3D画面,带给观众的感受是革命性的。数字技术对于电影已不仅仅是技术的革新,是全方位的改变,这是电影发展过程中不可回避的事实。传统的电影已经大大让位于新型的电影,人们的观念也发生了根本的转变,计算机数字技术已经不再是吸引人们眼球的卖点,而是电影中必不可少的一部分。

综上所述,电影与科学技术的结合,开创了电影制作的新纪元。计算机数字技术与3D技术参与电影制作与其他各个步骤,借助于计算机、多媒体、互联网等数字技术的发展,电影将完成电影发展历程上根本转变。相信在未来计算机技术的不断发展的催化下,电影也将会得到空前的发展。

[参考文献]

[1] [美]托马斯•A•奥汉年,迈克尔•E•菲利浦斯.数字化电影制片[M].施正宁,译.北京:中国电影出版社,1998:19.

[2] 张晓伟,臧海英.电影世界中的虚拟现实技术[J].科技传播,2010(11).

计算机视觉技术原理篇7

关键词:图像处理 计算机视觉 立体视觉

在实际工程实践中,由于受现场条件和测试技术本身的限制,结构动位移的测试往往存在一定的困难和挑战,这也使动位移并未成为结构动力性能评估中一个常见的评估指标。结构动位移响应是直接反映结构在动力荷载作用下安全性和整体性的重要参考指标。随着工程结构或构件建造得越来越柔和复杂结构模型试验研究的发展,如大跨度桥梁、高层建筑、索结构等的现场测试以及结构振动台试验、风洞试验等,结构动位移的测试显得尤为重要。

计算机视觉是研究计算机模拟生物外显或宏观视觉功能的科学与技术,是一个发展十分迅速的研究领域,其研究手段涉及甚广,如图像处理、机器视觉、医学图像分析、模式识别、计算机图形学、人工智能等。当计算机通过视觉传感器(比如相机或摄像机等)试图分析三维空间的物体时通常只能给出二维图像,通过计算机分析和处理图像信息,可以重构实物的三维几何信息,包括其形状、位置、姿态、运动等。因此,通过计算机视觉技术实现结构动位移的测量是可行的。上世纪八十年代中期以来,随着计算机软、硬件技术的不断发展,在土木工程领域,国内外很多学者尝试将计算机视觉技术用于结构的几何测试,包括结构的位移(静、动位移)、裂缝、表观外形等。Aw和Koo采用数码照相机来进行预设目标的坐标测量,经过基于计算机视觉理论的光束法优化后,其测试精度为2.24mm。Nieder?st和Maas利用数码摄像机来测试混凝土梁在脱水收缩过程中的变形情况,其在相机视场为80cm时测试精度可达0.03mm。相类似地将计算机视觉技术用于结构特性的测量例子还有很多,比如混凝土管片变形检测,梁破坏试验中的变形测量,远距离桥梁变形测量,轨道梁破损状况的检测等。相比于结构静态几何特性的测试,结构动态特性的测试应用相对不多。Olaszek利用摄像机来摄录桥梁的振动情况,并以计算机视觉技术进行结构动位移重构分析,得出的动位移测试精度为1mm左右。Yoshida等采用立体视觉技术来测试一块薄板的三维振动特性。

一、单相机标定

二、基于立体视觉的两相机立体标定

三、图像点跟踪

图像点跟踪是基于立体视觉的结构位移测试手段中的重要环节。在图像(或视频)分析过程中,点跟踪的精度会直接影响位移测试的最终结果。在实际测试中,本文采用两个黑方格组成的目标模板粘贴在所测结构的表面,方格尺寸均为30×30mm,两方格的交叉角点作为图像分析的跟踪点。

四、三维点重构

针对本文采用的两相机位移测试手段,在两相机的所有标定参数和所拍摄的图像跟踪点都确定完成后,最后一个重要环节就是三维点重构,即得到实测结构上目标点的三维坐标值。三维点重构可采用计算机视觉中的非线性三角测量法进行。

计算机视觉技术原理篇8

1、引言

随着经济的迅猛发展,汽车的迅速普及,根据社会对汽车产业的要求,车辆的各方面指标都受到人们越来越多地关注,汽车涂装过程中的瑕疵直接影响汽车的外观质量,因此如何在生产过程中利用计算机视觉检测技术检测出并及时修补汽车涂装过程中产生的瑕疵就成了首要的任务[1]。本文的研究内容是首先了解计算机视觉检测系统的工作原理,汽车涂装瑕疵的种类,然后结合两者的特点,应用计算机视觉检测系统检测汽车涂装瑕疵。该研究的价值在于两方面:①对于汽车生产的自动化和过程自动化,计算机视觉是现实真正意义的自动的基础和一种重要的质量控制的手段;②对于汽车涂装瑕疵的修补可以提高其修补的精度。

2、汽车涂装瑕疵的计算机视觉检测系统

汽车涂装瑕疵检测系统主要包括照明系统、图像采集卡、CCD摄像机、计算机以及软件处理等几个主要部分[2]。综合计算机视觉检测系统的构成和线结构光测量的原理,基于计算机视觉的汽车涂装瑕疵的检测系统大致是这样构成的:将线结构光投射到被测物上,所形成的光斑作为传感信号,用CCD摄像机采集光斑图像,采集到的图像信号被传输到计算机,根据图像处理和计算机视觉检测系统的处理产生处理结果,返回到涂装生产线,对车身的涂装进行修正,从而提高产品质量。汽车涂装瑕疵的视觉检测系统如图1所示[3]。

3、计算机视觉检测

计算机视觉是计算机对图像进行自动处理并报告“图像中有什么”的过程,也就是说它识别图像中的内容。图像中的内容往往是某些机器零件,而处理的目标不仅要能对机器零件定位,还要能对其进行检验。计算机视觉系统基本原理:机器视觉系统通常采用CCD相机摄取图像,将其转化为数字信号,再采用先进的计算机硬件与软件技术对图像数字信号进行处理,从而得到所需要的各种目标图像特征值,并在此基础上实现模式识别、坐标计算、灰度分布图等多种功能。计算机视觉系统能够根据其检测结果快速地显示图像、输出数据、指令,执行机构可以配合其完成指令的实施。计算机视觉系统主要由图像获取、图像分析和处理、输出显示或控制三个功能模块组成[4]。视觉检测按其所处理的数据类型可分为二值图像、灰度图像、彩色图像和深度图像的视觉检测。另外,还有X射线检测、超声波检测和红外线检测。一个完整视觉检测系统包括:图像采集、图像分割、零件识别、模型匹配和决策判断。Newman[5]等描述了利用深度图像进行零件检测的AVI系统,具有一定的代表性。一个典型的AVI系统如图2所示。

4、汽车涂装瑕疵的检测算法

由于汽车涂膜中一些缺陷的边界比较模糊,例如:气泡、爆裂气泡孔、气泡针孔、抽缩等等。边缘处灰度变化很小,直接用传统的微分边缘检测算法无法有效的检测出来。所以对缺陷模糊边缘的检测成为了算法的关键[6]。本文介绍了基于线结构光的边缘检测方法。汽车涂装表面被光源投射器发出的线结构光照射,反射出的图像被CCD摄像机所接收传输到计算机视觉检测系统中。若涂装表面没有瑕疵,则产生图3的图像。若涂装表面有瑕疵,则产生图4的图像[7]。

5、总结

计算机视觉技术原理篇9

关键词:多媒体;多媒体技术;发展前景

中图分类号:TP37 文献标识码:A 文章编号:1007-9599 (2012) 10-0000-02

众所周知,在现代科学技术高度发展的今天,信息的传输、信息处理和信息的共享已成为现代社会进步的关键,多媒体技术就是适应于这一需要的产物。它将图形、图像、动画、声音和视频等技术相结合,充分利用了文字、图像、声音等信息,并模拟了人的形象思维与逻辑思维的能力来综合处理和应用这些信息,从而大大地提高了计算机获取、处理信息的能力使信息接收和处理能按人类最自然、最习惯的方式进行,难怪有人称多媒体技术是信息处理技术的第四次革命性的飞跃。

一、计算机多媒体技术概念

所谓计算机多媒体技术,就是通过计算机将文字、图像、视频、声音、动画等多种形式的媒体信息通过一系列的变换,转变成为数字信息,同时,把这些数字信息通过友好的界面进行显示出来。多媒体的范围非常广泛,比如文字、图像、视频、声音、动画通以及用于传递信息的计算机程序等均属于多媒体。计算机多媒体技术应用在我们生活中的很多地方,例如:数字化图书馆融入了多媒体技术后,使得数字化图书馆更加生动真实。

数字化技能将文件处置带入了新之域地,使人门能够用更快之速度出产文件,用更便当之样式修改图象并且文件,应用 Internet 通信把图象并且文件火速地传到四面八方。通过数字收缩,在那根本上解决了录像带资本来源长久保留之难点。未来之人门需要某一内容时候,能够通过 Internet 调出,在那 Internet 终端上阅读,自满时候,再在那终端打印机上打印出来。因特网就是在这种背景下,不知不觉地走近了我们的生活。

二、多媒体发展现状

多媒体(MULTIMEDIA),指信息表示媒体的多样化,常见的图像、声音、文字、动画,承载信息的程序等都是媒体。多媒体技术是指我们利用电脑把文字、图形、影象、动画、声音及视频等媒体信息都数位化,并将其整合在一定的交互式界面上,使电脑具有交互展示不同媒体形态的能力。多媒体技术极大的改变了人们获取信息的传统方法,符合人们在信息时代的阅读方式。多媒体技术的雏型被认为始于1984年,Apple公司首先引入了位影射bitmap的概念对图形进行处理,并使用了窗口和图形符号作为用户接口。目前多媒体技术仍不完善,等待解决的问题还很多,尤其是我国处于起步、发展阶段,需要不断拓展应用领域,探索新的应用途径,以适应信息社会发展的需要。

三、多媒体技术的特点

(一)多媒体信息表现与交互

在多媒体平台下,多种媒体并存,各种媒体在空间如何进行组织,媒体之间的相互作用如何描述和解释,在时间上怎样安排,都是多媒体在表达信息时必须考虑的问题,其交互的作用和影响在表现中是一个不可缺少的成份。

(二)音频采集技术

音频采集通常将模拟信号采样生成数字信号,经过计算机处理后再现或存储到数字介质上。VFW。技术和DirectShow技术都能实现Windows平台上多媒体信息实时采集,但DirectShow目前市场上比较流行的WDM硬件驱动模型,不仅支持比较早的VFW方式的驱动,而且解决了采集设备性能的差异以及兼容性问题与多媒体本身数据量巨大的问题,是目前音视频采集开发的首选技术。

(三)数据压缩技术

多媒体是面向数据、文本、语音、图像、三维动画等多种媒体的处理。为了得到满意的视频画面质量和听觉效果,必须对音频和视频信号实时处理。数字化后的视频和音频信号的数据量是非常巨大的,如一幅640×480mm分辨率的真彩色(24 bit/象素)视频图像,数据量为7241Mbit/ 帧,1000MB 的硬盘只能存放1000帧未经压缩的图像。

四、音视频的压缩/解压缩

无论声音的采样参量如何,原始声音的数据量都很大,原始数据量计算方法如下面公式所示。

数据量=采样频率×采样位数×声道数/8(字节/秒)

例如,采样频率位44.1KHz,采样位数为16,双声道,则数据量为181.5千字节每秒,如果我们直接把原始数据在网络中传输,将消耗较多的带宽,并且用网络状况的变化,可能导致声音传输的不平滑,不连续。因此,采样的原始数据必须压缩后才能发送。目前较多的使用开源的MP3压缩代码。

视频数据量远远大于语音,例如视频帧量化为离散的象素,每行181个象素,每幅图像151行,每个视频帧的分辨率都需要大约39KB来表示其内容。若视频帧不经过压缩以25帧/秒传送,那么原始的视频序列数据率约为7.7MbPs。视频相关的应用和推广完全依赖于理想的视频压缩技术。

五、多媒体技术的发展趋势

计算机多媒体技艺之成长前景有三个方面:多媒体技艺集成化、多媒体终真个智能化及嵌入化、Internet 化成长。

(一)计算机多媒体技艺集成化。多媒体交互技艺之成长,让多媒体技艺在那模式识别、全息图像、天然语言体会(语音识别及合成)及新之传感技艺等普遍,让用人之各种感觉通道及动作通道(如语音、钞缮、脸色、姿态、视线、动作及嗅觉等),经过数据传输及不凡之表达样式,如感知人之面部特色,合成面部动作及脸色,以并行及非切确样式及计算机系统入行交互。能够增添人机交互之天然本性及高效本性,现实逼真输出为标识之捏造实践。捏造实践是人门经过计算机对复杂数据入行可视化应用及交互之一种全新样式,及传统之人机界面并且盛行之视窗操为难照,捏造实践在那技艺思想能力上有了质之奔跑。

计算机视觉技术原理篇10

关键词:视觉识别技术;电气自动化;机器视觉系统

视觉识别技术在工业电气自动化控制中的运用由机器视觉系统实现,根据工业生产需求,应用机器视觉系统替代生产人员,在非接触的情况下完成测量,非常适用于生产环境危险性较高的钢铁工业领域。钢铁企业应从自身生产流程入手,在合适环节引进机器视觉系统,发挥视觉识别技术优势,创造更高收益。

1.视觉识别技术特点

1.1视觉识别技术的原理

视觉识别技术,是通过计算机技术模拟人的视觉,采集观察对象的信息,实现观察对象的准确识别与判断,再根据识别判断结果实施智能控制操作。机器视觉系统以光学检测原理为基础,通过相机采集观察对象的图像,将图像信息以2D或3D图像信号形式传输至图像处理系统,图像处理系统从图像的像素、亮度、颜色等因素入手,抽取观察对象的图像特征;再利用系统配置的算法与观察对象的工艺生产流程、标准参数,如检测观察对象偏移量、弯曲度,计量观察对象的个数,评估观察对象是否合格等;最后由控制系统根据视觉识别结果与传感器检测结果,发出控制指令,使生产设备表现出相应动作,完成观察对象的智能控制。

1.2视觉识别技术的优势

在工业电气自动化控制领域,基于视觉识别技术的机器视觉系统具有如下优势:①机器视觉系统可在不接触的情况下完成各项识别与检测工作,延长检测设备使用寿命,降低生产成本;②机器视觉系统的运用,可省略人为检测环节,减轻工作人员负担,规避恶劣生产环境下的安全风险,还可规避人为因素对生产的影响,提高识别与检测质量,降低人工成本;同时,设备使用寿命长;③视觉识别技术的框架固定通过计算机系统程序和算法实现自动化控制,具备移植性,可在不同生产领域推广普及;④视觉识别技术的应用可有效提升工业电气自动化控制的智能化水平,使企业获得更高的实质性收益,有助于企业高质量发展。

2.视觉识别技术在工业电气自动化控制中的运用方式

视觉识别技术在工业电气自动化控制中的运用体现在生产识别与生产检测两个领域。本文结合钢铁集团企业的生产实践,总结视觉识别技术的实践运用方式,为企业落实视觉识别技术、发挥视觉识别技术优势提供有益探索。

2.1用于生产识别领域

在生产领域,需识别控制的内容涉及生产全过程,技术人员应根据钢铁企业生产特点,分析生产识别需求,配置相关的视觉识别设备,实现智能化视觉识别,为工业电气自动化控制提供便利。在钢铁集团企业的生产准备环节,需进行原材料识别;在生产过程中,需进行设备识别;在产品生产后,需进行缺陷识别,精准控制产品生产全过程,以提高工业电气自动化控制效果。2.1.1识别原材料用量视觉识别技术可通过图像分析,统计原材料的数量,分析其是否满足生产要求,实现原材料供给环节的电气自动化控制。以钢铁集团企业生产的轧钢加热炉生产为例,该设备负责加热钢坯,将钢坯的温度提升至轧制要求,并使钢坯内部温度分布符合生产要求。在轧钢加热炉生产时,配置专用加热炉上料装置实施钢坯运输,该装置包括上料台架、挡钢钩、拨钢叉、输送辊道等构建,具体上料流程如下:控制吊车逐一吊放钢坯,要求钢坯在上料台架上排列有序;再利用步进驱动装置与加热炉上料装置的挡钢钩,逐一将钢坯转移至拨钢叉区域,要求转移频率与加热炉生产节奏保持一致;拨钢叉负责将接收的钢坯运输至输送辊道上方;最后由辊道将钢坯转移到加热炉内,实现加热处理。在传统识别工作中,通常在输送辊道两侧配置金属检测元件,检测钢坯在输送辊道上的运输状态,控制钢坯自动从输送辊道转移至加热炉内。但在输送辊道前的运输环节,均由工作人员用人眼识别钢坯的位置、分析拨钢叉的运行状态,并通过工作人员的手动操作,控制上料台架驱动装置。如果运输的钢坯温度较高,需工作人员实施挤坯操作,确保相邻钢坯间规范有序排列,避免钢坯出现变形。人工视觉识别过程枯燥,操作单一,易使工作人员产生视觉疲劳和操作疲劳,出现识别偏差或操作误差,影响生产质量。针对人工识别问题,钢铁集团企业基于视觉识

计算机视觉技术原理范文

计算机视觉技术原理篇1关键词:计算机;视觉技术;交通工程中图分类号:TP391 文献标识码:A 文章编号:1674-7712 (2014) 04-0000-01
点击下载文档
确认删除?
VIP会员服务
限时5折优惠
回到顶部