一 图像处理技术和人眼视觉的关系
图像技术处理,image signal process,业内简称为ISP技术。在了解ISP技术之前,我们要先了解人眼的视觉感知,这是因为人类对图像信号的处理全部来源于对人眼的模仿,了解了人眼的视觉构造,就可以和图像处理部分的内容一一对应起来,更好地理解图像处理的知识。从图1可以看到人眼的构造,居于眼球璧内层的透明薄膜就是视网膜,它布满整个后部内壁,主要负责感光成像,当我们看东西时,物体的影像通过屈光系统,落在视网膜上。
图1 人眼视觉
人眼与摄像机有哪些相似之处呢?
首先,晶状体相当于摄像机的镜头透镜 (lens) ,其作用是聚集光线,在视网膜上形成图像。
另外,人眼的虹膜相当于摄像机的光圈,虹膜通过收缩和伸张来控制进入的光线,以达到人眼的亮度均衡。简单举例,当我们突然进入一个高亮的环境,开始人眼是看不清楚东西的,在适应一段时间后,事物会逐渐清晰,这个就是虹膜调整之后的结果,人眼所感知的最后的亮度其实是一致的。
视网膜是人眼核心的功能,仿照这个功能,摄像机上有与之对应的传感器 (sensor),视网膜表面分布的光接收器产生图像视觉信号。
二 图像处理中的关键技术
前面提到摄像机都是在模仿人眼的构造来成像,现在看一下摄像机的成像系统有哪些具体的构成。首先输入的图像会通过镜头传递到图像传感器上,图像传感器感知的数据会被后面接收,图像信号处理系统会对这些数据进行处理,通过一系列的算法,例如降噪、白平衡、CFA、曲线矫正、色彩矫正,从而形成人眼可以看到的正常图像。图像信号处理,也叫做ISP(Image Signal Process),其作用是模拟大脑对视网膜上的成像进行处理,产生视觉感知的图像。
低照度
视频监控领域对图像的低照度要求很高,需要在很暗的场景下看清楚物体,低照度下为了提升亮度,会起一些噪声,所以在研发过程中需要花很多精力在降噪上。目前视频监控产品实际应用的降噪技术主要是通过区分噪声和图像本身的细节,以线性或非线性滤波将噪声从图像中去除,根据噪声判决与去除所用与参考的视频信息的分布维度,降噪技术可分为空域滤波(Spatial Filter)、时域滤波(Temporal Filter)、运动自适应滤波(Motion Adaptive Filter)和运动补偿滤波(Motion Compensation Filter)等几大类。
宽动态
大家应该都有过在逆光环境下拍照的经历,有些在窗户口拍出的照片,人脸都是黑的。图像里面还有一个比较关键的技术是宽动态,也叫HDR,就是用来解决逆光下图像处理的问题。普通的相机只曝光一次,如果同时存在亮暗对比很强烈的物体,那么就要看哪部分占得比例大,就会以这个亮度来曝光。比如,室外光线很强,按照这个亮度来处理后,人脸看起来就会比较暗。
研发人员想了很多办法来扩大传感器的动态范围,目前主流的技术都在曝光强度控制方面想办法,称为多重曝光。多重曝光的思路是通过几次不同时长的曝光来获取落在合适范围内的数据。假设多重曝光技术用12bit/72db的传感器首先曝光20毫秒,此时暗处可获得足够细节但亮处会因饱和而过曝;再通过1.25毫秒曝光使亮处所得能量削弱至1/16以落到饱和门限之下,此时暗处是曝光不足的。将上述相差16倍的数据合并,即可获得共16bit即96db的动态范围——比采用12bit/72db的单次曝光提高了16倍。
发表回复