视频会议系统应用越来越广,新技术层出不穷,今天我们介绍的是视频会议中的新技术—“人脸跟踪”。在视频会议的进行当中,主持人有时候需要在会场中走动,或者发言人在会议过程中移动位置,我们传统的方式是通过视频会议的云台控制,用遥控对云台进行角度的调整。但这种方法是不是最好的呢?有没有一个能自动识别人脸,而云台能跟踪主持人进行转动呢?答案是肯定的,我们已经有类似的云台或者软件支持“人脸跟踪”的功能。下面我们将讨论一下“人脸跟踪”如果实现。
        人脸跟踪首先要进行人脸自动定位,人脸的自动定位是应用视觉研究领域的一个重要课题。它首先需要检测到人脸的位置和特征点,然后采用一定的控制策略控制云台运动将人脸定位到图像的中心。人脸的自动定位属于人脸跟踪的范畴,在人脸识别、人机交互、智能视频通信、监视和安全以及娱乐等领域有着广泛的应用,发展前景巨大。例如在人脸识别应用中,首先需要获得符合一定大小的正面清晰人脸;又如在视频监控应用中,需要对人的各项特征进行有针对性的监视,对于监控对象的身高、衣着等特征,可以在较模糊图像中获得,但是对人脸部分的特征,却必须要清晰的图像才能获得,因此需要对人脸做针对性的鉴别。
        人脸识别后就要进行人脸的跟踪,目标跟踪的实现算法主要有3类:帧间变化检测法、运动矢量法和偏移量法。其中帧间变化检测法主要适用于静止背景下的运动目标检测,利用相关帧间的信息恢复背景并进行运动目标的提取。运动矢量法主要用于运动背景下的运动目标的检测,一般配合卡尔曼滤波器使用。首先建立运动模型,然后根据运动模型得出目标点在图像平面上的位置、速度和加速度的相关信息,再利用卡尔曼滤波器根据这些信息预测下一帧图像中目标点的位置、速度和加速度等相关信息,最后将这些预测信息反馈给控制设备驱动摄像机运动,从而将运动目标定位在图像中心。以上2种方法主要针对运动目标的跟踪,都需要利用帧间信息,计算量偏大。而偏移量法则是首先通过图像预处理方法检测目标位置距图像中心的偏差(△x,△y),然后计算摄像机的水平调整量α和垂直调整量β,根据调整量控制摄像机运动,从而将目标定位在图像中心。偏移量法的优点是算法非常简单,缺点是精度低,可拓展性差,不利于今后进一步的研究。另外,以上几种方法在控制摄像机运动定位目标时均需要利用摄像机成像的参数,而这些参数需要标定。标定内容包括摄像机焦距、计算机图像中心坐标、像平面单位距离上的像素数等。由于摄像机存在着许多畸变,所以标定的精度直接影响算法的精度。
总结,随着视频会议和人工智能技术的发展,企事业单位的视频会议系统的人脸的自动跟踪功能必将成为一个标准配置的功能,其实际应用会更加广泛和有效。

Powered by PageAdmin CMS