首页
产品中心
新闻中心
国产化适配
成功案例
购买及租用
下载中心
关于我们
行业动态
行业动态
视频会议应用动态
视频会议技术动态
视频会议新闻动态
视频会议市场动态
视频会议运营模式
视频会议编码技术
移动视频会议动态
视频会议云服务动态
联系方式
more
南宁汇研科技有限公司
电 话:
0771-5523920
传 真:
0771-4967725
销售1:
销售2:
销售3:
销售4:
文章搜索
more
当前位置:
首页
>
行业动态
>
行业动态
视频会议技术动态
语音识别技术应用于视频会议系统
发布时间:2013/1/31 12:07:37 浏览量:6814 【字体:
大
中
小
】
随着社会各行各业信息化应用的不断深入,
视频会议
系统作为一个能提供统一的、及时的信息、逼真的音频和视频效果以及降低会议和差旅费用的应用系统,可以为合作伙伴、供应商和客户各方提供高效率的协作能力,促进用户之间面对面的接触并加深理解。
视频
会议
系统的应用帮助很多企事业单位解决了远距离
会议
沟通障碍的问题,提高单位的工作效率和客户的满意度。越来越多的企事业单位青睐于视频
会议
系统的选择。视频通信的用途非常广泛,对于用户而言,始终不变的是它为业务运营增添的价值。
随着
视频会议
系统的不断普及,用户对系统的交互性的要求越来越高,如果用户无法与视频会议系统中的软硬件设备进行流畅的交互,则会一定程度上降低用户的体验感与真实性。
语音识别技术在视频会议系统中的应用功能主要包括:控制和转录。
第一:语音控制功能:传统的视频会议系统在使用的过程中,一般需要一个主席用户登录,然后以主席身份对会议软件的相关操作进行人工操作,例如调整麦克风输出音量,画面切换,是否允许对方发言,文档共享操作等等。通常情况下,作为会议中的主要发言人,是无法做到一边发言一边操作视频会议软件的,视频会议软件操作者与发言者不是同一个人,就会存在双方对会议进程控制的理解不能做到协调统一,使会议经常产生中断,会议不能流畅进行下去,极大的影响用户的体验感。
解决的方法就是利用麦克风结合语音识别技术来获取发言者的语音命令,用户只需说出命令即可进行相关的命令操作,大大简化用户的操作,例如:用户可以用语音控制进行“播放
PPT
”,“允许
XX
用户发言”,“切换
XX
分会场视频”,“视频全屏”,“屏幕共享”,“退出会议”等。
第二:语音转录功能:在一般的会议中,与会者的发言包括按照发言稿和即兴发言,预先准备好的发言稿可以在会议召开之前保存在电子文档中,以便留档。但是即兴发言的内容则是随机的,不可预知的,这样就存在记录会议内容的问题了,手工记录,浪费人力,记录速度慢,而且可能会存在漏记误记的情况。
当视频会议系统运用语言识别技术后,录音程序可以把会议过程中用户的发言报告通过音频设备进行收集,然后传输到内置语音识别转录模块,语音识别引擎来转录成文字材料,同时自动做成字幕在
视频会议
屏幕上显示出来,为听觉有障碍的用户提供方便,并保存成相关的电子文档,以便日后查阅。
当前语音识别技术的基本原理:语音识别系统构建过程整体上包括两大部分:训练和识别。训练通常是离线完成的,对预先收集好的海量语音、语言数据库进行信号处理和知识挖掘,获取语音识别系统所需要的
“
声学模型
”
和
“
语言模型
”
;而识别过程通常是在线完成的,对用户实时的语音进行自动识别。识别过程通常又可以分为
“
前端
”
和
“
后端
”
两大模块:
“
前端
”
模块主要的作用是进行端点检测(去除多余的静音和非说话声)、降噪、特征提取等;
“
后端
”
模块的作用是利用训练好的
“
声学模型
”
和
“
语言模型
”
对用户说话的特征向量进行统计模式识别(又称
“
解码
”
),得到其包含的文字信息,此外,后端模块还存在一个
“
自适应
”
的反馈模块,可以对用户的语音进行自学习,从而对
“
声学模型
”
和
“
语音模型
”
进行必要的
“
校正
”
,进一步提高识别的准确率。
语音识别系统的性能受许多因素的影响,包括不同的说话人、说话方式、环境噪音、传输信道等等。提高系统鲁棒性,是要提高系统克服这些因素影响的能力,使系统在不同的应用环境、条件下性能稳定;自适应的目的,是根据不同的影响来源,自动地、有针对性地对系统进行调整,在使用中逐步提高性能。
在语音识别技术研究方面一直颇为领先的国际商业机器公司
(IBM)
已经开始着手进行研究,计划研制一种软件能监听四到五个人参加的小型会议,然后提供准确的书面记录。与其他视频会议系统提供商相比,
IBM
的计划已经是非常超前了,负责
IBM
的语音识别技术开发的戴维
•
那哈莫
(David Nahamoo)
表示,该公司已经开发出了一些相关的配套应用软件。其中一项是能自动翻译外语广播,如阿拉伯语广播。该软件首先通过语音识别技术记录下说话者所说的话,然后通过翻译软件把外语翻译成英语。
相信随着语音识别技术的不断发展,语音识别技术与视频会议系统完美的结合,将会使视频会议系统向着更加方便,更加先进,更加智能化的方向发展。将来可以识别不同的语种、口音、语言背景、方言和语音模式的视频会议系统将会使来自不同国家、不同民族、不同语言的用户自然无障碍的流畅的面对面的交流,拉近彼此之间的关系。
标签: