人工智能创新之星:唇语识别系统—慧眼小微

2019-08-12 15:49:02     来源:​中科视拓

8月9日,中国人工智能峰会暨多媒体信息识别技术竞赛成果发布会在厦门国际会议中心召开。会议发布了首届多媒体信息识别竞赛成果,31个单位35支队伍获A级证书,并评选出包括中国科学院计算技术研究所的"唇语识别系统-慧眼小微"在内的16个人工智能创新之星项目。

人工智能创新之星:唇语识别系统—慧眼小微

人工智能创新之星:唇语识别系统—慧眼小微

人工智能创新之星:唇语识别系统—慧眼小微


中国人工智能竞赛·创新之星入选名单


不走寻常路


唇语识别系统-慧眼小微,攻坚解决在高噪声环境甚至无声环境下,通过视觉信息来进行准确语音识别的问题。


众所周知,依赖语音的识别技术通常可以在近场较为安静的环境下达到较高的准确率,但在远场,尤其是伴随有噪声混响的环境下,目前的语音识别系统的识别性能都会急剧下降。而唇语识别系统-慧眼小微不走寻常路,从视觉通道出发,将计算机视觉与自然语言处理相结合,建立从视觉信息到语言信息的关联,对说话过程中面部,尤其是唇部区域的时空变化与所说话语之间的关系进行建模和分析,解析出说话内容。


在实现过程中,如何对唇部区域的时空变化进行建模是取得高准确率的关键所在。唇部区域的变化范围有限,但表达出的话语内容却可以千变万化,同时,光线、肤色、拍摄角度等因素也会影响到唇部特征的提取。唇语识别系统-慧眼小微引入多粒度的时空建模方法,从多个时空粒度对识别过程的空域变化过程与时域变化过程进行建模,分别捕捉说话过程中不同粒度的时空信息,进而实现对说话过程中多个粒度的信息捕捉,从而实现准确的唇语识别。


普惠生活


唇语识别系统-慧眼小微,对于解决噪声环境下的语音识别问题,以及智慧教育、移动支付、军事安防等领域都具有重要意义。首先唇语识别可以作为辅助技术,有效推进和扩展当下语音识别的应用范围,破解当下语音识别在噪声或远场环境下所面临的痛点,完善智能人机交互。对于听障或失语人士,能够帮助他们更好地理解和表达自己。同时,由于无需借助语音通道,因此在军事安全领域也具有较大的应用潜力。


唇语识别系统-慧眼小微已受邀在CCTV-1《机智过人》节目第二季、2018全国科技周、VALSE 2018、IEEE FG 2018、2018中科院公众开放日、中科院计算所2018"科普之夜"等诸多场合亮相,得到了从与会嘉宾到社会观众的一致好评,荣膺"CCTV-1机智过人服务先锋"称号。


中国人工智能峰会


中国人工智能峰会暨多媒体信息识别技术竞赛由中央网信办、工信部、公安部共同指导,厦门市人民政府主办的,旨在打造国内权威性和国际水准兼备的人工智能领域竞赛赛事。中央网信办副主任杨小伟、工信部副部长陈肈雄、公安部副部长林锐、福建省委常委、厦门市委书记胡昌升出席会议并致辞。中国工程院院士高文、人民网董事长叶蓁蓁等人工智能领域的专家学者从"AI行业发展趋势与前沿技术"和"AI与传统行业融合发展"展开主题演讲。来自各大科研单位、院校、企业的国内顶尖的专家学者、竞赛队伍、业界大咖,总计近2000人参与了此次峰会。


关于VIPL研究组


VIPL研究组隶属于中国科学院计算所及中科院智能信息处理重点实验室,同时也是先进人机通信技术联合实验室(JDL)的一部分。目前,VIPL研究组主要成员包括研究人员20余名、博士/硕士研究生50余名。研究组在相关领域发表研究论文500余篇,其中100余篇发表在计算机学会认定的领域A类国际期刊或会议上。研究成果获2015年度国家自然科学二等奖,2005年度国家科技进步二等奖等。


关于中科视拓


中科视拓(北京)科技有限公司是一家来自中国科学院计算技术研究所的人工智能基础设施服务商,核心团队来自国家万人计划领军人才山世光研究员和国家自然科学基金委杰出青年基金获得者陈熙霖研究员共同领导的中科院计算所智能信息处理重点实验室和中国科学院计算技术研究所视觉信息处理与学习(VIPL)研究组。中科视拓凭借在人脸识别与通用计算机视觉技术方面20多年的深厚积累,以"开源赋能共发展"的思路,打造AI视觉全栈能力—SeetaFace人脸识别与感知计算解决方案、AI算法调用平台—SeeTaaS自主可控人工智能生产平台和AI服务与计算中心—中科视拓云智中心三大产品线,致力于为政府、教育、制造、金融和零售等国民经济主战场行业提供一站式人工智能基础设施服务。

注:文章内的所有配图皆为网络转载图片,侵权即删!

我来说几句

* 获取验证码
最新评论

还没有人评论哦,抢沙发吧~

为您推荐

安世亚太与浪潮云发布新PERA.SimCloud,构建中国仿真云生态
安世亚太与浪潮云发布新PERA.SimCloud,构建中国仿真云生态
08月19日 16:47   安世亚太  浪潮  云计算  
Teledyne e2v图像传感器赋能机器视觉,让智能制造插翅腾飞
Teledyne e2v图像传感器赋能机器视觉,让智能制造插翅腾飞
08月19日 16:37   图像传感器  智能制造
​最新手机处理器性能排名及手机处理器厂商现状
​最新手机处理器性能排名及手机处理器厂商现状
08月19日 16:32   手机处理器  高通  华为
NAND Flash现货价翻扬,东芝重启产能为涨势添变数
NAND Flash现货价翻扬,东芝重启产能为涨势添变数
08月19日 15:59   东芝  NANDFlash
南京成为全国首个泛在电力物联网技术先行先试城市
南京成为全国首个泛在电力物联网技术先行先试城市
08月19日 15:51   IoT  泛在电力物联网
产量扩充!SKI将借贷8000亿韩元投建动力电池工厂
产量扩充!SKI将借贷8000亿韩元投建动力电池工厂
08月19日 15:48   SKInnovation  动力电池  电池隔膜
​微信公众号排版技巧最全面讲解及编辑器推荐
​微信公众号排版技巧最全面讲解及编辑器推荐
08月19日 15:45   ​微信  公众号  排版
​2019全球杀毒软件前十排行榜,企业版杀毒软件选哪个好?
​2019全球杀毒软件前十排行榜,企业版杀毒软件选哪个好?
08月19日 15:18   杀毒软件  360  卡巴斯基
主板和显卡的开关电源供电模块组成与工作原理
主板和显卡的开关电源供电模块组成与工作原理
08月19日 15:04   显卡  开关电源
​如何申请微信小程序?小程序申请流程步骤及注意事项
​如何申请微信小程序?小程序申请流程步骤及注意事项
08月19日 14:48   微信  小程序  申请
​智能家居的8个核心要求
​智能家居的8个核心要求
08月19日 14:44   智能家居  IoT
欧普照明6.26亿股今日解禁 市值达176亿
欧普照明6.26亿股今日解禁 市值达176亿
08月19日 14:41   欧普照明
​从五个场景,看智能家居如何“秒杀”传统家居!
​从五个场景,看智能家居如何“秒杀”传统家居!
08月19日 14:29   智能家居  传统家居
北汽新能源将采购普莱德1500套快换锂电池系统
北汽新能源将采购普莱德1500套快换锂电池系统
08月19日 14:25   北汽新能源  动力电池  普莱德
红米Redmi Note8真机曝光,搭载6400万传感器将震撼来袭
红米Redmi Note8真机曝光,搭载6400万传感器将震撼来袭
08月19日 14:14   红米  图像传感器
2020年Mini LED产能全线爆发 苹果、三星、索尼相继布局
2020年Mini LED产能全线爆发 苹果、三星、索尼相继布局
08月19日 14:00   三星  索尼  MiniLED
洲科技决定终止大亚湾LED显示屏项目募资
洲科技决定终止大亚湾LED显示屏项目募资
08月19日 13:08   洲科技  显示屏

选型百科更多>