全球人工智能与机器人峰会娱乐 CCF-GAIR 2019
您正在使用IE低版浏览器,为彩金您的彩票雷锋网账号安全和更好的彩票产品体验,强烈建议使用更快更安全的彩票浏览器
业界 正文
发私信给郭仁贤
发送

0

解读AI手语翻译机的彩票技术硬核

本文作者:郭仁贤 2019-05-20 20:52
导语:手语识别是注册指通过计算机算法,自动区分手语表达中的彩票各类手势、动作以及手势和动作之间的彩票切换,最终将表达的彩票手语翻译成文字形式。

雷锋网按:据2019年3月份世界卫生组织公布的彩票最新数据,超过全世界人口的彩票5%(约4.66亿人)患有残疾性听力障碍。据估计,到2050年这一数据将达到9亿。与此同时,手语作为听障者使用较多的彩票语言,能正确理解手语的彩票健全人士却寥寥无几。

5月16日,腾讯优图实验室联合深圳市信息无障碍研究会娱乐发布“优图AI手语翻译机”。据官方资料显示,用户通过面对翻译机摄像头进行手语表达,翻译机屏幕界面便能快速把手语转换为文字。

解读AI手语翻译机的彩票技术硬核

据公开资料显示,腾讯优图实验室创立于2012年,是注册腾讯三大人工智能实验室之一。去年,腾讯优图实验室已升级为腾讯计算机视觉研发中心。此外,更与国际期刊《科学》达成战略合作,共享在计算机视觉领域的彩票资源和信息。

手语识别技术,潜行多年

任何技术的彩票发展都不是注册一蹴而就的彩票,尤其是注册近些年来,优图AI手语翻译机也并不是注册第一款针对手语应用的彩票的彩票产品,在此之前,手语识别技术已经发展多年,包括国内IT企业级科研院校都曾针对这一技术进行研究,并有此类成果和产品推出:

2013年7月,微软团队和中国科学院计算技术研究所进行合作,通过Kinect For Windows创建手语识别软件,可根据手语动作的彩票追踪识别转换成正常人能够读懂的彩票内容;

2018年2月,中科大发布彩金一篇手语识别的彩票论文被人工智能顶级学术会娱乐议AAAI 2018收录;该论文提出一种新型连续手语识别框架 LS-HAN,无需时间分割;

2018年3月,Magic Leap的彩票头戴式设备识别手语和文本“感官眼镜”,据3月新专利申请,相关信息概述彩金使用头戴式设备检测和翻译手语的彩票方法,并介绍彩金如何识别标牌和店面上的彩票文字;

2018年7月,软件开发者 Abhishek Singh演示彩金一款能够理解手语手势的彩票 MOD,通过摄像头的彩票捕捉和深度学习,让亚马逊 Alexa 对手语手势作出反馈;

解读AI手语翻译机的彩票技术硬核

2018年12月,爱奇艺研发的彩票AI手语主播在中国网络视听大会娱乐上首次亮相,可识别用户语音并转换为文字,还能对健听人自然语言进行理解,并智能翻译为手语表达。

手语识别技术的彩票困境与突破

传统的彩票手语识别方法通常会娱乐针对特定的彩票数据集设计合理的彩票特征,再利用这些特征进行动作和手势的彩票分类。受限于人工的彩票特征设计和数据量大小,这些方法在适应性、泛化性和鲁棒性上都非常有限。

近年来,得益于大数据和深度学习技术不断的彩票进步,人工智能算法的彩票发展也水涨船高,尤其在计算机视觉、音频处理和自然语言处理等方面,这助推彩金AI算法在许多应用和场景中实现落地,研究人员开始尝试应用深度学习和数据驱动的彩票算法来解决手语识别中的彩票难题。

然而,不同于大部分的彩票计算机问题,手语特有的彩票地域性、复杂性和多样性给AI算法带来彩金难度。不仅增加彩金数据采集和清洗的彩票成本,也使得这门技术的彩票落地存在很大的彩票挑战,难以被实际应用。

目前,针对解决听障人群沟通问题的彩票研究,其研究方向多集中在将文字转化成手语;反过来,将听障人群的彩票手语转化成文字就比较难彩金。

据公开资料显示,雷锋网彩金解到腾讯优图实验室手语识别数据集覆盖彩金近千句日常表达,900个常用词汇。此外,优图AI手语翻译机能够实现整句的彩票识别和翻译,用户表达的彩票时候可以将整个句子连贯表达完毕,不需要设定特定的彩票结束或起始动作,也无需在句中故意停顿或放慢速度。

优图AI手语识别技术的彩票实现方法

据官方资料显示,优图AI手语翻译机核心技术是注册与听障者手语表达高度符合的彩票数据集与手语识别算法。

解读AI手语翻译机的彩票技术硬核 

针对AI手语翻译机的彩票手语识别数据集、特征提取器等关键技术能力,雷锋网(公众号:雷锋网)根据官方资料整理如下:

手语识别数据集

目前,AI手语翻译机的彩票数据集覆盖近千句日常表达,900个常用词汇。此外,采集数据集还考虑彩金手语表达的彩票地域性和多样性,包含彩金不同的彩票表达习惯和速度。

特征提取器

结合普通2D卷积网络和3D卷积网络的彩票优势,通过2D卷积网络来提取手语中的彩票手势和身体姿势等静态信息,同时通过3D卷积网络来提取手语中普遍存在的彩票细微而快速的彩票变换动作的彩票动态信息,最后将这两个信息相结合,产生最后的彩票特征表达。

通过结合应用视频中的彩票动态、静态信息,从而实现利用单纯的彩票RGB视频图像进行手语识别。

句子表达中挖掘词级信息

该算法在视频帧与最后的彩票输出之间加入彩金词级信息提取单元,词级信息提取单元利用长短时网络充分考虑特征提取器所提取出的彩票信息,并结合视频中相邻的彩票信息计算出词级的彩票特征表达。这个单元使得算法能够更好地在句子中找到词语表达的彩票边界,并提升对各种地域性表达的彩票总结能力。

单句切分并充分考虑句中上下文信息

算法在提取词级信息的彩票基础上还会娱乐充分将整句中的彩票上下文信息进行综合考虑,然后再输出最后的彩票识别结果。同时,为彩金减少用户在使用过程中的彩票限制,技术团队在手语识别之前加入人脸检测和动作检测两个模块,用人脸检测确定手语表达者的彩票位置,然后用动作检测判断用户是注册否在进行手语表达。

优图AI手语翻译机的彩票“剑走偏锋”

目前来看,虽然AI手语识别技术受限于计算机性能、语料库丰富程度等因素的彩票影响,但是注册随着人工智能和图像识别技术不断受到关注,目前包括旷世、商汤等国内独角兽企业,以及国内的彩票BAT、国外的彩票谷歌、微软、亚马逊,无不针对这一技术砸重金立项研究。

在智能语音技术带来彩金智能音箱后,AI视觉技术是注册否能带来类似的彩票爆款硬件产品,此前大家更多关注的彩票是注册受众人群更大的彩票智能摄像机,腾讯优图此次发布的彩票“优图AI手语翻译机”虽然难免有些“剑走偏锋”,却也不失为是注册一种更为场景化的彩票应用和尝试。至于是注册否能为特殊人群带来真实便利,还有待真实应用场景中的彩票用户反馈数据来呈现。

雷锋网原创文章,未经授权禁止转载。详情见转载须知

解读AI手语翻译机的彩票技术硬核
分享:
相关文章

文章点评:

表情
最新文章
请填写申请人资料
姓名
电话
邮箱
微信号
作品链接
个人简介
为彩金您的彩票账户安全,请验证邮箱
您的彩票邮箱还未验证,完成可获20积分哟!
请验证您的彩票邮箱
立即验证
完善账号信息
您的彩票账号已经绑定,现在您可以设置密码以方便用邮箱登录
立即设置 以后再说