查看: 2372|回复: 0

手语也能有声音?谷歌AI:我可以!

[复制链接]

903

主题

951

帖子

3935

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
3935

最佳新人

发表于 2019-9-3 10:35:32 | 显示全部楼层 |阅读模式
8af7ff5bd00b48e387bb625eac9b0560.png

谷歌表示,它的人工智能技术让智能手机能够解读和“朗读”手语。

这家科技巨头还没有开发出自己的应用程序,但已经发布了算法,它希望开发者可以利用这些算法开发出自己的应用程序。

在此之前,这类软件只能在个人电脑上使用。

来自听力受损社区的活动人士对该举表示欢迎,但他们表示,这项技术可能会难以完全掌握部分对话内容。

在人工智能博客上,谷歌的两位研究工程师瓦伦丁·巴扎列夫斯基(Valentin Bazarevsky)和Fan Zhang称,这项免费公开的技术旨在成为“理解手语的基础”。它是与图像软件公司MediaPipe合作打造而成的。

“我们很期待开发者会产生什么样的点子。就我们而言,我们将继续展开我们的研究,以使得这一技术变得更加强大,进一步稳定对手语手势的跟踪,增加我们可以可靠地检测到的手势的数量。”谷歌的发言人向媒体表示。

谷歌坦言这是第一步。活动人士指出,仅仅依靠手势生成语音的应用程序,可能会忽略掉任何的面部表情或做手势的速度,而这些因素可能会影响对实际手语意思的理解。

此外,该技术不会将任何存在于局部地区的地域性因素纳入考虑。

4c460b45113744f397d8739f07366030.png

该算法可以跟踪两只手

听力损失行动(Action on Hearing Loss)的技术经理杰塞尔·维什努拉姆(Jesal Vishnuram)说道,这项计划在听到耳聋者的“声音”上是一个良好的开端,但还需要配套其它的一些功能。

他说,“站在耳聋者的角度来看,开发一种软件将文本或音频自动翻译成手语,以帮助他们的日常沟通,减少其在听觉世界中的孤独感,会更加有益。”

被遮挡的手指

过往,当这类技术试图在视频中追踪手部动作的时候,手指的弯曲和手腕的摆动会遮盖住手其他的部分,因此无法全面进行追踪。这是这类软件的早期版本的一个痛点。

而谷歌的技术则能够在手指、手掌和手背上的21个3D点位上绘制出一个图形,这样当手和手臂弯曲或两根手指接触时,就能更容易理解手势。

美国其他的大型软件供应商也开发了一些技术,来尝试在个人电脑上解读手语。去年,微软与美国国家聋人工学院展开合作,为教室配置台式电脑,然后通过实时翻译员帮助有听力障碍的学生。

关注galaxixv,官方微信公众号。
GALAXIX UE4 讨论学习群 140439020
UE4精英学习群  12762592
UNITY学习群   194092348
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


快速回复 返回顶部 返回列表