栏目导航
最近推荐
热点信息

腾讯俞栋:定义下一代智能人机交互 从目标、挑战到实现路径_科技


发布日期:2019-11-02 00:48   来源:未知   阅读:

语音识别及深度学习领域专家、腾讯 AI Lab 副主任及西雅图实验室负责人俞栋博士,在 2018 年腾讯全球合作伙伴大会上展示了腾讯 AI 正在推进的跨领域前沿研究:下一代的多模态智能人机交互。以下是有补充的演讲全文,介绍了人机交互的历史与目标、下一代智能人机交 互的优势与挑战,及腾讯 AI 的解决方案。

多模态智能人机交互是指使用人工智能技术,通过多种模态的信号(比如语音、文本、动作、表情等)实现人与机器的交互,其最终目标是使人机交互与人人交互一样便捷和自然。

人机交互的历史和目标

人机交互的未来,就是多模态智能人机交互

在计算机的发展历史上,随着技术的进步,发生过几次大的交互模式的演进。最近的两次大家比较熟悉的转变是从以鼠标 / 键盘为主的交互模式转换为以触摸和语音为主的交互模式。

幸运的是,随着近些年来人工智能技术的发展,机器感知世界的能力也突飞猛进,计算机与人类的交互方式也正变得越来越自然,学习成本也越来越低。现在,虽然还远不够完美,但计算机已经能在一定程度上听懂人类的话语、预测人类的意图以及理解人脸的表情了。在这些研究和工程进展的基础上,研究者和开发者正基于 " 以人为中心 " 的原则探索未来的人机交互方式??多模态智能人机交互。

人类创造计算机的最早目的是帮助自己处理一些繁琐的计算任务,比如弹道计算;那时候,只有经过训练的专业人员才有能力向计算机输入信息和阅读计算机输出的结果。随着硬件和软件技术的发展,计算机的速度越来越快,功能也愈渐强大,人与计算机的交互方式也越来越多样化,并日益向对人类而言更自然更便捷的 " 以人为中心 " 的方向发展。实际上,在计算机的发展历史上已发生过几次显著的交互范式演进。

很长时间以来,计算机都只能在人们经过特定的训练之后才能使用,比如学习各种控制命令、理解各种图标的含义、熟悉各种程序的交互逻辑、练习使用键盘和鼠标等。对某些没有能力或没有意愿学习这些交互方式的人(比如盲人或年迈的老人),计算机将很难成为他们生活的一部分。

六统天下开奖记录平台  |   百分百高手论坛欢迎您  |   香港期期准一肖  |   今期玄机图  |   2019年黄大仙图库资料大全  |  


Power by DedeCms