(图源康奈尔大学)
如果你在商务会议或安静的图书馆中,不太可能大声说出“Siri,检查电子邮件”这样的指令。因此,研发人员设计了一款名为Speechin的项链,它可以识别无声指令。
该装置由康奈尔大学的研究员开发,它建立在去年推出的NeckFace项链的基础上,后者可以监测佩戴者的面部表情。
除了微处理器、电池和蓝牙模块,Speechin还配备了一个朝上的红外摄像头,可以对佩戴者的下巴进行成像。它通过一组延伸到两侧的“翅膀”保持住方向。为了解决隐私问题,它不会直接指向用户的脸。
利用基于机器学习的算法,该设备能够根据佩戴者的下巴运动来确定佩戴者在无声地说出哪些命令。然后它可以将这些命令中继到配对的智能手机。
该系统最初通过监测20名志愿者的下巴运动进行训练。研究员让志愿者默默地说出已知的单词和短语——其中10人说英语,另外10人说普通话。在随后的测试中,参与者说出了54个常用的英语命令以及44个普通话单词和短语。
事实证明,这条项链在识别英语和普通话语音方面的准确率分别为90.5%和91.6%。当志愿者在行走时使用该设备时,这些数字会跟着下降。
研究员希望进一步发展该技术,让其不仅可以用于安静的环境,还可以用于智能手机无法听到用户声音的嘈杂环境。此外,Speechin项链也可以供缺乏语言能力的人使用。
该研究论文题为"SpeeChin: A Smart Necklace for Silent Speech Recognition",已发表在Proceedings of the Association of Computing Machinery on Interactive, Mobile, Wearable and Ubiquitous Technologies期刊上。
前瞻经济学人APP资讯组
论文原文:https://dl.acm.org/doi/abs/10.1145/3494987
品牌、内容合作请点这里:寻求合作 ››
想看更多前瞻的文章?扫描右侧二维码,还可以获得以下福利:
下载APP
关注微信号
扫一扫下载APP
与资深行业研究员/经济学家互动交流让您成为更懂趋势的人
违法和不良信息举报电话:400-068-7188 举报邮箱:service@qianzhan.com 在线反馈/投诉 中国互联网联合辟谣平台
Copyright © 1998-2025 深圳前瞻资讯股份有限公司 All rights reserved. 粤ICP备11021828号-2 增值电信业务经营许可证:粤B2-20130734