信息无障碍难题攻关——记荣耀团队开发第一款手机版离线语音转文字

2023-12-29 11:02   来源:中国聋人协会
信息无障碍难题攻关
 
记荣耀团队开发
 
第一款手机版离线语音转文字
 
语音转文字技术的发展背景
 
近年来,我国的语音转文字产品发展迅速。自2017年科大讯飞推出独家语音转文字引擎的大众版本以来,手机、平板、电脑和手表等设备相继具备了语音转文字和文字转语音的功能。各大厂商也纷纷开发出更好用的语音转文字产品。然而,一直没有解决我们在没有网络的场景下的问题,比如地下室、地铁路段、坐飞机和高铁等等。在这些无网络信号或信号状态极差的情况下,我们无法借助科技作为自己的耳朵,多次反馈这个问题,但一直没有得到解决。
 
离线语音转文字技术其实很早就有了,但主要一直用于商业方面,给有保密需要的单位使用。一套离线语音转文字设备至少要10万元,显然不是我们听障群体能够消费的。因此这个难题一直摆在我们面前,要实现全面的信息无障碍,还有很长一段路要走。
 
 
没有网络信号的交流困境
 
(小英、小华、小松、小玲都是听障人士,均为化名,场景描述来自真人真事)
 
 场景一:
 
医院CT室
 
小英做CT检查,医生看到他总是拿着手机,不耐烦地说:“别看手机了!”小英赶紧解释说,因为听不见,需要随时看手机里的语音转文字字幕。医生表示理解,让小英躺下做检查。没想到CT室是在地下,手机信号被屏蔽,语音转写文字功能失灵。小英无奈放下手机,一边使劲听着并猜测医生的指令一边感受着医生的不耐烦,紧紧张张地半天才做完检查……
 
 场景二:
 
办公楼电梯
 
要迟到了,小华飞快跑到办公楼电梯里,匆匆按下第20层电梯按钮,他上班的公司就在那里。这时,部门经理也进来了,他提示小华拿出手机打开语音转文字,然而因为电梯在飞速向上移动,根本收不到手机信号,小华只能尴尬地看着经理说话,一边拿着手机,看着空白的字幕假装点点头。经理在第18层停下来,提示小华先出来。小华摇了摇头,还是去了20层,留下经理疑惑地看着他。当电梯停在20层开门后,小华才明白经理提示的是第20层在装修,暂停用两天……
 
 场景三:
 
飞行中的航空客机上
 
小松靠在飞机舷窗旁闭目养神,到了下午茶时间,空姐推着餐车,里面有各种各样的饮料,轻声细语不知说了什么。小松急着拿出手机,这时候才想起飞机上没有信号,不能使用AI字幕,只好胡乱点点头。等空中小姐倒好一杯饮料递给她,小松发现饮料是甜的,因为她有糖尿病不能喝甜饮,她看着空姐,又不好意思推脱,只好苦笑着把饮料放在一边……
 
 场景四:
 
一次重要的会议和一个阶梯大教室
 
小玲是一名打工者,她的老板在一次会议中安排小玲做会议记录,然而由于会议内容比较敏感,被要求不能带入可联网的智能设备进场,小玲的手机也被拦在场外,没有办法看语音转文字字幕,记录会议的时候小玲手忙脚乱错误百出,被领导批评,她只好尴尬地低下头……晚上,小玲要参加继续教育,在一个大阶梯教室里,小玲发现手机网络信号时断时续,老师讲完了,然后字幕半天还没有出来,这一堂课她错过了很多课堂知识点,懊恼得直骂自己没用……
 
从上述真实场景中可以总结出听障人士在一些无网络环境下存在的交流困境主要包括以下几个方面:
 
1.在没有网络信号的场所,如地下室、电梯、飞行中的航空客机等,语音转文字功能无法正常使用,导致听力障碍人士在沟通交流时遇到困难。
 
2.网络信号不稳定会影响语音转文字的延迟,降低沟通流畅性,增加双方尴尬。
 
3. 在学校、会议等重要场合,网络被屏蔽或保密要求导致听力障碍人士无法使用语音转文字功能。
 
 
一点一点攻克难题
 
为解决这些问题,全国人大常委会委员、中国残联原副主席、中国助残志愿者协会会长吕世明呼吁多家科技公司努力解决听障人士的全场景无障碍交流难题。2023年2月,时任中国聋人协会主席杨洋与荣耀公司团队进行了友好沟通,首次奠定了离线环境下语音转文字的研发方向。荣耀ESG负责人表示,荣耀的愿景是创造属于每个人的智慧新世界。荣耀秉承着科技向善,不让任何一个人掉队的ESG理念,上上下下为此奋斗研发。3月份在荣耀Magic5系列手机发布时,荣耀团队自研的“通话字幕”功能随之上线,该功能将语音转文字的功能集成在通话界面中,并实现了端侧离线翻译,即无需Wifi或者数据网络也可以在打电话的时候实时将对方来电转成文字呈现在通话界面。该功能上线后,荣耀团队在当地残联和聋协的组织下,分别于北京、山西、河南、四川等地的听障朋友面对面交流,让听障朋友亲身体验这个功能,并听取他们的反馈意见。例如,在北京聋协信息无障碍推进委员会副主任朱轶琳组织的线下活动中,听障朋友们亲身体验了荣耀手机的此项功能后,希望荣耀可开发除通话模式外其他场景的离线翻译功能,这样可以彻底解决听障朋友在无网络情况下的沟通困难。
 




 
 
荣耀ESG负责人说,深入用户群体,解决用户真正的痛点是荣耀团队努力的方向。荣耀团队跟听障朋友们沟通中了解到这个情况后,决心彻底解决我们听障群体在无网络信号场景所遇到的问题。
 
经过几个月的技术攻克,荣耀团队终于给我们带来一个好消息:荣耀手机的“AI字幕”功能已完成优化升级,成为行业中首家真正实现在面对面交流时离线语音转文字功能的终端厂商,该功能随着最近发布的荣耀100系列手机和荣耀90GT系列手机产品同步上线!至此,听障朋友们可以彻底摆脱网络的束缚,在任何场景下都可以无忧的实现语音转文字翻译;同时,通过测试对比,荣耀手机“AI字幕”功能的字准率及翻译速度在终端厂商中处于最优水平。荣耀相关负责人还表示,这一功能后续会逐步覆盖到其他荣耀手机型号。 
 
荣耀ESG负责人还介绍说,“科技向善”是公司ESG的战略方向之一,荣耀未来还会持续深耕在信息无障碍及智慧功能等领域,让更多的人受益于荣耀的产品和服务,真正“创造属于每个人的智慧新世界”。
 

 
荣耀100系列和荣耀90GT系列手机已支持面对面对话时端侧的AI字幕功能(不需要任何网络和 WiFi),其显示界面较之前优化升级,更人性化,使用更方便。未来荣耀会持续升级及覆盖已发布的手机版本,已买其他型号的朋友敬请期待。
 
 
 
攻克信息无障碍难题的意义确实非常重大。随着《中华人民共和国无障碍环境建设法》的实施,我国的信息无障碍建设将得到进一步推动。这将促使更多的科技研发公司和团队参与到信息无障碍建设中来,为听障群体提供更多更好的语音转文字产品。
 
无缝衔接的信息无障碍环境也将为其他残障人士提供便利,促进社会包容性和公平性。因此,攻克信息无障碍难题不仅对听障群体具有重要意义,也对整个社会的发展和进步具有积极影响。我们期待着更多更好的语音转文字产品的出现,为构建一个更加包容和平等的社会做出贡献。