发展历程
早期探索
2010年10月28日,讯飞输入法正式发布。讯飞输入法1·0版本将gmm-hmm-隐马尔可夫模型应用于语音识别系统中。2010年,科大讯飞首次将智能语音技术融入手机输入法,实现了说话秒变文字。
2011年,讯飞输入法运用bn(bottom neck)识别模型,通过神经网络提取音素特征,提升识别准确率。
2012年,讯飞输入法上线全球首个中文语音识别dnn系统,语音识别率相对提升35%,准确率提升至80%,语音识别率提升80%。2012年,新增粤语语音识别,成为首款同时支持普通话和粤语的输入法。
2013年,讯飞输入法运用sdt-dnn和基于dnn的vad模型、进一步学习离线版本,语音识别准确率提升至85%,实现离线语音识别。2013年,讯飞输入法更新搭载“interreco蓝光”语音识别引擎,语音识别率在原基础上突破性提升40%,实现了有话直说的畅快表达。第四季度,首家推出无需网络不用流量极速识别的“离线语音”。
2014年,讯飞输入法运用ub-lstm,语音识别率提高至95%。2014年,讯飞输入法“大开脑洞”开启了方言语音识别的新时代,支持四川话、河南话……陕西话等12种方言。
2015年,讯飞输入法运用无监督的speak code技术,识别声学个性化。2015年,讯飞输入法在语音输入的基础上首创了语音翻译功能“随声译”。
2016年,讯飞输入法将dfcnn应用于语音识别,语音识别准确率达97%,提升离线、噪声、远场识别率。
2017年,讯飞输入法运用cache based fast adaptation技术,融合个性化语音和语音模型,实现智适应语音识别。
稳步发展
2019年,讯飞输入法基于注意力机制的encode-deconde模型应用,实现中英文免切换语音识别。5月21日,讯飞输入法发布9·0版本,实现中英、普通话与方言以及离线与在线的语音免切换输入,与传统拼音输入相比打字效率提升300%,开启语音输入免切换时代。11月23日,科大讯飞正式发布了讯飞输入法linux版,并同步上架深度系统deepin v15和v20的应用商店。官方介绍称,讯飞输入法linux版针对linux系统特性进行了深度定制。
2020年2月,讯飞输入法上线武汉话转普通话功能。10月20日,讯飞输入法发布了10·0版本,版本搭载了“动态自适应编解码语音识别引擎”,新增的唇形辅助输入,能够提高嘈杂环境及近距离多人说话的识别效果。讯飞输入法的日语音交互次数超过10亿次,语音输入累计服务设备超过5亿台,语音用户占比超过70%。讯飞输入法动态自适应编解码语音识别引擎,多模态输入和领域个性化识别。
2021年11月3日,讯飞输入法发布11·0,版本采用前后端一体化的语音识别框架tfma,提升了复杂场景下的语音识别率,并支持多语言识别和语音翻译。同时,新版本还推出了ai助手功能,适配多场景,助力个性化表达。
2022年11月,讯飞输入法12·0版本发布,升级语音个性化方言免切换模型,采用conformer encoder音频编码和全语言专家系统,实现用户级语言个性化识别,可支持普通话与20多种方言免切换语音识别。
2023年5月,讯飞输入法首个macos版本现已发布,支持macos 10·15及以上更高系统版本,兼容arm及intel x86架构处理器,适配mac设备retina显示屏。8月15日,讯飞输入法“ai创作助手”正式开启内测。
2024年10月24日,讯飞输入法14·0发布,搭载讯飞星火端侧输入大模型、讯飞星火语音大模型,ai输入增强可以直接让输入法“猜你喜欢”。
本内容最后更新于2025年7月2日(截止时间),来源:百度百科