第251章 允许失败的勇气&下一款產品(2/2)
“谢谢。”
“不客气!”宋锦不爽的刻了这狗贼一眼。
“怎么,不服?”
“怎么会呢爷~”宋锦忍受著心头的屈辱,扬起一个甜美的笑脸,开男友搭在她大腿上的黑手。
像挠狗子一样,挠了挠女友的下巴,洛川押了个大大的懒腰,喊过一旁正里啪啦敲代码的瑶瑶姐,交给她一个新任务。
开发一款语音助手。
这款应用,將內置於下一代星光旗舰机。
未来的智能家居战略,也能用得上。
技术组成,大致可分为硬体层和软体层。
硬体层,需要定製麦克风阵列,並集成自研的“自適应波束成形”算法,以实现3米远拾音、
嘈杂环境降噪、区分用户与他人声音等等。
同时需自研低功耗语音唤醒算法,以免这款应用成为“电量杀手”。
就跟siri刚诞生时那样。
同时,还需跟高通合作,签订排他性协议,深度定製soc,在下一代晶片中,固化语音处理专用指令集。
如离线唤醒词监测、基础指令本地处理等等。
这一块,其实可以放在云端处理,但如果直接將指令集嵌入晶片dsp中,可以大幅提高响应速度,效果更佳。
可惜星光那边的晶片研发设计,仍处於起步阶段,这两年估计是用不上自家设计的晶片了。
其次是算法层,大致可分为四个大项。
其一,语音识別。
可採用基於隱马尔可夫模型的语音识別技术,结合高斯混合模型提升识別准確率,自研端侧轻量化语音识別模型。
这两种理论早已出现,但前世直到12年,才有“机灵鬼”,將前者应用到实际的商业语音识別產品之中。
將两者混合的模型,更是在很长一段时间內都鲜有人问津。
当然,想要实现两者相结合的混合模型的超前应用,自然也需要下一番功夫。
首先需要收集海量的语音数据,涵盖各种不同的口音、语速、语调及使用场景,用以训练模型,这对计算资源的要求极高。
巧的是,极光既有海量的用户,又有强大的云计算资源只需再开发引入自適应学习率的算法,使得模型在训练过程中,能够根据数据特点,自动调整学习速度,进而提高训练效率即可。
同时也可採集粤语、鲁省方言、东北话等方言,组成方言库,以支持语音识別。
不过这个功能倒也不急,可在后续版本选代中再加入。
反正前世直到13年,另一款主流手机语音助手,siri,才支持中文。
其二,自然语言处理。
需要构建一个语义理解模型,解析用户指令的意图,
可通过规则引擎+统计学习的混合方案。
规则层,內置500条高频场景模版,比如“导航去公司”。
统计层,可利用悠米社区和极光微博中,数以百亿条公开语料,训练朴素贝叶斯分类器,以提升意图识別准確率,处理模糊指令。
比如,用户说“太冷了”,语音助手自动查询天气,並给出关窗、添衣服等建议。
之后也可基於地理位置,同智能家居联动,
此外,还可將简单的神经网络模型引入其中,以提升模型的泛化能力,以及处理复杂指令的能力。
放在深度学习刚刚起步的今天,自然算是难如登天。
但你说巧不巧,洛川最擅长的就是深度学习宋锦同学深有体会