科大讯飞1024开发者节,首发“飞鱼OS”_科大讯飞 翻译机

“让汽车驾驶更安全,更智能,更有乐趣。”是科大讯飞设定的企业使命,而它也一直在汽车智能革命的时代之中努力的、积极的前进着......

每一台跑在路上的车都需要智能交互的设备,去年,科大讯飞把产品阵列凝聚成为三个。一是飞鱼智能语音套件系统,也就是语音助理;二是飞鱼智能车机系统,据称,现在已经在六个车厂,近十款车型上量产了;三便是人们较为熟知的小飞鱼。而随着如今智能网联汽车的发展之快,各汽车厂商都希望能在激烈的市场竞争中脱颖而出,对于车机系统的选择自然也要具有一定的个性,以寻求差异化。

近日,科大讯飞在其大本营合肥举办了科大讯飞1024开发者节,在10月25日上午的“AI+车载分论坛”上,科大讯飞面向行业正式发布了一款软硬分离的“飞鱼OS”车机系统,它是基于科大讯飞iflyos在汽车之上构建完整的应用为核心标准,充分的实现技术领先,生态开放和架构灵活。

飞鱼OS:通过双层级+多生态实现软硬分离。

“我们通过双层级+多生态的模式,建立起飞鱼OS软硬分离的能力,为了更好的满足不同客户的需求,我们专门拆分了两个层级,LITE版和PLUS版。并且通过飞鱼OS可以快速实现集成和对接。“科大讯飞智能汽车事业部汪华峰向我们介绍时说到,“PLUS版比lite版更深度定制系统的fRamework层,甚至一些hal,kernel层的部分模块。”。

不过仅仅将软硬分离的外界对接工作做好还不够,科大讯飞考虑到每一家车厂的车联网服务能力差异较大,通过对后台能力的兼容和拓展,能为车厂定制兼容更大的多生态集合,从而保证用户在手机上常用服务和能力能够很好的使用。

科大讯飞智能汽车事业部总经理刘俊峰先生介绍了在最终的用户体验效果上,科大讯飞主要做的如下3点提升。

一是全闭环的汽车智能语音交互核心技术,包含语音合成、声源定位、窄带波束、声纹识别、智能打断、语音唤醒、语音识别、自然语言理解、听歌识曲。整体组合核心技术,为用户带来更好的效果体验。

二是多音区方案,随着车内更大空间的趋势,满足车内更多人的智能体验需求,科大讯飞实现了车内的多音区方案,以保障能够支持后排乘客更好的使用智能语音。同时更好的声音品质也是配合最终效果的一个非常重要的维度,因而,科大讯飞启动了娱乐系统主机音效升级技术探索。

三是从能听会说到察言观色,除了从声音维度的优化提升外,科大讯飞开放了车内车外的视觉感知能力,从而让驾驶更安全,爱车更懂你。从技术角度看,科大讯飞增强了汽车听、说、看三个维度的能力,听的部分在声纹识别和降噪模块的基础上增加了多音区能力;说的部分,在技能平台、AIUI的基础上,增加了XTTS和音效;看的部分,在360的基础上,科大讯飞增加了人脸识别和疲劳识别能力。

飞鱼OS智能架构开放三个部分。

汪华锋还在论坛现场正式宣布科大讯飞面对全行业重磅发布 “悦听计划”,让每一句反馈、音符都倾心悦耳。”这个计划将通过合成发音人、音效等技术,为整车提供更倾心悦耳的声音。科大讯飞也期待有兴趣的合作伙伴一起加入。这就是飞鱼OS智能开放架构。”。

飞鱼OS智能开放架构主要分3个部分:汽车AI技能开放平台、硬件开放和运营组件开放

汽车AI技能开放平台。

科大讯飞目前在汽车上已经上线的有47项,主要包括7大类场景的技能。汪华锋表示:“未来,我们希望更多的细分场景由我们的开发者进来合作,在这个平台上完善更多的汽车优秀技能。”为了给开发者提供更好的支撑,汽车AI技能定制平台可以支撑开发者或客户的技能1s上线,实时生效。最重要的是,这个平台可以帮助客户或开发者能有效的收集用户数据并且通过智能化分析,优化和不断打磨自己设计的技能,从而为用户提供更好的技能服务。

硬件开放平台。

通过硬件平台的开放,接入车机硬件、座舱硬件、后装设备,第三方智能驾驶、辅助驾驶接口,客户和合作伙伴可以快速集成和使用。通过平台的整合,让合作伙伴能更轻松的实现智能互联和最优秀的人机交互解决方案。

运营组件开放平台。

过去很多科大讯飞的合作伙伴已经建立了非常好的合作模式,合作伙伴很多都开放了API,车载系统也早已实现了去APP化,为了更多合作伙伴的诉求,讯飞还开发了场景模型和各种生态接入接口,为合作伙伴提供相关运营组件通道,让服务智能找人、直达用户

人机交互系统未来发展方向。

而关于科大讯飞的人机交互系统未来发展方向方面,科大讯飞智能汽车事业部产品总监汪华峰说到如下三点。

一是多模态交互:就是将多种传感器,比如麦克风、触摸屏、摄像头等技术,融合人工智能识别和理解技术,实现的多场景呈现和交互的能力。在多场景下,采用多种交互方式融合,从而给用户提供更加接近人类的沟通方式,比如我们本次增加的疲劳识别、人脸识别等能力就是为了让多模态交互做到更好的。

二是多乘客交互:多乘客交互科大讯飞在行业里首次提出并开创,目前第一步已经在蔚来汽车ES8上实现落地,首个场景是当我们后排的乘客说“打开车窗”,这时候在这位乘客的一侧的窗户会被打开,但不会影响其他人的车厂。该能力从技术上是基于整车多乘客需求,2或4麦空间定位技术,即使同时说出指令,也互不影响,为每位乘客量身定制专属服务。

三是情感化交互科大讯飞希望能够让每一个人都有一个自己的AI.虚拟个人助理,人机交互一定会往类人的多情感方向发展,所以科大讯飞依托人工智能技术,用情感化设计语言和拟人化设计打造的具有更加懂我能力的个人虚拟助理。ES8上的nomi就采用了科大讯飞智能汽车业务的人工智能技术打造出来的。

汽车具备情感、个性化,从而使人车交互更加方便,是智能语音、人工智能技术与汽车业结合的终极目标,也是科大讯飞一直探寻的方向。

目前科大讯飞已与大众、日产、丰田、马自达、雷克萨斯、长安、上汽、一汽、北汽、长城、吉利、奇瑞、江淮、广汽等国内外汽车厂商开展了广泛的合作,并已取得良好的阶段性成果,语音交互正以无可比拟的势能助推车联网裂变式发展,未来汽车将拥有能听会说,能理解会思考的“大脑”, 从而提升用户智能化行车体验。

0 次访问