首页 > 机器人资讯 > 千万销量百亿市场,人工智能语音芯片正崛起

千万销量百亿市场,人工智能语音芯片正崛起

日期:2020-01-03   人气:  来源:库卡机器人维修  作者:admin
简介:千万销量百亿市场,人工智能语音芯片正崛起 随着智能音箱的火热以及背后语音交互生态的成熟,将会带动越来越多的设备语音化、智能化,使语音真正成为人机交互的一个界面。而在语音交互设备中,语音芯片凭借定制化、低功耗、高能效、端智能以及成本优势等地……

千万销量百亿市场,人工智能语音芯片正崛起

随着智能音箱的火热以及背后语音交互生态的成熟,将会带动越来越多的设备语音化、智能化,使语音真正成为人机交互的一个界面。而在语音交互设备中,语音芯片凭借定制化、低功耗、高能效、端智能以及成本优势等地位越发重要,成为人与云端沟通的桥梁。

在智能语音市场,随着亚马逊、谷歌等互联网巨头公司的推动,仅仅是智能音箱一个品类今年的全球销量预期有望达到3000万台,并陆续涌现在各个国家,市场呈爆发之态。作为语音芯片市场最大的玩家联发科以占据了70%的市场份额,2017年语音芯片出货量预计达到2000万片以上。

智东西通过调查梳理发现,随着语音交互的涌现,诞生了一个新的语音芯片行业,数十家公司参与其中,语音芯片的发展呈现初期通用组合芯片语音芯片涌现语音AI芯片蓄势待发的趋势。通过语音芯片发展的三阶段以及数十家芯片公司的介绍,智东西为你呈现语音芯片的崛起!

▲注以上为智东西不完全统计

综述:语音芯片发展三阶段

本文所讲的语音芯片侧重于智能语音设备兴起后,专门为语音交互场景打造的SoC芯片(芯片级系统,SystemonChip),它兼具运算力和低功耗,支持多通道麦克风阵列接口,支持信号处理算法等。

在人机对话的语音交互中,语音识别、语义理解、语音合成、任务执行等都是在云端进行。而在终端侧,语音芯片的作用是对智能语音设备拾取的多通道声音进行处理并传输到云端,并将反馈结果以语音的形式输出。如果说云端是智能语音设备的大脑,那么语音芯片就是连接人与云脑的桥梁。

目前,智能音箱的迅速发展正成为语音芯片崛起的重要动力。结合产业链各方消息,智东西此前预测智能音箱市场规模在今年年底有望达到3000万台。这意味着仅仅是智能音箱的发展,就推动语音芯片市场达到3000万量级,尽管与以亿为计算单位的手机芯片无法相提并论,但作为一个新兴品类,仍处于快速发展期。

在智能音箱这个市场中,库卡机器人,联发科、德州仪器、科胜讯、全志科技、杭州国芯、晶晨科技、成都启英泰伦等芯片厂商都推出相关的语音芯片,且又以联发科一家独大,占据智能音箱约七成市场份额,粗略计算联发科在2017年语音芯片销量将达2000万片以上。

通过对目前市面上语音芯片的观察,我们发现语音芯片有以下特点:其一兼具运算能力和低功耗的考量,采用最适合做语音处理的CPU(中央处理器);其二是具备高度整合性的语音SoC,支持多通道的麦克风阵列接口,集成Codec(多媒体数字信号编解码器)模块/DSP(数字信号处理)模块,并且集成WiFi/蓝牙模块等;其三在语音算法上支持回声消除、噪声抑制、声源定位、语音增强等技术,或具备良好的音值调节功能;其四端智能化,集成神经网络单元将部分云端训练好的智能本地化工作。

通过智东西近期对产业链的采访以及梳理,根据语音交互的发展状况,将语音芯片的发展归纳为三个阶段,第一个阶段为语音芯片过渡期,采用通用芯片组合方案;第二个阶段为崛起期,语音芯片兴起;第三个阶段为语音芯片进化期,语音AI芯片涌现。

第一阶段,大约2015年以前尽管智能语音设备,包括智能音箱、远场交互的智能电视等都已出现,但在市场尚未起量的情况下,语音设备采用的多是通用芯片+Codec芯片/DSP芯片等相结合的方式实现语音处理,如全志的R16芯片。

2015年到2017年之间,随着智能语音设备市场规模进一步发展,专门用于智能家居或智能音箱的语音芯片开始陆续亮相,包括联发科推出的MT8516芯片、科胜讯的CX20924/CX20921、Amlogic的A113、瑞芯微的RK3036/RK3229等。

此外,随着智能语音设备的迅速发展,对于端智能的需求也在显现,语音AI芯片应运而生。端智能是近两年来AI领域大火的概念之一,指的是数据的采集、计算、决策都在前端设备进行,优势在于稳定、时延小、同时能够保护用户隐私等。如杭州国芯推出的GX8010和启英泰伦推出的CI1006都属于语音AI芯片。

前期:通用芯片组合搭配

在智能语音设备的市场早期阶段,由于芯片研发漫长的周期(一般需要18~24个月),高昂的研发投入,工业机器人维修,因此在市场规模尚不大的情况下,市场并没有专门的语音芯片应用到智能语音设备中。

2010年6月微软推出的Kinect体感周边设备、2012年三星推出的远讲语音电视、2014年秋亚马逊推出的智能音箱Echo以及2015年京东&科大讯飞推出的叮咚音箱等是智能语音设备的早期代表,它们采用的多是通用芯片(AP芯片/平板芯片等)+Codec芯片/DSP芯片等组合的方式,由Codec芯片进行模拟信号的数字信号的抓换,DSP部分对数字信号进行处理,包括回声消除、噪声抑制、语音降噪/增强等,使语音便于后端的语音识别,再由通用芯片进行处理传输到云端提供语音处理的计算力支持。

以亚马逊Echo为例,2014年秋天亚马逊推出智能音箱Echo,最初使用的是TI(德州仪器)的DM3725数字媒体处理器,该芯片之前主要应用在多媒体设备、视频机顶盒、游戏终端等,在进行语音传输处理时,仍需要搭配Codec芯片。在早期的Ehco中,亚马逊使用TI的DM3725(数字媒体处理器)+TI的ADC(模数转换器)来实现。

▲德州仪器DM3725芯片

后来或许是处于成本以及其他考虑,亚马逊的一些产品开始使用联发科MT8563芯片,这款芯片同样不是语音专用芯片。直到今年Q2季度,联发科推出了MT8516才算真正意义上的语音芯片。

另外一个例子是国内早期智能音箱的代表叮咚音箱,最初国内也没有专用语音芯片,采用的是全志科技R16芯片+科胜讯Codec芯片的方式进行语音处理,而全志R16之前则是用于平板的芯片。

在语音交互场景的早期,智能设备并无太多销量,即使看到了这一潜在机会,研发一款专用芯片的时间成本、投资成本都决定了在最初一段时间,智能设备需要使用通用芯片或其他芯片作为过渡期。

中小语音芯片厂商涌现

随着智能语音设备销量不断增长,典型的就是2016年以来,以亚马逊Echo为代表的智能音箱市场规模的不断扩大,专用的语音芯片也开始出现,2016年又刚好是语音芯片兴起最集中的一年。

其实早在2013年7月国内首颗专用语音芯片就诞生了,它由四川长虹和中科院声学所付强(现为先声互联创始人)团队共同研发。新研发出的长虹语音芯片的优势是在语音识别的基础上,融合了多方面的语音增强功能,包括语音降噪、回声消除、波束形成等,支持低功耗唤醒,能够实现远场语音采集。可能因为四川长虹的一些原因,这款芯片在研发出后并没有投入生产,之后就不了了之。

2015年以后语音芯片就开始陆续兴起,包括联发科MT8516、科胜讯CX20924、晶晨半导体A113、瑞芯微RK3036、北京君正X1000等公司,如联发科推出了MT8516应用在了阿里天猫精灵上,晶晨A113应用在了小米AI音箱上。

▲阿里天猫精灵主控板上使用的联发科MT8516芯片