当前位置:百乐门 > 互联网科技 > 选场景降开支,云知声“自主造芯”的思与辨

选场景降开支,云知声“自主造芯”的思与辨

文章作者:互联网科技 上传时间:2020-02-08

2015 年是云知声的历史转折点。

半年前,云知声发布了首款面向物联网的 AI 芯片雨燕;半年后,云知声宣布了多模态 AI 芯片战略,曝光了正在研发的三款 AI 芯片:第二代物联网语音 AI 芯片雨燕 Lite、面向智慧城市的支持图像与语音计算的多模态 AI 芯片海豚,以及面向智慧出行的车规级多模态 AI 芯片雪豹。

在此之前,这家专注于物联网人工智能服务的初创企业一直以算法公司自居。但很快,团队愈发意识到算力和成本是不可化解的矛盾。当通用芯片的成本居高不下,批量生产遇到了成本瓶颈,于是云知声决定「自主造芯」。

半年前,云知声发布了首款面向物联网的 AI 芯片雨燕;半年后,云知声宣布了多模态 AI 芯片战略,曝光了正在研发的三款 AI 芯片:第二代物联网语音 AI 芯片雨燕 Lite、面向智慧城市的支持图像与语音计算的多模态 AI 芯片海豚,以及面向智慧出行的车规级多模态 AI 芯片雪豹。

从决定「造芯」的第一天起,创始团队就非常笃定,AI 芯片是成本问题的唯一解决办法,也为企业自身发展指明了一条通路。从 2015 年搭建团队,到 2017 年着重技术打磨,终于,云知声在 2018 年 5 月份宣布,其首款自研 AI 芯片「雨燕」得到成功验证,并于同年 8 月份正式量产。2019 年 4 月份,第一批搭载云知声 AI 芯片的产品将在市场流通。

从 2015 年芯片项目确立并搭建团队「正规军」,2017 年「造芯」项目进入攻坚阶段,再到 2018 年 1 月做出第一个 MPW,2018 年 5 月份做了发布首款芯片,6 月份启动量产,9 月份发布了基于雨燕的开源方案,云知声的脚步没有停歇。紧跟着,芯片设计团队从语音技术转战至图像 IP 设计。

这仅是云知声「自主造芯」的开始,若干款芯片「正在赶来的路上」。如何把握住巨大的市场,号准商业脉搏,对云知声来说既是机遇亦是挑战。在云之声 Open Day 上,云知声副总裁李霄寒分享了自己对 AI 芯片的思考和心得。

在经历了 2018 年的商业化洗礼后,国内人工智能企业愈发重视技术和产品方案的完整性和普适性。当人工智能在应用场景的加速落地,AI 芯片的价值毋庸赘言,而「多模态」一词开始被越来越多地提及。

图片 1

图片 2

(云知声副总裁李霄寒 |云知声)

商业变现更进一竿

自主造芯的底层逻辑

随着技术迭代和场景需求叠加,AI 芯片的边界发生着微妙变化。2015 年云知声决心做硬件时,专门为此在深圳设立分公司。一套完整的芯片开发过程相对漫长,期间不可避免地会涉及算法迭代,对芯片的研制速率造成影响。雨燕从设计到研发,直至最终量产,时间周期为 3 年。要保证 2015 年立项的芯片,仍适用于时下主流的算法,云知声联合创始人李霄寒并不否认这项任务的艰巨性。凭经验对算法预判之外,团队还要拿出勇气和魄力唯此一搏。

2007 年,随着移动互联网时代的开启,移动智能设备的数量呈现了指数级的增长,数字化程度明显提高。当下,用户的个人位置、信用、货币都已基本实现数字化,为人工智能的落地和发展,奠定了坚实的数据基础。

作为云知声的芯片品牌,「雨燕」是 UniOne 芯片矩阵中的初代产品,它围绕智能家居和智能音箱等场景,集成 IoT 人机交互的各项技术,云知声发布这款芯片时称赞「雨燕」是以 1/10 的价格挑战 50 倍的性能。

「而在即将进入的物联网时代,设备数量会再次大幅攀升」。李霄寒注意到,除了移动互联网所应用的传统数据之外,物联网囊括了家庭环境、位置、温度、语音、图像等数据维度。这些新数据是「弹药」,在产业界、资本界以及科研界都予以了高度重视。

「第一代 AI 芯片雨燕的架构非常典型。云知声做了两件事情:一是专门设计的具备自主知识产权的高性能 DSP,做音频数据处理,二是做面向音频的人工智能数据/神经处理器。当把这个人工处理器集成进去以后效果是显而易见的,相对于通用方案提升了 50 倍。在硬件设备方面,因为这个芯片是高度集成的,所以外围的线路使得很大的成本降低三分之一」,他说。

李霄寒认为,在物联网时代,人工智能的落地和挑战需要一个新的 SOC,这其中包含芯片、云和人工智能技术。

黄伟表示,云知声在芯片上下足了功夫,为 B 端客户提供了一套完整的解决方案。其不仅利用人工智能引擎对「雨燕」进行调优,还专门为硬件产品设计 app。客户即买即用,无需再找其他供应商,这是云知声今后芯片提供销售服务模式。

如今,云端不仅集成了很多 AI 能力,还集成了教育类、医疗类等知识,发展程度相对完备。当所有的知识与用户连接时,就需要一个载体。过去,这个载体是智能手机,但在物联网时代,这个载体可能是开关插座、音箱等智能设备。李霄寒认为,边缘 AI 芯片和服务端芯片同等重要。借助这些载体来承接云端的能力,并触达至用户,采用 AI 芯片是绝佳的解决方案,它是 AIoT 落地的核心关键。

去年 9 月,云知声推出了基于「雨燕」的解决方案,并进行开源,正式推出正对智能家居和智能音箱场景下的解决方案。截至目前,基于「雨燕」的全栈解决方案已导入的各类方案商及合作伙伴已超过 10 家,包括美的、奥克斯、海信、京东、360、中国平安、硬蛋科技等,相关产品有望在今年第一季度上市。

「我们现在处在一个非常牛的时代」,李霄寒感叹。当闻名遐迩的 AlphaGo 击败了围棋世界冠军李世石,无人不惊叹机器的强悍实力。有趣的是,早在 1997 年,深蓝击败了当时的国际象棋冠军时,有一种论调认为「国际象棋复杂度有限」,如果有一天机器能够在围棋赛场击败人类,才是人工智能时代的标志。

「在 2015 年的这个时间点,我们真心没有想过 2018 年我们会推出自研芯片,不光做出来而且还卖出去了。」黄伟透露,云知声 2018 全年数亿元的营收较上年 3 倍的增长,几乎全部仰仗于芯片的功劳和正确的商业化路径,预计在 2019 年营收再翻 2-3 倍。而看似几个亿的营业额背后,实则撬动了几十亿甚至上百个亿的产值。

近 20 年后,AlphaGo 不负众望。它采用的是谷歌自研的 TPU 架构的人工智能芯片,与同期的 CPU 和 GPU 相比,TPU 可以提供 15-30 倍的性能提升,以及 30-80 倍的效率提升。

另一场革命

「AI 芯片可以分为两类,第一类是服务端芯片,即经过大规模的数据处理进行训练并形成 AI 模型;第二类是边缘 AI 芯片,云知声主攻这方面的芯片打造」,李霄寒表示。

在 2012 年公司成立之后,同年 9 月云知声就推出了语音识别功能,专门面向端云互动。经过 6 年多发展,云知声已经拥有成面向物联网单日用量达到 5 亿次的云平台,并为平台开发了 ADPC 模式,它是云知声 AI 深度处理的核心。

云知声以往在设计传统 CPU 的时候,更在意电路的设计是否足够好、足够强劲,能否降低成本和功耗。「通用芯片要面向所有的场景,有可能运行一款游戏,也有可能运行图像处理软件,它不需要考虑不同的需求,只需要把芯片设计得足够强劲。」

2014 年初,团队把语音识别技术分别切入到「AI 生活」和「AI 服务」两个场景中。很快,算法平台化的雏形初现,创始团队很快意识到,光有能力是不够的。「算力和算法的融合,同理于技术与场景结合」,于是云知声便有了「云端芯一体化」的产品技术架构。

但边缘 AI 芯片的设计,需要考虑的因素截然不同。因为不同的场景下的芯片需求不同,譬如电视端的芯片和风扇选用的芯片肯定不一样,前者要更加强大,能够做视频的检测,后者只需要控制电机和遥控感应即可。

当云、端、芯被认作物联网产品端的三要素,云知声立即展开对 IDM 产品的开发,并于在 2015 正式量产,出货量呈规模性增长。

李霄寒总结说,云知声的特别之处在于,抛弃了传统芯片企业「先造芯再考虑卖给谁」的套路。他们认为正确的路径应该恰恰相反,先用方案解决某一个场景下的问题,验证成立后,再考虑如何生产降本。所以,先要有成熟的落地场景,清晰的需求和系统的 AI 算法,有了这三个前提之后,可以定义清楚芯片的 SPEC,然后再考虑后面的芯片的研发步骤、架构设计等问题。这是云知声做芯片的逻辑和流程。

与此同时,2015 年,云知声遭遇来自业务端的「战术端的挑战」,主要有两方面:

图片 3

第一是来自数据处理的挑战。在跟用户打交道的过程中,注定有大量新数据的导入,语音、头像、手势等数据需要处理,深度互联对算力的要求更高。追求高效就要采用基于深度神经网络的算法,这意味着云知声需要在终端提供更加充分的算力。

(李霄寒表示,打破冯?诺依曼的计算机架构已成为业内的共识 | 云知声)

另外一个约束来自成本。为解决算力问题,云知声不得不采用更好的算法,导致了成本大幅提升,这对于硬件来说十分敏感。成本之外,更强的算力还意味着更多的功耗。非插电产品的「续航焦虑」指望电池性能得到提升显然不现实。

自主造芯的矛盾与挑战

那么主要矛盾如何化解?云知声认为,基于深度学习的新硬件,即「边缘侧的人工智能芯片」势在必行,这场「自我革命」是 2015 年芯片项目的整体思路。

本文由百乐门发布于互联网科技,转载请注明出处:选场景降开支,云知声“自主造芯”的思与辨

关键词: