首页 体育 教育 财经 社会 娱乐 军事 国内 科技 互联网 房产 国际 女人 汽车 游戏

性能46倍于英伟达P4!阿里首款AI芯片发布:强化软硬一体化战略

2020-05-21
功能46倍于英伟达P4!阿里首款AI芯片发布:强化软硬一体化战略

7月25日,阿里巴巴旗下平头哥半导体发布了首款自研的处理器IP——玄铁910,引起了业界的极大重视。两个月之后,在9月25日的2019杭州云栖大会上,阿里巴巴旗下的达摩院又发布了首款自研的AI芯片——含光800,声称全球最强的AI推理芯片,可适用于云端和数据中心范畴。

全球最强AI芯片含光800

其实早在上一年之时,业界就风闻达摩院正在研制一款神经网络AI芯片,将运用于图画视频剖析、机器学习等AI推理核算。而跟着此次含光800的正式发布,这个风闻中的AI芯片也总算和咱们正式碰头。

在芯片的命名上,阿里一直都是以古代的名剑的称号来命名,比方之前的“玄铁”。而此次的“含光”则是上古三大神剑之一。达摩院院长张建锋表明,该剑含而不露,光而不耀,正如含光800带来的无形却微弱的算力。

据介绍,含光选用12nm制程工艺,晶体管数量高达170亿个。在业界规范的ResNet-50测验中,含光800推理功能到达78563 IPS,比现在业界最好的AI芯片功能高4倍;能效比达500 IPS/W,是第二名的3.3倍。不过在会上,张建锋并未发布这个第二名的芯片是哪款芯片。


不过从已有的ResNet-50测验数据来看,此前功能最强的是2018年Habana Labs 推出的Goya渠道,含光800的功能到达了其5倍左右,是英伟达Tesla P4功能的约46倍,而与英伟达最新的Tesla T4 GPU比较也高出了15倍。


那么含光800为何可以有如此之强的功能呢?

据介绍,含光800功能的打破得益于软硬件的协同立异。硬件层面选用自研芯片架构,经过推理加快等技能有用处理芯片功能瓶颈问题;软件层面集成了达摩院先进算法,针对CNN及视觉类算法深度优化核算、存储密度,可完结大网络模型在一颗NPU上完结核算。

当然以上是含光800依据相关测验的功能体现,那么在实践运用场景中,体现又怎么呢?




依据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需求40颗传统GPU,延时为300ms,功耗为2.8W;而假如运用含光800仅需4颗,延时降至150ms,功耗仅为1W。




也便是说,1个含光800的算力相当于10个传统的GPU,并且能耗大约只要其1/3左右。




别的一个事例便是阿里旗下的拍立淘,每天拍立淘的产品库新增10亿产品图片,假如运用传统GPU算力辨认需求1小时,而运用含光800后可缩减至5分钟。




现在含光800已流片量产,并已运用到了阿里现有的事务傍边。一起在今日依据含光800的AI云服务也已正式上线。



▲阿里巴巴达摩院院长张建锋展现含光800

张建锋表明:“在全球芯片范畴,阿里巴巴是一个新人,玄铁和含光800是平头哥的万里长征第一步,咱们还有很长的路要走。”

的确,阿里巴巴是芯片范畴的新人,还有很长的路要走,可是阿里在芯片范畴的脚步却十分的快。从2018年9月,平头哥半导体公司正式建立,2019年7月25日首个CPU IP玄铁910的正式发布,仅用了不到一年的时刻。而含光800从规划研制到成功流片,再到量产商用,仅用了不到一年半的时刻,可谓神速。

值得一提的是,在含光800发布之前,在8月29日,2019国际人工智能大会上,阿里旗下平头哥半导体行还正式发布了面向AIoT年代的一站式芯片规划渠道“无剑”,供给集芯片架构、根底软件、算法与开发工具于一体的全体处理方案,可以协助芯片规划企业将规划本钱下降50%,规划周期紧缩50%。

而跟着玄铁910、无剑SoC渠道以及含光800的发布,平头哥端云一体全栈产品系列开端成型,包含处理器IP、一站式芯片规划渠道和AI芯片,完结了芯片规划链路的全掩盖,将与阿里云事务完结软硬件一体化协同,协助阿里云客户更为简略、安稳、低本钱的取得AI算力,推进事务立异。

互联网及云服务厂商纷繁推出自研云端AI芯片

其实,除了阿里之外,咱们可以看到,近几年来,许多的互联网厂商、云服务厂商都开端纷繁推出自己的云端AI专用芯片。

早在2016年之时, 谷歌就推出了专为深度学习优化的张量处理器TPU。其时谷歌就表明,它早已在数据事务中运用TPU。而AlphaGo成功打败围棋国际冠军李世石的背面,正是得益于谷歌TPU的助力。随后在2017年,谷歌AlphaGo仅用了一颗第二代的TPU就打败了柯洁。现在谷歌的第三代TPU现已商用,算力最高可达100PFlops,是第二代的8倍多。


2018年11月底,在拉斯维加斯举行的AWS re:Invent大会上,亚马逊云也发布了其首款云端AI芯片Inferentia。亚马逊云事务CEO Andy Jassy表明Inferentia将是一款高功能、低推迟、持续性好、性价比更高的机器学习推理芯片,由亚马逊云团队规划打造,每个Inferentia芯片的核算力将会高达“数百TOPS”,多块芯片组合在一起后的核算力将会完结“数千TOPS”。估计从这款芯片将于2019年下半年推出,到时亚马逊将面向云核算客户出售运转在这些芯片上的服务。

此外,百度在2018年7月也推出了自研的云端全功能AI芯片“昆仑”。随后在10月,华为也发布了可用于云端和数据中心的两颗AI芯片:昇腾910和昇腾310。

再加上此次的阿里云推出的适用于云端和数据中心的AI芯片含光800,不难看出,现在干流的互联网及云服务巨子都开端推出了自研云端AI芯片,这现已成为了大势所趋。

AI芯片商场增势迅猛

跟着物联网技能的开展,全球联网设备数量呈现出迸发式的增加。依据据闻名商场研讨机构Gartne的猜测显现,到2020年,全球物联网设备接入量将会到达260亿,商场规划将到达3000亿美元的量级。IDC则猜测,到2025年,全球物联网设备数将到达416亿台,一年将发作79.4ZB的巨大数据量。



而依据今日云栖大会上阿里巴巴董事长兼CEO张勇发布的猜测数据显现,到2025年,全球一年的发作的数据量将高达175ZB,明显这个数据到达了IDC此前猜测的两倍。




张勇表明,数据是数字经济年代的“石油”,而算力则是数据年代的“发动机”。而要想从海量的数据傍边去挖掘出有价值的信息,把数据变成“石油”,就必定离不开强壮的算力和人工智能技能的助力,而AI芯片正是其间的要害。而依据数据猜测,到2025年AI芯片的出货量将到达29亿颗。


依据ABI Research最新调查报告显现,近年来跟着AI技能的开展,不论是关于云端AI芯片仍是关于终端AI芯片的需求都现了爆破式的增加。估计到2024年,全球云端AI芯片商场规划高达100亿美元,而终端AI芯片商场也将挨近80亿美元。尽管,或许终端AI芯片的出货量更大,可是从出售额来看,云端AI芯片商场更大。

而关于互联网及云服务厂商来说,其自身关于AI芯片的需求越大,则意味着其需求付出的本钱也将更为昂扬。

云端AI芯片开端转向ASIC

别的,在云端AI芯片商场,曩昔几年,GPU因其通用性和高功能称雄云端练习商场,在云端练习商场上占高达比90%,在云端揣度商场上占比也到达了60%。CPU则位居其次。在竞赛格式上,英伟达在数据中心GPU商场占比一度超越80%,高功能和杰出的软件生态使其成为现在最老练的AI芯片。

可是,正如芯智讯于2017年之时发布的文章《Nvidia的AI盛世危机!》傍边所写的那样,GPU并不是专为AI规划,它只是在这个时刻节点上关于AI核算比其他芯片更具优势。

尽管CPU、GPU等通用型芯片以及FPGA可以灵敏的习惯相对更多种的算法,可是专用的AI芯片的核算才能和核算功率是直接依据特定的AI算法的需求进行定制的,所以其可以完结体积小、功耗低、高可靠性、保密性强、核算功能高、核算功率高级优势。可以说,在算法已趋于安稳,且运用清晰的范畴,专用AI芯片的能效体现要远超GPU等通用型芯片以及半定制的FPGA,平等量级下,本钱也更低。

而跟着在功能、能耗、本钱上更具优势的专为AI规划的神经网络处理器的老练,专用的AI芯片将成为云端AI芯片的主力。


依据Tractica的数据也显现,2017年深度学习芯片组商场仅16亿美元,其间GPU占有了80%以上的商场,而到2025年商场规划将会猛增至663亿美元,到时专用的ASIC芯片将成为该商场的主导,占比将大幅超越GPU和CPU。

互联网及云服务厂商为何扎堆自研云端AI芯片?

人工智能技能近几年开展迅猛,许多的新的算法不断涌现,原有的算法也在持续优化。而定制型AI芯片由于其在规划之时便是针对特定算法进行固化的,所以无法做到灵敏的习惯各种算法。这也使得定制型的AI芯片一直以来并未开端在数据中心/服务器范畴大规划运用。

不过,约束跟着AI算法持续的开展,在一些特定的范畴现已开端逐步趋于老练,特别是在云端商场,这一点尤为凸出。

由于,关于互联网及云服务巨子来说,其许多范畴的需求都是十分清晰和相对固定的,比方百度或许更多的需求是针对查找的,美图更多需求是针对图画的,淘宝更多需求是针对在线购物的,付出宝更多的则是针对付出。特别是在其巨大的数据驱动下,不少范畴的软件、AI算法也现已趋于老练和安稳,在这种情况下,进一步寻求功能、能效和本钱的最优化,挑选选用定制型的AI芯片也是必定。

尽管通用型芯片适用规划广,关于厂商来说也更为简略易用,可是也造成了商场上产品的同质化,跟着商场竞赛的日趋激烈,越来越多的厂商开端寻求差异化。而选用一起的芯片则可以给自身的产品和服务带来较大的差异化。与此一起,许多新的运用和特别需求的呈现,也需求一起的芯片来满意商场需求。这也正互联网及云服务厂商自研AI芯片的动力地点。

也便是说,互联网及云服务厂商未来其所需的AI芯片将会是越来越具有差异化的,需求的是依据自身的事务需求及自己的软件算法来界说的定制型AI芯片。而传统的芯片厂商的商业逻辑则是规划出一款可以最大规划的适用于更多客户的芯片。明显这两者之间存在着较大的不合。

别的,相关于传统的芯片厂商来说,互联网及云服务厂商更为了解自身及客户的需求,自研AI芯片也能更好的满意自身及下流客户群的需求。

总结来说,现在阿里、亚马逊、百度等互联网及云服务巨子自身的事务规划和客户规划都十分的巨大,关于云端AI芯片的需求彻底可以支撑自己的AI芯片事务。并且,选用自研的AI芯片,不只可以下降芯片的收买本钱,一起在AI核算上也愈加的高效,安全性也可以更高,还可以下降用电本钱,关于大型的数据中心来说,电费也是一项很大的本钱。别的,选用自主的AI芯片也可以给自身的服务带来较大的差异化,可以更好的满意客户的需求,协助客户提高产品体会,下降本钱,提高中心竞赛力。

阿里软硬一体化战略生态完结要害一环

关于阿里这家互联网及云服务厂商来说,在物联网及人工智能年代要想持续取得成功,就必须切入几大中心范畴——体系、数据、算法、处理器、AI芯片和联接芯片。

现在,在中心的体系方面,飞天便是由阿里云自主研制的服务全球的超大规划通用核算操作体系。此外,还有服务终端的自研的YunOS体系,也已掩盖智能手机、智能穿戴、智能电视、智能轿车等许多范畴。在物联网体系方面,阿里有AliOS Things。

在数据方面,阿里自身便是互联网厂商,具有着巨大的数据资源。再加上阿里云仍是全球第二大的云服务供给商,关于海量的数据处理更是有着存储器、OS、软件和算法的全栈处理方案。

在联接芯片方面,阿里多年前就有联合厂商推出廉价的WiFi模组和蓝牙模组,此外阿里还出资了翱捷科技,并于上一年推出了超低功耗LoRa芯片。一起,上一年阿里还联合联发科推出了IoTConnect协议的蓝牙芯片。

而在处理器芯片方面的布局则落在了平头哥的肩上。

跟着上一年“中兴事情”的迸发,芯片自主可控更是成为了许多厂商重视的焦点,这也使得开源的、免费的、可扩展的RISC-V架构受到了许多芯片厂商的追捧。也正是在“中兴事情”发作之后不久,2018年4月下旬,阿里正式收买了依据RISC架构的芯片规划公司中天微。

很快,在2018年9月,被收买后的中天微与达摩院兼并建立了平头哥半导体公司。不到一年之后,2019年7月25日,平头哥建立之后的首款自研的处理器IP——玄铁910就正式发布了,声称业界最强的高功能RISC-V处理器,可以用于规划制作高功能端上芯片,运用于5G、人工智能、网络通信以及自动驾驶等范畴。


尽管平头哥公司才建立不到一年,十分的年青,可是实践上“平头哥的芯片研制团队却有着10多年的量产CPU经历”,累积出货已超7亿片。而平头哥的定位是未来AIoT芯片的根底设施供给者,主打面向各范畴的软硬整合的SoC渠道。


随后在8月29日的2019国际人工智能大会上,平头哥半导体行还正式发布了面向AIoT年代的一站式芯片规划渠道“无剑”,供给集芯片架构、根底软件、算法与开发工具于一体的全体处理方案,可以协助芯片规划企业将规划本钱下降50%,规划周期紧缩50%。

别的值得一提的是,在2016的杭州云栖大会上,阿里云还开端测验在运用服务层面之外打通不同硬件设备之间的壁垒,联合紫光展锐、联盛德、乐鑫、金雅拓、中兴微、NXP、SONY、启英泰伦、全志、士兰、中天微、晟元等芯片厂商会集发布多款YunOS on Chip云芯片,全面掩盖MCU、WiFi、BLE、GPRS、802.15、NB-IoT、GPS及斗极千寻定位等范畴的芯片。

此外,在2017年的杭州云栖大会上,阿里云还进入服务器整机产品范畴,发布了全新一代的核算类服务器产品--神龙云服务器。据介绍,神龙云服务器是一种可水平弹性弹性的高功能核算服务,官方宣称是兼具虚拟机和物理机优势的新物种,可完结强壮安稳的核算才能。而最新的音讯显现,平头哥正在研制一款新的专用SoC芯片,将用于新一代阿里云神龙服务器的中心组件MOC卡上。

在软件算法和前沿技能研讨方面,阿里还有“达摩院”,其间第一批发布的学术咨询委员会十人中有三位我国两院院士、五位美国科学院院士,研讨方向包含:量子核算、机器学习、根底算法、网络安全、视觉核算、自然语言处理、下一代人机交互、芯片技能、传感器技能、嵌入式体系等,包含机器智能、智联网、金融科技等多个工业范畴。

而此次发布的含光800也正是达摩院的研讨成果。

经过前面的介绍,咱们不难看出,现在阿里不只具有了自研的云端体系、终端体系、CPU处理器、软件算法,还有与合作伙伴一起打造的联接芯片、YoC芯片,甚至服务器整机。而跟着此次自研AI芯片含光800的发布,则补足了阿里软硬件一体化协同战略及工业链生态傍边的要害一环。

修改:芯智讯-浪客剑

热门文章

随机推荐

推荐文章