? 地平线余凯:自动驾驶处理器的“三国时代”| 清华人工智能研习社 - 天津时时彩软件_天津时时彩多久开一次_天津时时彩规律大全
首页 > 新闻 > 商界精英 > 正文

地平线余凯:自动驾驶处理器的“三国时代”| 清华人工智能研习社

本文地址:http://www.foodyi.com/2017/1114/338011.shtml
文章摘要:地平线余凯:自动驾驶处理器的“三国时代”| 清华人工智能研习社,各种颜色乖僻邪谬傲世轻物,自动气象主刑西沟。

“讲创业是我最不会讲的。”

昨天,匆匆从机场赶到清华的地平线创始人余凯,用这样一句话为其在清华x-lab人工智能研习社的讲座开场。

这位曾经在百度开创了深度学习研究院(IDL),又进一步开拓了中国最引人注目的自动驾驶创业公司“地平线”的连续创业者略带抱歉的称,自己不擅长讲述商业模式、创业感悟、经历。自喻为“技术人”,余凯在清华的这次讲座更多的偏向技术内容,而在清华,这显然比“创业故事”更令现场听众振奋。

图:11月9日,地平线创始人&CEO余凯在清华做了题为《自动驾驶处理器:边缘计算的革命》的讲座。 刘涵 摄

除了技术上的共鸣,在清华这场讲座中,余凯还非常贴心的提出了“五道口计划”:“在美国有曼哈顿计划,中国有“五道口计划”,五道口路口非常复杂,有行人,有车,还有火车。所以什么时候自动驾驶的车能够穿越五道口的话,我觉得这个事就搞成了。“

余凯非常看好自动驾驶AI核心处理器的市场,“我希望把我自己后面20年的时间,花在一件事情上,这个事就是给自动驾驶去打造人工智能核心处理器。“余凯把今天智能芯片战场比做“三国”:“英特尔更像是曹操,因为它是自动驾驶计算领域里面真正的实力之王;Mobileye更像是刘备,虽然是皇亲国戚,但实力却是最弱的;NVIDIA像孙权,占据了GPU的宝地,实力虽然不如英特尔,但也算是可圈可点。”

大数据文摘将余凯本次讲座内容和现场问答内容整理如下,在不改变原意的前提下有删改:

感谢邀请,今天有机会到这边来跟大家交流一下,其实一开始的时候不知道讲什么,因为如果我要讲的话,讲着讲着只能讲技术,讲创业是我最不会讲的,所以关于商业模式、创业感悟、经历都不是属于我擅长的,所以今天如果讲的不是那么带劲儿的话给大家提前抱个歉。

我希望把我未来20年的时间,花在给自动驾驶打造人工智能核心处理器这一件事情上;我希望在2030年的时候,90%以上的汽车都是四级自动驾驶;我希望那个时候所有的车上都是我们做的人工智能处理器。

对于自动驾驶,这个事情本身是属于硬科技。另一方面是不是真正的用技术驱动这件事情。那么,什么是硬科技呢?硬科技是真正定义一个国家、科技工业实力的技术。比如今天如果处在战争状态,我们不会认为微信断了是个问题,但是如果飞机飞不起来、汽车跑不动、指挥系统不能运转就是一个问题了。所以华为就是一个硬科技,有了华为国家指挥系统就会完全靠自主的设备去运行了。

我们希望打造三个核心竞争力。首先是软件算法,从感知、建图、定位到决策,本质上来说是软件算法、人工智能的问题,我们希望软件算法未来可以实现高效处理、高性能、低消耗。除此以外还有芯片、云端和地图的构建。

自动驾驶处理器的“三国时代”

人工智能芯片的主要玩家有两大阵营,英特尔、Mobileye、Nvidia,这有点像自动驾驶处理器的“三国时代”。英特尔更像是曹操,因为它是自动驾驶计算领域里面真正的实力之王,不仅仅有强大的CPU计算,还有自己独门的5G专利,收购了德国公司、有FPGA,甚至还是整个摩尔定律的推动者;Mobileye更像是刘备,虽然是皇亲国戚,但实力却是最弱的,Mobileye从出生的第一天就奔着自动驾驶去了,一直为汽车做人工智能的处理器。NVIDIA像孙权,占据了GPU的宝地,实力虽然不如英特尔,但也算是可圈可点。

实际上人工智能处理器在以前只是一个硬件的事情,但最近开始出现了一些野蛮人,一些公司的核心本来是软件背景,但却不务正业做人工智能处理器,比如Google就去做了TPU。而地平线的人以前在百度等互联网公司做的是纯软件,现在也冲进来做了人工智能的处理器,但人工智能处理器的本质并不是一个硬件的事,它是一个软硬结合的事情,是一个由场景驱动人工智能应用的软硬件技术革命。

而在具体的芯片设计里面,包括脉动阵列、3D堆叠都在计算机体系架构和处理器智能设计百宝箱里出现过,而像Nvidia这样大规模的并列运算也有。在今天这个事情开始变得非常性感的本质原因是人工智能的时代到来了,场景的应用驱动使得这些硬件被拿了出来,组合成了软件、硬件这种自动计算平台与解决方案。

AI大背景下计算的趋势是什么?

趋势一:新摩尔定律

回顾一下正在发生的这些趋势,我们会发现这是一个大的背景,而促使我们想要去做这些事情的趋势是什么呢?第一个趋势是新摩尔定律,在过去的半个多世纪的时间里,摩尔定律的发展是支撑了整个信息产业背后发展的主要驱动力,这使得很多了不起的事情发生了变化。而我们现在处于的一个位置,是从去年开始摩尔定律开始比较缓慢的发展,核心的原因是物理极限已经逼近,接下来需要一个新的摩尔定律,一个核心的发展趋势是从过去的逻辑计算往未来的人工智能计算发展,人工智能计算的发展并不是工艺的改变,而是体系架构与软件的配合,使得它实际的计算效率不断提升,从一定意义上来讲,在往专用计算的方向发展。

举个例子,生物体的大脑一开始只是单细胞生命,大脑顶多是一个细胞,而到现在人类的大脑发展到了1000亿的神经元。这个规模在不断变大的过程中国还产生了另外一个分工的细化,产生了视觉神经、听觉神经,前几年有一个诺贝尔医学奖发现大脑中有一个专门的地方是GPS定位系统。我们需要专门发展这个事情,针对这个问题不断的去提升,与人类社会一样,去衡量一个文明的发达程度,新的摩尔定律也会沿着这个继续前行,实际运算效率还会不断提升。

当人工智能驱动整个计算继续以一种新的摩尔定律形式往前发展,我们要去思考为什么人工智能计算提升的效率要走哪一种专用化的路线,而不是和过去一样设计处理器架构、通用处理器架构,只是使它尽量满足宽泛任务的需求。至于为什么使人工智能往专用的方向走,首先我们要去思考一个问题,我们一般喜欢类比一下人类的大脑,因为人类的大脑是我们知道的宇宙中最聪明的“计算设备”,但人类的大脑是一个专用的处理器,并不能作为解决很多任务的通用处理器。比如看一张学生的表格,只能看到这个学生的年龄、哪里来的,并不能知道这个学生的全貌。

另外,我们再看另一个例子,研究表明,汉字的序顺并不定一会影阅响读。比如当你看完这句话后才发现这里的字全都是乱的)大家对顺序不敏感,并不是按照顺序扫描的,我们是全看,并且我们还有脑补的能力,非常奇妙,我们为了对图像加速要并行处理,这与远古逃命非常相关,狮子看到我的时候我一定要跑的非常快,不能扫描完这里再扫描另外的地方,我得加速运算,才能逃命。而我们平时用的语言有一个语言模型,这个语言模型给我们脑补的能力。但脑补的能力有的时候会给我们带来很大的麻烦。比如说大家开车的时候,如果前面的人突然急刹车你会怎么办?我们可能反应不过来,因为大脑每时每刻都在脑补,使得在脑补未来的时候就在很多时候可以省一点运算量,就会少花一点血脉膨胀在脑子里,可以把更多血液的输送养料在身体其他部位滋养。所以人脑里有很多的机制去加速特别重要的任务,去提升它的效率。从更少的功耗做更多的事情,只对一部分事情比较关心。

其实这些都是很重要的一个机制,这些机制可以很好的提升大脑硬件效率。这启发了我们去做自动驾驶的人工智能计算,因为它就是干那么几件事,从自动驾驶处理器到放歌给你听,把从感知到决策这件事情做得很好。如果直奔这些任务去做的话,能够把效率做的很高,可靠性做的很高。通常我们可以知道,如果去做通用的设计跟专用的设计,效率在相同的工艺上其实会有三个数量级的差别。

我们看到在过去五六年的时间里,在整个计算这块在发生着很有意思的革命,基于人工智能场景的需求导致计算对硬件驱动,CPU、GPU、FPGA到TPU、BPU,这是我们看到的趋势。

趋势二:计算开始走向云端

我们看另外一个趋势,这个趋势我也比较关心。在互联网还只有PC的时候所有计算都叫桌面计算,但有了微软、浏览器以后,很多的计算开始往云端走。到了移动时代有了更多的计算在云端,这个时候云计算成为了一个主流,这是本地分离的计算到中央云端的计算。

未来的趋势是什么呢?我们总是要判断未来的,如果未来判断错了的话以后就做的不是很好。手机从功能机变成智能机,汽车也会从功能车变成智能车。最新大疆的机器人挥挥手能朝你飞过来,还能排各种形状,主要是因为他识别你,他知道感知环境,包括其他很多设备。你也会发现大量的计算开始往前端走,因为这里需要的实时性、低延迟、网络带宽始终是一个问题,不要说其他的,在这样的一个楼宇里,连WiFi都是个问题,有的地方好,有的地方信号十分不稳定。

但汽车这种设备关乎生命安全,不能有小朋友突然横穿马路把信号再传回去处理,万一这个时候信号不通呢。同样的原因,比如像大的互联网公司会讲,像百度会讲高精度地图,可是大家想想看,自动驾驶是不能够依赖于高精度地图的,因为车的安全性本质决定了一定要在不联网的状态下足够安全,必须完全依赖本地的传感器跟计算。所谓天下大事分久必合,合久必分,很多计算开始往终端走。有的人会问我,说余博士,未来到底是终端计算重要,还是云端计算重要,这个问题对我来说就好像说未来男人重要还是女人重要一样,这个是没有必要回答的问题。一定有一些需要本地处理,实时的而且是较为有规则的计算在前端,需要不断的去更新,并且它的任务要非常灵活,这是我看到未来云端计算的形态。

讲到这么多终端,最令我兴奋的是手机已经改变了这个世界,未来智能终端已经真正能够影响全人类,并且是一个人从产房里接回来送到家里跟最后进殡仪馆,真正影响着每个人的每一天。另外一个则是汽车。中国是世界汽车消费的第一大国,我们去年一共有2800万的新车卖到市场,美国则是1700万辆,这是巨大的差距,而且这种差距还在拉大,所以有时候一种朴素的智慧还是蛮厉害的,毛主席曾说过“人多力量大,多生孩子,多生娃。”现在证明是很正确的。

当然还有一些其他的方面,比如中国是一个十分特殊的市场,安全导致的摄像头产业在中国非常大,一年有1个亿的摄像头被部署,当然这里大量分析结构化的计算都要在前端来部署,为什么在前端部署到云端计算呢?想想看,其实在很多场景数据是不需要存储的,比如有一大类的摄像头应用就是部署在商店里,去分析客户的行为。客户行为在货架里的行为,实际上本质上是把线下的行为数据化、现象化了。这样就可以用很多大数据的手段去分析。这里不需要存储数据,只需要直接把数据分析完放在云端,所以在数据采集的时候直接计算就可以了。当然还有很多其它的原因,比如说孙正义认为未来更加激动人心的是智能终端未来的数量会比人的数量还多,这里有大量的计算必然在前端去做。

趋势三:边缘计算会更快、更高、更强

还有一个趋势也非常显而易见,过去我们在云端,包括以前的桌面,比如286、386、486、586,边缘的计算也会更快、更高、更强。比如像自动驾驶的汽车传感器会武装到牙齿,特斯拉的一款车从1个摄像头武装到12个摄像头,并且未来象素也会越来越多,自动驾驶的汽车将来在高速上的速度会越来越快,因为它高度协调。这对处理数据量的实时性要求是不断在增加的,所以会看到一个很长时间的爬坡过程。

从我们角度来讲,我们希望在面向让我最兴奋、最性感的智能设备上装上本地计算的处理器跟算法,使它足够安全。同时也能够不断跟云端数据以及模型更新。就像现在更新APP一样,APP都在本地计算,更新都在云端。而我为什么把公司的名字叫地平线(Horizon Robotics)呢?因为自动驾驶的汽车不光是影响力最大的,对人们的生活影响力也最大,同时也是最难的,失之毫厘,差之千里,这与人的生命有关,对实时性、延时、效率、可靠性要求完全是不一样的。如果能把这个问题让机器人去处理。很有可能苹果园里摘果子的机器人用的就是我们的处理器,所以我们希望花十年、十五年的时间去把这件事情做好。我们需要跟过去做一个了断,过去只是帮人干纯软件的,从来不关心硬件是怎么回事,我们现在要特别的懂硬件,特别的琢磨硬件,不光是琢磨,而且要自己来造、设计。这就要求我们团队拥抱所谓全栈式的技术研发,从软件、硬件到系统软件甚至是数据中心的处理。

自动驾驶的软件设计原则

从软件角度来讲,我们认为自动驾驶的软件设计需要有几个原则。

1)首先是所谓的透明可追溯,一旦一个问题发生,我希望知道它是什么原因,我不想认为它是我的黑箱,如果我面对智能的机器是我不可理解的黑箱的话,我会觉得很恐怖。电影《西部世界》里面,每天人们把出了问题的机器人拿回来搞清楚为什么那么做,如果搞不清楚的时候,生活是处在非常恐怖的阶段。那个时候是人跟机器共存的世界,它对我们来讲是不可知的。软件系统怎么设计这样一个框架使得这个问题可追溯的尤为重要,大部分做人工智能的人其实不关心这个问题。能够找到原因,理解到为什么,找到去干预它,去改善它,去控制它的方法是未来人跟机器共存的一个很重要的问题,也是挑战。

2)另外这样一个软件系统一定要能够不断自我提升、演进,而不是说完全的用什么数据训练它那样。它能够在驾驶过程中不断出现各种不同新的路况,并且不断的去提升自己,所以端到端的学习我们认为很重要。

3)另外是我们要使得这个软件在硬件上去运行的话,能够足够的高效,用尽量少的energy处理比较高的计算流量。这是我们比较关心的三个方面。

首先,我们结合深度神经网络跟贝叶斯网络,在80年代末的时候,神经网络当时非常的时髦,反向传播算法出来以后大家觉得这件事情真的很牛,到90年代的时候深度学习、神经网络就落寞了,因为这个东西太难搞了,训练也很麻烦,训练出来的模型也不是那么好用。在90年代的时候,其实贝叶斯网络当时是非常流行,我记得当时应该是两个时间最流行,在机器学习领域,一个是贝叶斯网络,一个就是支持向量机。贝叶斯网络是一个框架,这个框架应该跟深度神经网络有非常好的结合,这个结合使得整个网络结构更加的模块化,而且模块跟模块之间可以有清晰定义的,并且可以理解的接口,也可以使我们容易识别,可以用数学非常优美的去驾驭它。

举一个简单的例子,比如说在自动驾驶里面临的问题从传感器的数据,把这些数据做成HBNN,用D表示,状态的描述是States,S,车的指令是A。通常来讲一个贝叶斯网络所描述的是联合分布,一堆的decomposed的联合分布。这里的结构如果说我知道sensory data,我可以知道distribution。联合分布可以分解成sensory data。有这样一个公式P(D.S.A)=P(D)P(S/D)P(A/S)。

我们构建贝叶斯网络,大概由几个模块构成,模块跟模块之间是有清晰的定义,真实的网络比它更复杂,这里有很多网络结构。但是我们定义它传导的都是概率的执行度。这是一个很大的混合网络结构,好处是每个子模块输出行为对我来讲都是可知的,同时网络子模块跟子模块之间的耦合是符合比较清晰的贝叶斯网络的结构。还有其他的好处,我每个子模块可以单独训练、驾驭。不会使得一个模块影响整个模块。

还有其他的好处,比较一致性的方法是把Rule-based system加进去。比如红绿灯一定要做这个。在每个作网络结构内部可以做一些事情,一个车的检测分解成很多子模块,这几个模块是不是会限制几个模型的灵活性。这个问题也可以解决,可以用一个neural的网络结构去做,这会有足够的灵活性。如果没有它的话就是一个黑箱的神经网络,如果有这个的话可以把里面的灵活神经找出来。

未来网络会支持端到端的学习,可以通过仿真、深度学习从后面一直推导到前端的物体识别。未来实际在这样的一个模型上不断的去自我学习,自我训练,甚至这里关键目标、物体的识别都不需要去用人为来标,完全是自学习的状态。

美国有曼哈顿计划,中国有“五道口计划”

前面讲的是软件,相应软件的设计我们要最后体现到硬件的设计。从感知的二级自动驾驶架构芯片的设计到三级的自动驾驶跟四级的有限场景自动驾驶的芯片架构设计,这里更加强大的感知,并且是多通道的,但同时是支持多传感器融合,也有简单的决策。四级的自动驾驶,除了感知,需要维度更丰富。更重要的是决策会更难,更多的计算是在决策。这里决策的问题在复杂场景下自动驾驶的决策问题,你开车的时候跟周边所有的行人跟车都是博弈的状态,比如我在开车,要换到别的道上,我通常并道看旁边的车是不是让,通常在北京不让,不让的时候就再找机会,实际就是“谈判”,这个过程非常复杂。

图:现场听众交流 刘涵 摄

通常跟周围的车是多达十个的回合。这样谈判过程比下围棋要更复杂,下围棋跟一个对手谈判,这在五道口可能会跟20多个车谈判。我们公司的项目,在美国有曼哈顿计划,中国有“五道口计划”,什么时候自动驾驶在五道口能够行驶,五道口路口非常复杂,有行人,有车,还有火车。所以什么时候自动驾驶的车能够穿越五道口的话,我觉得这个事就搞成了。因为我们公司里有很多清华的学生,所以我们公司内部自动驾驶的讨论群叫“五道口计划”。意思是说到最后四级是主要的计算量。

功耗降低非常重要,因为一方面不希望未来的新能源汽车,本来可以跑到长城再跑回来的,结果到跑到半路回不来,功耗都消耗在计算上了。其次更重要的是跟可靠性、安全性有关。因为功耗通常反映高温下的稳定性。如果车在停车场里,在夏天清华里的某个停车场,直接开门进去这车已经有七八十度了,所以一定要把功耗给降下来。相比来讲,跟Mobileye的eyeQ3相比我们盘古处理器更加强大,功耗差不多,都是2瓦,但是我们更加适合中国路况,可以更加应付复杂路况。比如说像国外做自动驾驶都是这样的路况,中国都是这样的。所以我们面对这种复杂性,谁能把五道口的问题解决,谁就能做自动驾驶的无冕之王。

下一代的处理器,是我们明年年底会推出来更先进的处理器。这个处理器面向自动驾驶,核心是通过传统的检测方法框架走基于象素级别的识别框架,这种框架识别单元不是一个一个的检测框,而是一个一个的象素,可想而知,这个计算的复杂度其实会更高。因为等于每个方面都要计算,对处理器挑战非常大的,但是它的意义非常大。很精确的去识别,比如哪个地方是马路牙子,哪个地方是可行驶的区域,不光是人,包括行人背后有严重遮挡也能知道,同时小的停车杆,路边这些杆都知道,因为车不想撞上去,一般你的雷达不会有那么细的力度检测那个东西。这比一般的检测框都要更加精准。

在中国做自动驾驶的挑战

看北京的例子,车露出一点角的话都要检测出来,北京的换道多,这种在欧洲、美国不容易出现,但是在中国非常容易出现。所以露出一点点就检测出来,这个非常重要。这是传统检测框不具备的能力,所以我们必须把这个事情通过软件跟硬件的结合做好。这在中国出现一个苗头就要检测到。

另外是行人,欧洲在高速上是不需要做行人检测的,在中国要不要做?中国要做的。这里很重要是对他的意图的理解,像国外那样知道人在哪个地方是不够的,你要知道人脸朝向什么地方,整个姿态的方向是什么样的,这会帮助理解他的意图。比如他的脑袋朝前大概知道不会朝后走,这些东西加在一起对它的理解。

在中国还有一个很有意思的场景是自动趴车的问题,基于象素级的处理器,环式的摄像头,经过我们的处理器把它给解析出,什么地方是行车道,什么地方是停车位。绿色的地方是停车位被占了,红色的是各个栏杆,上面是天花板。对语意的解析能够不断的建图、建模可以知道哪个地方可以停车。这里你就看到要用同一块处理器同时实施象素级的解析,这里对实时性、计算量都是有要求的。

自动驾驶的发展肯定需要云端的数据,也需要本地软硬件的部署,实施性的计算,这本身就是合作共生的。但是我觉得自动驾驶这件事情确实是中国人的事,因为我们的市场这么大,我们这个场景里产生的数据这么多。中国一个300万人口的城市都不好意思叫自己是中型城市,大家知道巴黎是多少人口吗?巴黎是200万人口,三藩市是80万人口。只有中国才有这么挑战性的事情,给我们的挑战跟机遇都是非常大的,这个事大概率也跑不掉,肯定是中国企业的事情。

  • 微笑
  • 流汗
  • 难过
  • 羡慕
  • 愤怒
  • 流泪
责任编辑:马苗苗
关于我们 | 联系我们 | 加入我们 | 版权声明 | 手机访问 | 网站地图 | 留言反馈 | 我要投稿
中共滁州市委宣传部主办 滁州日报社承办
Copyright?2009-2010 www.foodyi.com. All Rights Reserved 滁州日报社 版权所有
皖网宣备3412015001号 天津时时彩软件 热线电话:0550-3022685
天津时时彩规律大全 重庆时时彩晚上几点停 重庆时时彩玩单双稳赢 时时彩助手3.1手机版
时时彩组6最大遗漏 重庆时时彩怎么开盘 天津验车地点工作时间 天津时时彩开奖结果是
时时彩组6最大遗漏 重庆时时彩银狐娱乐 时时彩投注-上翃博玩 澳门金沙时时彩
天津时时彩多久开一次 最新时时彩平台出租 时时彩缩水网页版 天津时时彩中三走势图