大概一个月之前,马斯克放出了可能是今年特斯拉最重大事件的预告。
4月15日,马斯克在推特回复网友称,特斯拉的AI Day专场发布会,预计会在「7月底late July」举行。
继2019年4月23号自动驾驶日Autonomous Day、2020年9月23日电池日Battery Day之后,特斯拉第三次以「Day」命名的技术发布会,终于正式定档。
自动驾驶日上,特斯拉掏出了世界上首枚由车企研发的自动驾驶计算芯片FSD Chip,并发布了算力高达144 TOPS 的Autopilot 硬件3.0,总体算力至今依然没有量产车望其项背。
电池日上,马斯克放出了年产能TWh级别的全新电池工厂,发布了下一代4680电池,以及融合了电化学、生产优化,以及车辆工程之后续航提升54%的宏大目标,还有三电机+超长续航的新款Model S。
于是,我们没有理由不期待,马斯克会在7月底的AI发布会上,放出更多「核弹」为自动驾驶的2021打上更多花火。
当然,按照前两次发布会的调性,大家一定要做好AI Day跳票,甚至多次跳票的准备。不过这不影响我们根据现有的线索,揣测一下特斯拉到底会在AI Day上发布些什么。
不用担心,今天的文章不只有枯燥无味的数字,我们会争取写得更让人心潮涌动一些。
来自车企的全球最强计算机
根据2020下半年的全球TOP 500计算机排名,目前已投入使用的超级计算机中,日本富岳Fugaku超级计算机以431.65 PFLOPS的FP 32精度算力,排在榜首,大概是第二名的3倍。
2020年8月16日,马斯克首次披露了特斯拉DOJO超级计算机计划的目标——FP32精度1EFLOPS的算力,也就是1024PFLOPS,富岳的2.5倍。
DOJO,也就是特斯拉AI Day的最大看点之一,一套来自车企的超级计算系统。它是特斯拉自动驾驶计算补齐的最后一块拼图,甚至有可能是新时代车企「灵魂」的最终体现。
我们讨论自动驾驶时,常用的TFLOPS算力,其实是基于INT8精度衡量的。换算成FP32精度的话大致要除以4。也就是说,特斯拉Autopilot硬件3.0的FP32精度算力大概是36TFLOPS。
换算一下就是,一个 DOJO 系统的算力,起码相当于 29127 辆特斯拉硬件 3.0 车型算力之和。
1EFLOPS 的算力当然很恐怖,但傲视群雄的 DOJO 担子依然不轻。
根据 thecarconnection.com 的统计数据,2014 年全美驾驶者平均每天开车 52 分钟。
以特斯拉硬件3.0车型保有量100万辆计算,一套DOJO纯粹基于平均时间值换算,每天大约需要处理超过2500万辆次汽车反馈的数据。
当然,DOJO主要负责的是「训练」,这样计算它的压力不严谨。但另一个幸福的烦恼是,特斯拉卖得真不错。
刚刚过去的1季度,特斯拉一共交付了超过18万辆汽车,这些车型全部搭载了Autopilot硬件3.0,算下来今年特斯拉或将售出73万辆汽车,甚至有机会超越雷克萨斯。
按照这样的趋势,再过一阵子,马斯克曾经引以为豪的「百万级自动驾驶数据反馈车队」,就会变成每年「自豪」一次的幸福烦恼。
DOJO如何适应迅速累积的Shadow mode数据反馈规模,比起DOJO本身,也许是AI Day更值得关注的命题。
硬件 4.0,突破 1000TOPS?
灵魂需要肉体承载,DOJO是坐镇特斯拉总部的大脑,而分散于世界各地的 Autopilot硬件,则是神经网络的每一个末梢。
DOJO超算目前面临的内部挑战有两个:特斯拉卖得太火,也就是数据反馈越来越庞杂;以及特斯拉做得太多,也就是来自每一个「神经末梢」的数据压力,会越来越大。
「做得太多」对应的,就是马斯克Autonomous Day上承诺会在「两三年内」推出的二代FSD Chip,以及它的载体Autopilot硬件4.0。
根据台湾工商时报报道,二代FSD Chip将交给台积电量产,使用7纳米工艺制造,由博通和特斯拉一起设计。
台湾媒体报道的另一个消息,是「每块 7 纳米晶圆只能切割出25片FSD Chip 2代芯片」 ——一块7纳米晶圆面积是70650平方毫米,而初代FSD Chip面积只有260平方毫米。
所谓的「X 纳米工艺」,一般指的是晶体管边长为X纳米。根据摩尔定律,同样面积的芯片,其晶体管数量每隔18个月就会翻一番,而边长就是计算晶体管密度的重要因素。
一般来说,同样架构下等量的晶体管密度提升,就会带来相近的性能提升幅度。也就是说,同样面积下晶体管数量翻一倍,理论上性能会接近翻倍。
原理说得差不多,可以直接下结论了:二代FSD Chip在晶体管密度突飞猛进的基础上,芯片面积同样百尺竿头——最后的结果就是算力大爆炸。
我们用数字大概预测一下。
2019年11月7日,特斯拉AI部门高级主管Andrej Karpathy在PyTorch Developer Conference 2019上面,公布了这样一个数字:Autopilot 硬件 3.0 的工作功耗是「sub 100W 低于 100 瓦」 。
算下来硬件 3.0 总体的效率起码是 1.44TOPS 每瓦 ,而使用了12纳米工艺的英伟达 Xavier,芯片层面的效率大概是 1TOPS 每瓦 (30W/30TOPS)。
初代FSD Chip用的是三星14纳米工艺,而FSD Chip 2代用的台积电7纳米工艺,理论晶体管密度是三星14纳米的3.5倍。
即使不考虑架构优化,硬件4.0也有望提供6TOPS的每瓦性能,也就是100W 系统功耗,可以输出600TOPS的算力。
而英伟达最新的Orin,系统级效「只有」3.08TOPS 每瓦(130 瓦/400TOPS)。
考虑到蔚来已经将自动驾驶计算系统的功耗上限,拉到了200W+级别。一旦马斯克想狠狠来一把军备竞赛,也许1000+,甚至2000TOPS才是硬件4.0的星辰大海。
当特斯拉每年卖出100万辆装有硬件4.0的汽车,DOJO会不会喊一句「宝宝心里苦,但宝宝不能说」?
视觉能力飞跃?
如无意外,新一代Autopilot硬件会沿用 8 摄像头的配备。虽然数量大概率不会变,但下一代Autopilot摄像头的质量,很有可能迎来飞跃。
想要理解「飞跃」到底是什么,虽然技术路线不同,我们依然得先看看其他厂商。
年初的NIO Day上,蔚来首发了车规级的800万像素摄像头。
它可以以4K级别的精度收集视频数据。对比之下,目前辅助Autopilot硬件的,依然是120万像素摄像头。
其实符合车规级稳定性要求的高像素摄像头,多年前就已经出现,但却一直无法应用于ADAS/自动驾驶,主要原因很简单——没那么强的车规级芯片处理如此庞大的数据流。
2020 NIO Day上,李斌介绍称蔚来的AQUILA系统每秒会产生高达 8GB 的视频数据——8GB 相当于1秒钟看完3年NIO Day回放,或者1秒钟看完2000 个抖音短视频。
2022年开始,特斯拉/英伟达系在计算端万事俱备,800万级别像素,将会顺理成章地成为ADAS行业下一个军备竞赛的必争之地。
1016TOPS算力的英伟达Orin系统加持下,蔚来拥有了处理多个4K视频流的能力。同样将迎来算力爆发的特斯拉,没有理由不让DOJO看到更清晰的世界。
不过,高像素,只是自动驾驶视觉新时代的其中一个主旋律,我们下面结合具体的产品继续深挖。
先看一位车规级800万像素摄像头主要供应商:安森美Onsemi。目前的120 万像素Autopilot摄像头,就使用了来自安森美的AR0136A。
AR0820AT,这是安森美新一代旗舰自动驾驶摄像头型号。
它支持拍摄3840x2160分辨率,40fps的HDR高动态范围视频 ,静态分辨率高达830万像素(3848x2168),同时符合ASIL-B级别车规认证。
除此之外,三星、索尼等主流CMOS厂商均已推出了4K车规级感光元件,比如 索尼IMX324/424、三星 S5K2G1 ,都支持4K 40帧的HDR视频拍摄。
4K、40帧(或更高)、HDR,这就是自动驾驶摄像头新时代三大主旋律。
4K和1280x960相比, 分辨率达到了6.75倍 ,视频数据可以准确显示更远处的路况,以索尼IMX324的产品说明为例,4K分辨率下远处的交通标志清晰可见:
40帧则是画面流畅度(目前主流是30帧)的进步。视频帧率越高,视频中物体运动过程就会越流畅,有利于深度学习的预测和决策。
而HDR,则是摄像头向人眼靠近的另一大步。
HDR的全称是High Dynamic Range高动态范围。简单点描述HDR的效果,就是极暗处(比如树荫下)不会黑成一片,极亮处(比如正午太阳下)也不会白成一片。
也许人眼已经对纷繁的世界习以为常,但对于汽车视觉来说,「工业革命」才刚刚开始。
新时代汽车工业的灵魂
DOJO、Autopilot硬件4.0、4K摄像头,这是我们对特斯拉AI Day的期待。
然而,AI Day不仅是特吹的狂欢,它同时带来了汽车工业的思考:下一个时代的车企「灵魂」在哪?
先提一个业内观点:主机厂也许是更好的自动驾驶公司。
这个逻辑的起点很简单,因为主机厂拥有车辆制造权和运营权,丰田大众这样的车企,年销售规模甚至是千万级的。比起买几十几百辆车搞实验的自动驾驶技术公司,主机厂自研自动驾驶的数据基础极其优渥。
但优渥不代表门槛低。
摄像头→FSD Chip→车辆决策→DOJO 超算训练→软件OTA更新,这是特斯拉的自动驾驶闭环阳谋,但每一个环节,都是对传统车企的灵魂拷问:
传感器数据是否100%可控可收集?
计算硬件是不是「know how」级别地利用?
视觉融合是供应商包办还是自己搞定?
深度学习模型要不要自己训练?
能否在一个电子电气架构上做到长期更新,常用常新?
上文提到新车企「灵魂」,我们从不和稀泥,于是经过全文铺垫后,可以说得直白点:
新车企的灵魂不是旧时代的「制造」,而是融合了人工智能、软件开发、电子硬件架构等ICT行业特征的自研能力。
如果以上能力缺了一坏,甚至几环,你们觉得能叫「新车企」吗?
转载文章,不代表本站观点。