今日,在火山引擎云产品发布会上,字节跳动参与投资的自动驾驶科技公司轻舟智航,分享了其与火山引擎联手打造的自动驾驶工具链轻舟矩阵,似乎做实了此前字节跳动将基于火山引擎推出自动驾驶云服务的消息。
早在今年9月,36Kr便报道称字节跳动正在组建汽车云业务团队,已从亚马逊云和京东云等公司招募了人员。自动驾驶云服务是字节在汽车领域的又一次重大布局,其在智能汽车时代的自我定位已经逐步清晰。
自动驾驶云服务的内容主要包括数据分拣、自监督学习标注、图像渲染、仿真平台搭建、模型训练等内容,目前国内百度Apollo、华为、腾讯都有类似的业务布局。
该部分的基础能力,将由轻舟智航提供的轻舟矩阵。轻舟智航是一家由谷歌Waymo多位华人技术骨干离职创立的自动驾驶科技公司。
仅2年时间,轻舟智航便已发展为在美国硅谷、中国北京、深圳、苏州等全球10座城市落地自动驾驶测试和运营,车队规模近百台的明星公司,获得了联想创投、IDG资本、字节跳动、美团等知名资本和企业的投资。
今年3月,据Bloomberg报道,字节跳动参与了轻舟智行的新一轮融资,投资金额或超2500万美元,是继2019年投资理想汽车后,在汽车行业规模最大的一次投资。
轻舟矩阵已经全面应用于轻舟智航自身的开发体系当中,帮助其在仅1年时间内,组建了覆盖10种车型,数量近100辆的车队规模,在全球10座城市的公开道路落地了测试和运营项目。
上云是高阶智能驾驶必由之路
自动驾驶云服务是字节跳动推出的To B业务,结合之前基于抖音和西瓜视频组建的车联网业务,字节跳动切入汽车领域的角度都是偏向于做“平台”生意,搭建一个基础能力平台,提供软件和数据计算存储服务。
基础L2辅助驾驶的研发阶段,用于模型训练的数据相对少,用于仿真的场景库也比较小,单个车企或解决方案供应商是可以单机操作的。
但是到了高阶智能驾驶研发,例如全场景辅助驾驶,落地规模更大的L3或L4的自动驾驶,模型参数越来越大,数据量越来越大,场景库也越来越大,上云和自建超算中心,基本是唯二的选择了。
字节跳动切入自动驾驶云服务,也是看到了自动驾驶这类消耗云计算资源的巨大应用前景。硬件环境上,火山引擎通过RDMA网络直连的数万张GPU,结合自研的BytePS分布式训练框架,主流模型的多机加速效率超过90%。
工具上,轻舟矩阵构建了以仿真为核心的自动化闭环,可以源源不断地对数据进行自动标注、质检、训练和评估,让自动驾驶AI大脑可以从海量数据中自主学习。
不过自动驾驶云服务也存在一定风险,现阶段国内选择自研高等级自动驾驶的车企并不多,自动驾驶人才稀缺,以及智能驾驶解决方案供应商较多是诸多车企尚未组建自研团队的主要原因。
多数传统车企的利润率并不高,无法支撑高额的自动驾驶研发费用,而国内现阶段已经有华为、百度、商汤、大疆等巨头推出了自动驾驶解决方案,小马智行、Momenta、纽迈科技、Mobileye、地平线等初创公司和芯片公司也有自动驾驶解决方案服务。
对车企而言,使用成熟的自动驾驶解决方案是不错的选择,自动驾驶的目标很明确,很难做出差异化,相对而言布局智能座舱,在成本上和差异化体验上性价比都更高。
选择自动驾驶全栈自研,优势在于可以构建数据闭环,使自家产品能够更快速实现高级别智能驾驶功能,而且能够在未来的竞争中发挥成本边际递减。例如特斯拉的数据触发、回传、训练全流程,已经帮助特斯拉实现了领先的辅助驾驶体验,以及超越传统车企的高毛利。
字节跳动新业务要和华为打差异化
自动驾驶云服务,是为自研自动驾驶的企业,提供基础的研发工具链,以及提供海量数据的计算和存储。自动驾驶是复杂的人工智能课题,需要海量的数据来训练模型,现阶段各科技公司以及部分车企,有自动驾驶测试车队,负责采集系统容易失效的边缘场景。
对车企而言,最理想的方案是通过已经交付给用户的车来收集数据,例如类似特斯拉的影子模式和“触发器”的方案。
不过目前由于收集信息的敏感性,以及多数车企并没有在硬件上匹配数据回传的需求,因此国内并没有车企通过该种渠道收集有效数据,因此现阶段会发现车企对自动驾驶云服务的需求量不太高,因为数据量规模还远达不到需要云服务。
当数据规模足够大时,从海量数据中挑选出训练所需的有效数据就成了“棘手问题”,这如同让你在1000部电影里找到你想看到的视频片段。
自动驾驶云平台解决的第一个问题就是数据分拣,从海量数据里,通过算法挑选出想要的视频片段。其次还有数据标注,通过自监督学习算法,可以帮助用户减轻部分标注的工作量。
最为重要的能力则在于虚拟仿真,当某个场景被挖掘到之后,算法需要反复的复现并测试,直至达到最优的表现,这个过程中就需要用到虚拟仿真。
这和现在流行的“元宇宙”概念比较相较,也是通过仿真技术搭建一个数字化场景,并在云端实现场景复现,这样能够极大降低开发成本,提升算法规划控制的研发效率。
华为八爪鱼是现阶段较为成熟的自动驾驶云服务,相较于字节跳动的云服务,会有几点明显的差异。最主要差异在于华为对自动驾驶行业的参与度更高,它本身就具有甲级测绘资质,拥有大量的测绘车辆,此外华为ADS也拥有一定数量的测试车辆。
而故事更性感的部分在于,一旦华为HI的车型能够上量,交付给消费者的HI版本车辆,就能如特斯拉一样帮助记录上传有效数据,而且这些数据是包含激光雷达点云的数据,配合虚拟仿真,能够实现比特斯拉更高的研发效率。
为了弥补这几点差距,字节跳动依靠的是轻舟智航在全球近10座城市,百台L4级自动驾驶车辆作为数据来源。而在高精地图方面,轻舟智航也具有乙级测绘资质。
数据集的丰富程度,仿真的技术,技术的协同闭环,这些都将成为自动驾驶云服务的核心竞争力,光靠GPU和存储,就成了卖“苦力”的生意。
但值得一提的是,在“网络安全审查”的大环境下,自动驾驶云服务的生意几乎没有微软、亚马逊等企业立足的机会,华为、百度、字节跳动的云服务确实能够承接一个很大的市场。
同时字节跳动相对华为百度而言,没有直接参与到乘用车的造车或整包解决方案中,这某种程度上也算是个优势,减少了汽车车企使用该云服务的后顾之忧,对一些拥有全栈自研能力的车企而言,会是很好的选择。
轻舟智航为何被字节跳动选中?
就在不久前的进博会上,轻舟智航发布了Driven-by-QCraft第三代L4级自动驾驶硬件方案。该方案配备了2个长距离激光雷达(主LiDAR)、3个近距离补盲激光雷达(盲区LiDAR)、4个毫米波雷达、9个感知摄像头和1个IMU套装,能够实现360度的激光点云和视觉冗余感知。
有意思的是,轻舟智航的计算芯片选择了车规级的大算力芯片英伟达Orin,成为行业内首个使用Orin的L4自动驾驶通用方案。
这套硬件方案能够在小巴、轿车等不同形态的车型上使用,后面也会搭载在轻舟智航专为自动驾驶共享出行场景设计的“龙舟Space”上搭载,可迁移性很强。这很符合轻舟智航一直强调的打造“自动驾驶超级工厂”。
除了硬件可迁移性强,轻舟智航的“自动驾驶超级工厂”,更多地是构建自动驾驶底层的平台化能力,包括了数据的筛选、清洗、标注以及仿真评估等,这可能是字节跳动投资轻舟智航的原因之一。
以标注为例,为了达到高度自动化的目标,轻舟智航已开创性地将自监督学习应用在激光雷达感知方向,减少了对人工标注的依赖。具体做法可以理解为用同一时间拍摄到的,分辨率更高的摄像头画面,用来做激光雷达点云感知结果标注的“参考答案”,已完成自监督学习的标注。
同时轻舟智航的核心团队中,就包含了谷歌街景组关键项目技术负责人于骞,和谷歌Waymo的无人车仿真系统专家汪堃,两位都对自动驾驶汽车的“元宇宙”有深厚的技术能力,这为帮助字节跳动自动驾驶云服务,构建云端虚拟仿真系统有极大帮助。
基于“自动驾驶超级工厂”,轻舟智航目前已经在苏州和深圳落地了Robobus试运营,此外还将落地不同种类车型的自动驾驶共享出行服务。
此次借由字节跳动的自动驾驶云服务,轻舟矩阵也正式对外开放,进一步扩展了轻舟智航的产品矩阵。轻舟矩阵的自动驾驶仿真除了依托真实路测还原场景外,还可以自动生成数以百万计的Corner Case场景,加速完成算法训练、测试验证和迭代优化,使得自动驾驶软件能力的进化不再受车辆和人员的限制。
自动驾驶将进入巨头时代
特斯拉是目前获得智能驾驶场景数据最多的车企,走在前面的特斯拉已经遇到了海量数据如何有效利用的问题,此外特斯拉也遇到了训练模型参数愈加庞大的问题,特斯拉给出的答案是无监督学习+Dojo超算,相信这一答案会成为很多后发者的选择。
然而无论是软件算法难度,还是硬件成本,都将成为摆在诸多车企面前的拦路虎,毕竟不是每一家车企都能有足够的财力聘请这个世界上最顶尖的“碳基大脑”,更不是每一家车企都能有钱建的起上千块GPU组建的“硅基大脑”。
自动驾驶的发展注定会进入巨头时代,和百度华为相比,字节跳动算得上是个“温柔”的巨人。