为什么特斯拉要自己设计芯片来训练其自动驾驶技术

来源:众壹云 发布日期:2021-09-09 10:48

开发人工智能既昂贵又耗时。定制芯片可以为公司带来优势。

设计芯片

特斯拉制造汽车。现在,它也是最新一家通过制造自己的硅芯片来寻求人工智能优势的公司。

在上个月的一次促销活动中,特斯拉透露了一种名为 D1 的定制 AI 芯片的详细信息,用于训练其 Autopilot 自动驾驶系统背后的机器学习算法。该活动的重点是特斯拉的人工智能工作,并展示了一个跳舞的人类,该公司打算制造一个人形机器人。

特斯拉是最新一家自行设计芯片的非传统芯片制造商。随着人工智能变得越来越重要且部署成本越来越高,谷歌、亚马逊和微软等其他在该技术上投入巨资的公司现在也在设计自己的芯片。

在此次活动中,特斯拉首席执行官埃隆马斯克表示,从用于训练公司神经网络的计算机系统中榨取更多性能将是自动驾驶取得进展的关键。“如果一个模型需要几天的时间来训练而不是几个小时,那将是一件大事,”他说。

在 2019 年改用英伟达硬件后,特斯拉已经设计了可以在其汽车中解释传感器输入的芯片。但是,创建一种用于训练 AI 算法的强大而复杂的芯片要昂贵得多且具有挑战性。

“如果你认为自动驾驶的解决方案是训练一个大型神经网络,那么接下来就是你需要的那种垂直整合的策略,”斯坦福大学汽车研究中心主任Chris Gerdes说,他参加了特斯拉事件。

许多汽车公司使用神经网络来识别道路上的物体​​,但特斯拉更加依赖这项技术,一个被称为“变压器”的巨大神经网络一次接收来自八个摄像头的输入。

“我们正在有效地从头开始构建一种合成动物,”特斯拉的人工智能负责人安德烈·卡帕西在 8 月的活动中表示。“汽车可以被认为是一种动物。它自主移动,感知环境并自主行动。”

近年来,Transformer 模型在语言理解等领域取得了巨大进步;收益来自使模型更大、更需要数据。训练最大的人工智能程序需要价值数百万美元的云计算能力。

“我们正在有效地从头开始构建一种合成动物。” 

ANDREJ KARPATHY,特斯拉人工智能主管

Real World Technologies 的芯片分析师大卫·坎特 (David Kanter) 表示,马斯克押注通过加快训练速度,“然后我可以让整个机器——自动驾驶程序——在世界上的 Cruises 和 Waymos 之前加速,”他指的是特斯拉在自动驾驶领域的两个竞争对手。

斯坦福大学的 Gerdes 表示,特斯拉的战略是围绕其神经网络构建的。与许多自动驾驶汽车公司不同,特斯拉不使用激光雷达,这是一种更昂贵的传感器,可以看到 3D 世界。它依赖于通过使用神经网络算法解析来自其摄像机和雷达的输入来解释场景。这对计算的要求更高,因为该算法必须从相机馈送重建周围环境的地图,而不是依赖可以直接捕获该图片的传感器。

但特斯拉也比其他汽车公司收集了更多的训练数据。路上行驶的超过 100 万辆特斯拉汽车中的每一辆都将来自其八个摄像头的视频反馈回公司。特斯拉表示,它雇佣了 1000 名员工来标记这些图像——注意汽车、卡车、交通标志、车道标记和其他特征——以帮助训练大型变压器。在 8 月的活动中,特斯拉还表示,它可以自动选择要优先标记哪些图像,以提高流程效率。

Gerdes 表示,特斯拉的方法的一个风险是,在某个时刻,添加更多数据可能不会使系统变得更好。“这只是更多数据的问题吗?” 他说。“或者神经网络的能力是否比您希望的水平低?”

无论哪种方式,回答这个问题都可能代价高昂。

大型、昂贵的 AI 模型的兴起不仅激发了一些大公司开发自己的芯片;它还催生了数十家资金充足的初创公司,致力于专门的硅片。