1/0
中国车企与特斯拉在这个方面相差百倍?上海这家公司有办法弥补
上观新闻2024-05-16 10:10:00

随着自动驾驶、ChatGPT等名词在互联网传播,越来越多人知道了人工智能技术。那么,你知道发展人工智能技术也需要“原材料”吗?

在上海有这样一家启数光轮科技(上海)有限公司,他们的工作就是生产人工智能所需要的“原材料”——数据。

“现在人工智大模型迅速发展,对数据的需求特别大,整个互联网的数据加一起都不够用了。”光轮智能创始人兼首席执行官谢晨说,这时候就需要通过合成数据来推动人工智能发展。他之所以从蔚来汽车辞职创业,也正是看到了这一领域的广阔前景。

为人工智能提供海量数据

“人工智能并非一诞生就如此聪明,它需要通过海量的数据不断学习,才能更好地实现自动驾驶等功能。”1987年出生的谢晨是这个领域的专家,曾在英伟达、Cruise、蔚来等企业担任自动驾驶仿真负责人。

在英伟达工作期间,谢晨发现,要让自动驾驶变得更安全,需要大量的训练数据。如果完全依赖于现实世界中的数据,不仅难以采集,而且存在利用率低、标注成本高和长尾场景缺乏等问题。于是,他萌生了一个大胆的想法——能不能人工合成出这些训练数据?

“比较通俗的类比是,人工智能就像我们养殖的动物,需要吃饲料才能长大。可是单靠自然界中的饲料是不够的,所以我们得想办法去自己生产一些饲料。”谢晨说,他想到的办法是将生成式人工智能(AIGC)与仿真技术深度融合。

仿真技术本身并不罕见,在物理领域,研究者往往会用仿真的形式对复杂的系统和过程进行建模。但单靠仿真技术生成的数据真实度、泛化性与效率较低,通俗来讲就是“不够真实”,因此无法解决现有难点,还需探索如何与生成式人工智能相结合。

谢晨结合自己负责的自动驾驶业务,开始验证两种技术融合的可能性。他持续优化代码、调整关键性能参数,有效合成了大量数据。随后,他在AI算法的帮助下对这些数据进行了深入细致分析,以确立一套可量化的数据评估准则,找出符合项目需求的数据,使其可以被有效利用。

经过反复验证,谢晨用了5年时间,终于摸索出了生成式人工智能与仿真技术最佳融合方法,由此可以生成映射现实世界的合成数据——图像或视频,通过训练算法理解和学习现有数据便可生成3D、物理真实、可泛化的新数据。

帮助中国企业追赶特斯拉

2023年,带着自己的研究成果,谢晨毅然决定从蔚来汽车辞职创业。

“我们希望,通过合成数据的应用,助力中国汽车企业在自动驾驶技术上缩小与特斯拉的差距,甚至实现超越。”谢晨解释道,特斯拉现在在全球拥有上百万辆汽车,它们源源不断地传回数据、帮助人工智能不断优化。而中国车企掌握的数据可能只有特斯拉的百分之一,长此以往,双方的人工智能差距也会拉大。

“光轮智能可以提供海量合成数据,相当于加了一个杠杆,来填补中国车企在真实数据量上与特斯拉的差异。”谢晨说,光轮智能成立后完成的第一单业务,就很好地证明了合成数据的价值。

在业务拓展过程中有汽车厂商告诉谢晨,企业正在研制的自动驾驶有个问题始终难以解决,就是会将路边广告牌的人物图案识别为真人进而启动刹车。如果修改识别规则,又无法鉴别真正的行人,容易造成交通事故。

“其实这里的问题就在于企业缺乏足够多的路况数据。”谢晨的团队拿下这一单,生成了数千个包含人像广告的各类场景,并从中挑选出带有精确标注的数据。这些数据随后被该车企用于算法训练,果然有效增强了自动驾驶模型的表现。

由此,光轮智能在业界崭露头角,作为一家初创企业在业内迅速打响了名气。成立一年多,就获得了四轮融资,得到了多家头部创投机构的认可。

谢晨(右一)和同事在工作中

让更多人意识到合成数据的价值

从在大企业做创新研发,到自主创业,谢晨坦言,这一年多的经历给了他很大挑战,也让他感到十分兴奋。

从一开始,他就给自己的新公司定了一个长远的目标:成为数据界的英伟达。对此,谢晨很有信心。“我们有一个很棒的团队,平均年龄28岁,来自合成数据、生成式人工智能、仿真等领域的优秀技术人员占比超过90%,还有商业领域的人才。”

目前,光轮智能在谢晨的主导下搭建了国际领先的合成数据产线,拥有多项国内外技术专利,为多家海内外知名自动驾驶公司、国内外主机厂提供产品交付并形成合作伙伴关系,累计服务客户几十余家,交付数据上亿帧,积累场景数百万个。

今年3月,谢晨还带领光轮智能与上海人工智能实验室联合推出并开源自动驾驶3D Occupancy合成数据集 “LightwheelOcc”,用于CVPR 2024自动驾驶挑战赛和China3DV 2024 挑战赛。

“使用合成数据训练人工智能已经是硅谷的共识,但国内对这块认识还不够。”谢晨希望,通过光轮智能的一系列成功案例,让更多人意识到合成数据的价值,推动自动驾驶、具身智能等相关产业蓬勃发展。

选稿:郑闻文
知识产权、免责声明以及媒体合作联系
继续了解
知识产权声明

【知识产权声明】

除本司(指上海东方网股份有限公司)另行声明外,本司网页及客户端产品(以下简称“本网”),包括但不限于东方新闻、翱翔、东方头条等,所涉及的任何资料(包括但不限于文字、图标、图片、照片、音频、视频、图表、色彩组合、版面设计、商标、商号、域名等)的知识产权均属本司和资料提供者所有。未经本司书面许可,任何人不得复制、转载、摘编、修改、链接、镜像或以其他任何方式非法使用东方网的上述内容。对于有上述行为者,本司将保留追究其法律责任的权利。

东方网、东方新闻、翱翔,以上均为本司享有权利之合法商标,未经本司书面授权,任何单位或个人不得使用上述商标,或将上述商标用作网站、媒体名称等。

【免责声明】

1、凡本网注明来源“东方网”或“东方新闻”或带有东方网LOGO、水印的所有内容,包括但不限于文字、图片、音频视频,版权均属本司所有,任何媒体、网站或其他任何形式的法律实体和个人未经本司书面授权均不得转载、链接或以其他方式复制传播。与我司签订有关协议或已经获得本司书面授权许可的媒体、网站或其他任何形式的法律实体和个人,应在授权范围内使用,且必须注明来源“东方网”。其目的在于传递更多信息,并不意味着本司赞同其观点或认可其内容的真实性。如果其他媒体、网站或其他任何形式的法律实体和个人使用,必须保留本司注明的“稿件来源”,并自负全部法律责任。如擅自篡改为“稿件来源:东方网”,本司将依法追究责任。

2、擅自使用东方网名义转载不规范来源的信息、版权不明的资讯,或盗用东方网名义发布信息,设立媒体账号等,本司将依法追究其法律责任。

3、鉴于本网发布主体、发布稿件来源广泛,数量较多,如因作者联系方式不详或其他原因未能及时与著作权拥有者取得联系,或著作权人发现本网转载了其拥有著作权的作品时,请主动来函、来电与本司联系,或与本司授权的中国文字著作权协会联系,提供相关证明材料,我方将及时处理。
中国文字著作权协会联系方式:
联系人:赵洪波 唐亚静
地 址:北京西城区珠市口西大街120号太丰惠中大厦1027-1036室
联系电话:010-65978917
邮 箱:wenzhuxie@126.com

4、本网所有声明以及其修改权、更新权及最终解释权均属本司所有。

【媒体合作】

本司为尊重保护著作权,鼓励有益于社会主义精神文明、物质文明建设的作品的创作和传播,促进互联网良性发展,本着平等互惠、资源共享的原则,诚邀各类媒体、网站、单位、个人与本网建立友好的合作关系。
媒体合作、内容转载请联系
联系人:杨老师
联系电话:021-22899781