“AI‘上车’”的叙事已经平淡、甚至近乎泛滥之际,DeepSeek以异军突起之姿,强势“搅动”智驾产业。
1月20日,DeepSeek正式发布DeepSeek-R1模型,并同步开源模型权重。凭借低廉的成本价格和异常强悍的性能,DeepSeek仅用7天实现用户增长破亿,成为全球现象级的应用。
在多模态方面,DeepSeek于2024年12月发布了用于高级多模态理解的专家混合视觉语言模型——DeepSeek-VL2,模型的视觉问答、光学字符识别、文档/表格/图表理解以及视觉定位等能力得到进一步提升。
实际上,在DeepSeek名不见经传时,产业界已经关注到了其旗下模型,部分自动驾驶公司已开始提前探索该模型的应用潜力。
“效果超出预期!我们今年初在内部进行了实际测试,DeepSeek最直观的变化就是对模型训练效率的提升,它可以将推理响应时间缩短40%,甚至50%,同时算力利用率也有一定的下降。”一位某智驾龙头企业高管透露说。
在业内看来,DeepSeek作为开源基础模型,有望加速智能驾驶的训练速度,降低智能驾驶的训练成本,成为智驾训练的重要工具。
就智驾系统的开发而言,知行汽车科技系统总监张伟分析称,复杂城区场景是当前开发难度最大的地方,依赖传统的感知模型很难去解决此类长尾场景。各个企业都在尝试开发训练VLM模型(视觉语言模型),以优化系统对长尾场景的检测及处理能力。
但开发这样一套系统,依赖极大的云端算力及数据训练成本,部署到车端的模型也要依赖较大算力的硬件平台。而DeepSeek通过其独特的技术优势,例如MoE(混合专家架构)、GRPO(群组相对策略优化)、MLA(多头潜在注意力机制)等,可以更好赋能智驾系统开发。
“一言以蔽之,DeepSeek有助于以更少的数据和训练成本,实现同等性能的城市自动驾驶功能。”张伟说。
具体来看,在云端训练环节,用于自动驾驶模型训练的数据,要经过标注后才能进行模型训练,最后才得到能够识别车辆和行人的深度学习模型。DeepSeek本身降低了对数据标注的需求,因此可以帮助智驾企业进行数据挖掘和生成,降低数采和标注的成本。
在车端,DeepSeek可以通过蒸馏提升模型能力,降低车端计算资源需求,并降低车端部署成本。模型单次调用算力需求和训练成本都因此大大降低。
在场景理解上,张伟认为,跨模态迁移后DeepSeek逻辑性与场景理解力更强,在极端路况(如断头路、罕见交通标志识别、突发道路施工等)的表现有望优于传统模型。黑芝麻智能CMO(首席市场营销官)杨宇欣同样表示,未来DeepSeek可以用于融合视觉、语音、环境等多维度数据,实现更拟人化的驾驶决策,例如在复杂路口动态调整路径规划,或在突发状况中快速生成安全策略。
杨宇欣认为,DeepSeek等大模型的核心价值在于通过端侧高效推理能力,推动智能驾驶系统从“感知驱动”向“认知驱动”升级。若DeepSeek能通过低成本算力芯片实现规模化应用,将加速智驾功能向大众市场渗透。
(来源:新华网、上海证券报)
编辑:李洪永