当前位置: 首页 > 资讯 > 智能驾驶 > 小米汽车「前车识别」 开启智能 “知车” 时代

小米汽车「前车识别」 开启智能 “知车” 时代

2025-03-22 06:21:31

  今天,咱们要聊的是小米SU7 Ultra 发布会上一项充满趣味化与科技感的"彩蛋"功能 --前车识别。

小米汽车「前车识别」 开启智能 “知车” 时代

汽车学霸 一键开启云认车模式

  那么,大家知道什么是前车识别吗?简单来说,前车识别是一种借助小米自研多模态大模型,对前方车辆进行品牌、型号等信息识别的功能。*前车识别:此功能需要打开「设置」-「智能语音」-「大模型开关」,识别内容来自小米 AI 大模型、懂车帝

  举个例子,当我们驾驶着小米 SU7 行驶在路上时,前方突然出现一辆造型炫酷的跑车,你刚冒出「这是哪家新出的神车」的念头,副驾的朋友直接对小爱同学进行了询问:"小爱同学,前面黄色的是什么车?"。只见车机屏幕流光一闪,小爱同学立马答复:"这可能是小米SU7 Ultra ,上市时间为 2025 年 2 月 27 日,当前指导价 52.99 万元起"。

  这样一个极具趣味性的功能,其实来源于小米汽车研发团队开展的一项特别的车主行为洞察工作。在调研过程中,他们观察到车主在车辆行驶过程中最爱「暗中观察」前后车辆,但苦于:想要拍照识车?刚拿起手机就被后车滴滴,行驶安全也有风险;等到回家搜索,苦苦回忆思索半天也描述不清,只能无奈作罢。于是让汽车自己当解说员的点子,就这样诞生了。

  想法是丰富、天马行空的,那到底该如何落地呢?

精准锁定目标车辆 让提问有指向

  研发团队想到了小米自研多模态大模型,它拥有极为强大的图像理解能力,也许能够在大模型的加持下将该功能落地。

  基于此,团队探索了大模型的 Grounding 能力和车辆识别能力,基于小米 SU7 广角前视摄像头采集的视觉数据作为输入源进行初步性能评估,发现当前模型存在两大技术瓶颈:其一,当道路场景出现多目标车辆时,模型对用户查询指令的语义解析存在显著偏差;其二,在远距观测场景下,受限于广角摄像头的物理成像特性,目标车辆像素分辨率不足导致模型无法有效辨识车型特征。

  具体而言,当我们在保持安全驾驶的情况下,想要问问"前面那辆是什么车?",常常会遇到说不清、指不准的尴尬--是左前方还是右前方?是近处轿车还是远处 SUV?问题描述越模糊,系统越难给出准确答案。在这个看似简单的交互背后,其实隐藏着双重技术挑战:既要听懂用户的口语化表达,又要在瞬息万变的路况中锁定特定目标。

  于是研发团队尝试了多模态数据融合和传感器融合的方法,将图像和语义结对进行数据标注,通过数据微调提高模型对方位的理解能力。这样,当用户唤醒"小爱同学"提问时,就可以分析语音中的方位关键词(如"左前方"),在前方诸多车辆中,精准锁定用户询问的目标车辆。目前方位理解准确率可达 99% 。

小米汽车「前车识别」 开启智能 “知车” 时代

  此外,团队在车内后视镜处还创新搭载双摄像头组合:广角摄像头类似用户视角,可将前方车道范围内的车辆尽收眼底;长焦摄像头则像望远镜,能清晰捕捉远方 200 米处车辆的细节信息。这对"广角+长焦"组合,既保证了视野广度,又兼顾了识别精度,即便是高速路上快速移动的车辆也能清晰成像。

算法赋能 智能识别全场景覆盖

  精准锁定目标车辆只是第一步,如何即时拍照,如何对车辆图像进行智能识别、做出准确判断同样也是研发团队所面临的考验。现实中的车辆并不会像在展厅里那样,"摆好姿势"等你来拍。它们往往有的只露出半边车尾,有的被树荫遮挡,还有的在百米外只剩模糊轮廓。面对这些"非标准角度"以及"有限数据"与"无限场景"的鸿沟,研发团队通过数据重采样和 loss 函数设计的方式,来解决这些难题。

  在采集数据时,每款车型需采集车头、车尾、侧面等多个关键角度,拍摄 50-100 张不同光照、距离下的照片,即可实现对车型的识别。针对外观相似的车型,系统还会针对性进行强化训练,加大照片的采样量,如前代特斯拉 Model Y 和 Model 3 尾部造型很相近,对这两辆车需要采集的数据量就达到了数百张。

  在现实场景的图像识别方面,前车识别功能能够自动对目标车辆的图像进行智能裁剪,以聚焦车辆关键特征,屏蔽周围干扰信息,既能放大车标、车灯等细节,又能消除相邻车辆或绿化带的干扰,让识别模型专注分析核心特征。

小米汽车「前车识别」 开启智能 “知车” 时代

  目前,"前车识别"功能已全量上线在售的小米汽车,车主均可唤醒"小爱同学"进行体验,已支持 1000 多辆常见车的识别,涵盖中国市场能见到的各类市售车型,对于常见车型的识别准确率达 90%,对于小米汽车的识别准确率达 99%以上。不仅如此,面对车主的一连串追问,小爱同学也能轻松应对。当车主询问 "这款车什么时候上市的?",小爱同学会自动跳转至年度新车时间轴;若问 "这是油车还是电车?",它立刻化身环保小助手给出答案;要是问 "多少钱能拿下?",小爱同学则会贴心显示网络可查询到的参考价格(来源于小米 AI 大模型或懂车帝)。

  值得一提的是,"前车识别"功能也已同步上线手机的"超级小爱"。当你手持小米手机观看视频、浏览网站时,只需对着画面提问,"这是什么车?",小爱同学便能瞬间调取云端车型库。这种"所见即所得"的识别能力,正在重新定义人车交互新的边界。

隐私无忧 让好奇心与安全感同行

  当技术突破与场景覆盖的边界不断延展,一个更深层的命题也逐渐浮现--在满足用户需求的同时,如何守护用户的数据安全?对这个问题的解答,小米的"前车识别"技术体系真正彰显了科技发展与安全责任的平衡。具体而言,可归纳为以下两大环节:

  训练数据匿名化:所有用于模型训练的街景数据均通过本地端侧自动化处理,对车牌、人脸等敏感信息进行不可逆打码,确保原始数据无法追溯至任何个人或车辆。

  实时交互零上传:当用户提问时,摄像头捕捉的原始图像仅在车机或手机本地进行脱敏处理,通过边缘计算提取车辆特征后,仅将非隐私的特征数据上传分析。全过程确保原始画面不离开设备,从技术底层隔绝数据泄露风险。-基于小米对用户需求的深度洞察,前车识别功能将冰冷的数据转化为可感知的艺术--它让驾驶者从枯燥的等待中解放,将好奇心转化为即时满足的乐趣,一句"小爱同学,前方是什么车",小米多模态大模型便可即刻为你解答。这种「技术硬实力」与「人文关怀」的双重奏,正是小米智能生态一直以来的独特基因。

  未来,小米将继续基于前车识别功能的开发经验,不断优化算法,借助大数据和人工智能技术,让识别更加精准、功能更加丰富。同时,小米也会持续探索多模态大模型在各类产品上的应用落地,挖掘更多有趣的、好玩的功能,为用户生活带来更多惊喜互动。

点击关键字阅读相关文章: 文章来源:小米汽车
阅读

评论

评论内容最少2字,最多200字
说说你的看法...