首页 热点资讯文章正文

突破传统局限!新型AI能预判行人动作,自动驾驶从被动变主动

热点资讯 2025年12月20日 11:59 1 cc

哈喽,大家好,杆哥这篇评论,主要来分析突破传统局限!新型AI能预判行人动作,自动驾驶从被动变主动

突破传统局限!新型AI能预判行人动作,自动驾驶从被动变主动

在自动驾驶技术飞速发展的今天,"看懂"路况早已不是难题,但要"猜透"行人下一步动作,一直是行业痛点。

近日,德克萨斯农工大学和韩国科学技术研究院的研究团队,推出了名为OmniPredict的AI系统,彻底打破了这一僵局。

突破传统局限!新型AI能预判行人动作,自动驾驶从被动变主动

它不仅能识别行人位置和动作,更能精准预判后续行为,标志着自动驾驶正从被动反应迈向主动预判的新阶段。

突破传统局限!新型AI能预判行人动作,自动驾驶从被动变主动

传统自动驾驶的短板:看得见却猜不透

突破传统局限!新型AI能预判行人动作,自动驾驶从被动变主动

现在的自动驾驶系统,靠计算机视觉模型能精准识别行人、车辆和道路标识。

它们能清楚知道行人站在哪里、朝哪个方向移动,却没法判断对方会不会突然横穿马路、要不要在斑马线前停下。

突破传统局限!新型AI能预判行人动作,自动驾驶从被动变主动

只有等行人做出动作后,系统才能反应,这种滞后在复杂城市道路上很容易引发危险。

正如研究团队负责人斯林坎特·萨里帕利所说,城市本身就充满不确定性,行人行为更是难以预判,这正是传统系统的核心短板。

突破传统局限!新型AI能预判行人动作,自动驾驶从被动变主动

OmniPredict的突破:多模态融合实现"预判自由"

突破传统局限!新型AI能预判行人动作,自动驾驶从被动变主动

OmniPredict的核心优势,在于借助了多模态大型语言模型的能力。它不只是分析单一图像,还会整合场景上下文、车辆速度、行人姿态等多维信息。

系统先通过摄像头获取场景图像和行人特写,标注出行人位置,同时记录车辆速度和与行人的距离。

突破传统局限!新型AI能预判行人动作,自动驾驶从被动变主动

这些数据会被输入基于GPT-4o的推理引擎,将行人行为归类为横穿、遮挡等四大类,最终预测出未来几秒的最可能动作。

更值得关注的是,在JAAD和WiDEVIEW两大权威数据集测试中,未经专门训练的OmniPredict准确率就达到67%,比现有最佳模型高出10个百分点。

突破传统局限!新型AI能预判行人动作,自动驾驶从被动变主动

不止准确率:鲁棒性与响应速度双在线

突破传统局限!新型AI能预判行人动作,自动驾驶从被动变主动

67%的准确率看似不算完美,但在零样本学习条件下能有这样的表现,已经足够惊艳。更重要的是,它展现出了极强的鲁棒性。

即使在行人被遮挡、光线不好或姿态特殊的情况下,系统性能依然稳定,这正是传统模型的薄弱环节。而且它的响应速度极快,能在行人做出明显动作前发出预警,为车辆控制留出充足时间。

突破传统局限!新型AI能预判行人动作,自动驾驶从被动变主动

这种能力还能提升人车信任度,当行人知道车辆能看懂自己的意图,街道上的紧张氛围会大大缓解,交通流也会更顺畅。

突破传统局限!新型AI能预判行人动作,自动驾驶从被动变主动

应用场景广泛:从道路延伸到多领域

突破传统局限!新型AI能预判行人动作,自动驾驶从被动变主动

OmniPredict的价值远不止于城市交通。在军事和执法场景中,它能识别人体语言和压力信号,提前预警威胁;工业安全领域,工厂机器人靠它能预判工人动作,避免碰撞事故。

突破传统局限!新型AI能预判行人动作,自动驾驶从被动变主动

不过研究团队也强调,这类技术的伦理考量不容忽视,其核心是辅助人类决策,而非取代人类判断。

目前系统仍有局限,67%的准确率在安全关键场景中还需提升,且多模态模型对硬件要求较高,这些都是后续需要完善的方向。

发表评论

德业号 网站地图 Copyright © 2013-2024 德业号. All Rights Reserved.