电子驱动是合理的|著名的华为科学不遵循VLA路径
发布时间:2025-09-03 09:40
几天前,华为智能汽车解决方案的首席执行官Jin Yuzhi表示,采用VLA技术路线的公司相信,他们现在正在通过开放AI等各种语言模型来学习在线信息,然后将语言和所有LM研究转换为认识知识。这样的道路似乎是一个诀窍,但这并不是真正的自主驾驶的途径。华为价值WA更多。目前,这条道路似乎很困难,但是它将实现真正的自主驾驶。那么,WEWA的架构到底选择了什么?它的“魔术”是什么? 首先,我们需要知道WEWA的体系结构是什么。 WEWA的架构分为两个部分。我们的世界引擎主要负责云,西澳州是世界行动模型世界行为模型,它尚未在汽车的尽头。 让我们先谈谈云。自端到端以来,数据培训的量变得尤为重要。可以是赛d从正常驾驶的相对简单情况下,收集到的人类驾驶数据中有99%是数据。例如,黑客的非常复杂且稀有的划痕,数据的体积很小。如果您不相信,只需问您周围的老驾驶员,然后问他多年来开车的危险和复杂场景。如果无法增加这一数量的数据,则帮助驱动尾巴情况的处理将始终是有问题的。负责云的世界引擎是解决这个问题。 首先,通过现有的环境数据,AI首先模仿了云中的一个真实世界,并将云世界中的现实世界恢复为细节。然后,它会在这一路景的这一部分中产生不同情况的视频,或者根据观看的人类驾驶视频的相同情况下不同路段的视频,并且可能会自定义难度水平。例如,AI了解了一个小狗笨拙地跳出了道路,因此可以创建诸如绵羊之类的场景,突然跳出道路,长颈鹿和大象,还可以在您要避免的线路中修复其他车辆,这会增加贫困。它的优势是我们喂食AI 10稀有视频,可以自己延长数千个情况。这样,在现实世界中,高质量和困难的场景数据是一千倍。负责监管的模型是对云世界中各种高难题场景进行培训的Mabcomfort。这是使用AI训练AI。 为大量人类驾驶员提供的数据材料肯定包含一些不安全且不当的驾驶数据,例如运行红灯或在非电动车辆线上行走,一旦有AI,幻觉就不可避免了。无论是低质量数据还是幻觉,都会影响模型培训事故。无论如何,在WEWA的架构中,AI参与了每个步骤。我们如何减少HA避免错误和风险并确保安全的llucination? 因此,华为为模型培训设置了奖励和罚款功能。换句话说,华为与工程师和AI团队成立了陪审团。陪审团的工作是控制局势。整个级别的评分是一个摘要,每个成员的标记是获得全面标记的摘要。分数越高,更安全。通过此标记,该模型将了解安全行为的控制。 好的,我们最终谈论了云,接下来是汽车码头。该视频在开始之前说,VLA是从大型语言模型中转变而来的,其优势是语言识别和文本推理技能,例如对文科的研究。但是帮助驾驶在物理世界中运作,因此WEWA建筑中的行动模式就像科学专业的学生。他不必充分理解语言的内容。他擅长空间理解物理世界中的行为。 SA Patalk围绕它,只是想一想。人类驾驶数据以及AI生成的数据,一遍又一遍地训练该模型,然后通过AI扩展良好的数据,然后再次训练。每回合需要处理多少数据?车辆侧而不是VLA驱动芯片是否需要芯片计算能力? 实际上,不。首先,VLA/VLM经过修改并从LLM大语言模型中蒸馏出来。这种大型语言模型包含额外的信息。包括各种语言,歌曲,中文,英语,日语和法语的数字诗。换句话说,大型语言本身并不是特别对于帮助驾驶,而是华为世界的行为是一个专门的帮助驾驶模型,并且同样有不必要的信息和数据要处理,因此,力量计算集中在空间推理和预测诸如TH的快速行为上E交通参与者的职位。 此外,华为还创建了许多决策专家,例如医院的专业咨询,每个专家仅研究他负责的特定情况。例如,大雨中有专家,狭窄的道路上有大师,而且游戏中有专家。分工非常明确。对于简单的情况,一两个专家可以解决这个问题,更多的专家咨询复杂情况。您认为,整个模型的培训可能需要3个月。在Moe中,每个专家只需要训练负责其零件,并且可以启动大约1周。哪种方案与各种专家的演奏相匹配,还可以节省计算的力量。 好的,以上是WEWA架构的介绍。几个小时前,我也尝试了M8 EV,并短暂地体验了广告4.0。最明显的感觉是面向安全的部分是村庄和城镇路。当Si时前人行横道的DE已满,汽车停放,SR接口将表明视力线被阻塞并降低速度,这也避免了行人或非运动试验的情况。但这并不能减慢每个人行横道的速度。线的两侧都没有临时停车。理解系统可以看到周围的参与者,并以正常的速度通过人行横道。 如果它是像WEWA体系结构或VLA这样的世界模型,那么将“大型模型”引入智能驾驶非常重要,但是该方法是不同的。 Thevla诞生于多模式融合的产物。在模型中打开了视觉和语言之类的信息,而世界模型路线则使用无数生成的数据为有限的经验创建了另一个团结概念。 Corner Casea在统计上较低的世界概率上,世界模型将事件变成训练中“高频事件”的低概率。可以是世界模型将权力推广到空间和数据水平,首先寻求稳定性然后寻求智能的援助,而VLA则提供了知识和提供者的概括的力量,在研究新事物方面具有相同和有效的效率。这两个目标有类似的目标和不同的道路。然后,所有的观众,您想要什么道路?实际上,最终,技术一体化的趋势,世界和VLA模型相互学习并走向现场。也许在不久的将来,汽车的大脑将同时具有“想象” +“语言智慧”。
购买咨询电话
400-123-4567