发布日期:2024-01-28 22:11 点击次数:196
DeepSeek 的热度,终究如故被车圈蹭上了。
就在这几天,当我们还在跟 DeepSeek 互喷作事器沉重的时候, N 个国内的车企就跟筹商好了似的,先是岚图,后是极氪,紧接着即是、宝骏和昨天的比亚迪。
之后以致东说念主传东说念主到了斑马智行和亿咖通这些作念车机的企业,都一个接一个的示意,自家的产物也曾和 DeepSeek 最新的 R1 模子合体了。
而就在脖子哥写作的时候,这个名单还在变长。
不知说念大伙咋想啊,归正我在看到这些音书的时候,脑子里即是一连串的问号:
把 DeepSeek 用在车上有啥意旨?他们说的深度交融到底是个啥体式?车载版块的 DeepSeek 和网页版又有啥区别?
固然最进攻的灵魂拷问是,这些车企们,到底是不是仅仅为了营销的热度在硬蹭 DeepSeek ?
你别说,在狠狠讨论了一番以后哥们也曾有论断了。说东说念主话即是, DeepSeek 的告捷对汽车行业照实灵验,但根柢不是上面这些车企这样用的。
至于为啥,我们稳重来看。
领先第一个问题,车企们是若何把 DeepSeek 放到车上的?
不错服气的是,环球都莫得剿袭在车机里装 app 这种最直给的面目。因为从各路新闻稿里不错看到,环球都提到了 DeepSeek-R1 模子和自有模子在底层算法上的交融,部份品牌还提到了模子蒸馏的时期。
再加上一家名叫想必驰的云霄大模子作事公司,前一阵也官宣了我方在云霄模子里交融了 DeepSeek 模子,给像是长城、这样的车企提供云霄 AI 助手的因循。
基本不错细目咫尺上车的 DeepSeek-R1 ,简略率会是以下两种体式之一:
一是通过 DeepSeek 的 MIT 开源契约,在自家的作事器上叮嘱满血版或是蒸馏后的 R1 模子,然后通过微调交融,和自家原有的模子酿成一总共这个词大模子。车主呢,则是通过车机联网来使用这个大模子的交流功能。
第二种则是通过蒸馏的面目,把 R1 压缩成一个体积很是小的小模子然后更新到车端,让车主就算不联网,也能用上 DeepSeek 的一部分功能。
这两种面目说到底,即是给这些车上原来的 AI 模子上了一个 DeepSeek 的 buff ,让它领有一部分 R1 的能力。
那这些模子是用来干啥的呢?其实。。。即是能让语音助手提及话来更有东说念主味辛勤。
是不是认为有点没趣,是的,因为近似的功能也曾在许多新势力车型上杀青了。
比如之前很火设想 MindGPT 和蔚来的 NomiGPT ,对话疏通啥的不仅比传统的语音助手更通顺,一些比较综合的问题,比如 “ 凿壁偷光需要判几年 ” 这种弱智吧问题,能答上来的概率也能相对高点。
但要我说啊,这种用法根柢就没发达出 DeepSeek-R1 模子的能力,改善用车体验啥的就更别指望了。
你问为啥?
要知说念, DeepSeek 的 R1 模子之是以产生了这样大的颠簸,开源是一方面,最进攻的如故它在考试的时候,很 big 胆的使用了强化学习 + 奖励模子的面目,最终领路出了超强的推理能力,很是允洽解决贫瘠的逻辑问题。
打个譬如啊,高中班里有俩同学 A 和 B ,濒临合并王人数学题, A 的作念法是隐世无争的用多样公式,一步步鲁人持竿的解题。而 B 则是管你公式这那的,我方靠着之前作念过的超多题目,我方摸索出一个解法。
而这个解法,很有可能就会比硬套公式来的高效的多。就跟我们学了高级数学再且归作念高中的题似的,平直就秒了。
久而久之,比较死记公式的 A , B 同学就更能连结问题和谜底之间的逻辑相干,在濒临没见过的复杂问题,比如巨难的数学和编程问题的时候,也能更快、更准确的推理出正确的谜底。
而这个 B 对应的,其实即是 DeepSeek-R1 的纯强化学习的考试样式。
不需要像以往的监管学习一样一直用端正来微合资修正,只靠着作念对了就奖励,让 AI 我方阐述推导进程。
这时候再回到车上的语音助手,问题就来了,ag百家乐因为我们根柢不会问它什么太复杂的问题,酌定即是问问天气放放歌啥的。
这些功能就算不是 DeepSeek 这种级别的妄言语模子,其实也都能解决的七七八八。只消你不是开车开一半倏得就问语音助手:
那在体验上简略率就不会和现存的车载大模子有太大的鉴别。
再加上经过蒸馏和交融之后的小模子,能力对比满血版有着不小的阉割,关于我方本来就有我方的大模子的车企来说,再加一个 DeepSeek 果真没啥必要。
是以啊,那些霸道喊出 DeepSeek 标语的车企们,我的评价是热门么服气是想蹭的, DeepSeek 上车的执行效果,服气也远莫得宣传里那么邪乎,大伙不错坐下了。
固然,要是车企本来在座舱 AI 上有短板,能靠着开源的 DeepSeek-R1 作念作念查缺补漏,让自家的模子追上一线新势力的水平,照实也不是什么赖事。
可就像我发轫说的, DeepSeek 要是仅仅拿来作念语音助手的话,那属实是有点蹧跶了。毕竟它更大的后劲,其实是在智能驾驶上。
就这样说吧,甭管是很火的端到端如故端正算法,要是能更多的用上 DeepSeek 的强化学习样式,偶而就能让能力往上提升一大截。
真不是我吹啊,大伙还铭刻前头作念题的同学 A 和 B 么,其实近似的道理在智能驾驶上也雷同配置。
咫尺简直总共的主流智能驾驶其实即是阿谁隐世无争的同学 A ,在考试模子的时候都是师法学习为主。师法嘛,顾名想义即是让智驾算法能跟众人的活动示范对应,也即是师法东说念主类开车。
比如特斯拉、比亚迪和华为,就都会从驾驶评分比较高的车主那鸠合驾驶数据,比如录像头拍的视频喂给算法,讨论车主们若何从 A 点开到 B 点,再进行一个师法。
很昭着,这种想路到头来考试出的即是跟东说念主类开车水平抓平的智驾。但强化学习则王人备不同,因为它学习的不是驾驶的进程,而是通过不休的试错,阐述出从 A 点开到 B 点最高效的阶梯。
而这个阐述的上限,可不就仅仅能让智驾开得像东说念主了。
要知说念智驾系统关于环境的感知能力,其实比我们东说念主类司机强许多。当我们过路口的时候还在东观西望看前后傍边有莫得不容物的时候,智驾通过车上多样的录像头和雷达只消刹那间就能看个简略。
当我们只可单线程的先不雅察、后打灯、再变说念的时候,智驾也能在合并时分用一个操作处分。
表面上,只消学习和阐述到位,智驾就能推理、追想出许多比东说念主类司机效力更高、更能诈欺好多样车辆性能的驾驶面目。许多我们认为很难、用师法学习咋学都学不会的小众场景,强化学习可能分分钟就能处分。
都说咫尺的智驾是刚拿驾照司机的水平,用上强化学习之后,指不定真就会酿成有了十几年驾龄的超绝老司机。
固然了,表面终究是表面,想要在智驾考试里大范围的用上强化学习,依旧有不少难点和瓶颈。
就比如,强化学习的试错进程需要盛大的算力资源,关于国内许多需要租算力作念智驾的企业来说其实不太能搞得定。
再比如强化学习很容易出现的幻觉问题,我们有时候在用满血 DeepSeek 的时候会等闲发现它搁那无稽之谈,执行上即是因为强化学习学的有些魔怔了,开动领路出一些不顺应事实的内容。
智驾算法亦然如斯,要是奖励和微调的机制莫得规画到位,就很有可能幻想出 “ 需要开到天上 ” 的开法。
就算不出现幻觉,也可能出现急加快、猛刹车这种赛说念开法。效力是高了,但谁的脖子和腰顶得住啊?这就需要车企破耗许多元气心灵规画奖励模子,何况通过一些微调步伐来抑制 AI 的发达,这就很是进修主机厂的算法能力了。
即使是贼早开行为念智驾的特斯拉,也独一在很是少的公开贵寓里示意我方有在部分模块里有限的使用了强化学习。
可见难度是实打实的,而且还不小。
但我认为啊,想要信得过让智驾的能力再上一层楼,多用强化学习服气是各家明天的大见解。把强化学习的效力作念到大范围的落地,明天可能亦然继把智驾作念到白菜价以外,各家车企和供应商们 battle 的下一个战场。
这不比作念语音助手啥的专门想多了嘛。
撰文:致命空枪
剪辑:脖子右拧 & 面线
好意思编:三狗
图片、贵寓着手:
比亚迪智驾阶梯发布会
smart 汽车完成 DeepSeek 大模子交融,精灵 5 号近期 OTA 推送
Tesla's Autonomous Driving Strategy Stranded By Technological Divergence
想必驰官方网站
微博 @不是郑小康、X