近日,马斯克与xAI团队ag百家乐官网,在直播中致密发布了最新版块Grok3。

此前,马斯克将Grok-3描述为“地球上最聪慧的AI”。他在X平台上示意:“我方所有这个词周末齐在和团队打磨产物。”

但是据媒体报谈,有东谈主测试了最新的Beta版Grok3,并建议了阿谁经典的用来刁难大模子的问题:“9.11与9.9哪个大?”缺憾的是,在不加任何定语以及标注的情况下,堪称现在最聪慧的Grok3,仍然无法正确修起这个问题。

值得一提的是,用通常的问题商讨DeepSeek时,岂论是否开启深度念念考(R1)面目,对方齐给出了正确的谜底:9.9大于9.11。

“9.11和9.9哪个大”是AI限制的一个经典问题。

艾伦酌量机构(AllenInstitute)成员林禹臣曾在酬酢媒体平台上发布的截图炫耀,ChatGPT-4o在修起中以为13.11比13.8更大。“一方面AI越来越擅长作念数学奥赛题,但另一方面知识依旧很难。”他示意。

随后ScaleAI的辅导工程师莱利·古德赛德(RileyGoodside)基于此灵感变换了问法,拷问了可能是那时最强的大模子ChatGPT-4o、谷歌GeminiAdvanced以及Claude3.5Sonnet——9.11和9.9哪个更大?这几家主流大模子通通答错,他也告捷将此话题传播开来。

国外主流大模子答题。图源:第一财经

Grok-3发布会的布景板上,写着"ourmissionistounderstanduniverse(咱们的处事是了解天地)"。马斯克曾示意,xAI公司的办法便是“了解天地”。

在一周前,ag百家乐开奖马斯克在直播中指摘DeepSeekR1时,曾信心满满地示意“xAI行将推出更优秀的AI模子”。从现场展示的数据来看,Grok3在数学、科学与编程的基准测试上依然卓绝了现在所有的主流模子,马斯克以致宣称Grok3将来将用于SpaceX火星任务计算,并量度“三年内将达成诺贝尔奖级别阻止”。

xAI在X平台直播,马斯克到场。图源:中国新闻周刊

马斯克强调,Grok-3不错减少AI幻觉,方法是通过往还检查数据并尝试达成逻辑一致性。他还炫耀,测验Grok-3所使用的算力远多于此前的版块,并使用了大批合成数据。

不同于DeepSeek的算法优化旅途(DeepSeek-V3用2048个H800GPU,测验2788千小时),xAI炫耀,Grok-3的诞生的收获于用8个月技术建成的Colossus超等计算机,它由10万个英伟达的H100GPU开首,为测验提供了2亿个GPU小时,比Grok-2多十多倍。

此外,xAI文书推出名为Deepsearch的Grok-3智能搜索引擎,名字和Deepseek颇有几分相似。

审核:方雨ag百家乐官网