金句媲美雷军!罗福莉首次站台小米演讲,揭秘MiMo大模型和背后团队

智东西12-17 11:48

智东西

作者 | 云鹏

编辑 | 李水青

罗福莉加入小米后的首次公开演讲,来了!

智东西12月17日北京现场报道,刚刚,小米举办了年度“人车家全生态”合作伙伴大会,现场人头攒动座无虚席,展区不少展台都已被围观人群挤满,讨论热度颇高。

小米创始人兼CEO雷军此次并未来到现场,小米集团合伙人、集团总裁卢伟冰率先登台演讲,今天第三位演讲的是当前备受关注的原DeepSeek核心成员、被业内称为“天才少女”的罗福莉,她现在的职位是小米MiMo大模型负责人。

罗福莉在演讲过程中虽然稍显紧张,但她抛出的海量金句却句句令人印象深刻:

·AI正以非线性的方式重演人类大脑6亿年的进化史;

·语言是人类思维和物理世界在符号空间的“投影”;

·下一代智能体系统不是一个“语言模拟器”,而是一个真正理解我们世界、并与之共存的“智能体”;

·相比生物演化的稳固根基,AI的发展是“空中楼阁”;

·AI进化的下个起点,一定是有一个能跟物理世界交互的模型;

·算力和数据也并非最终的护城河,真正的护城河,是科学的研究文化与方法,是将未知问题结合模型优化转化为可用产品的能力;

·开源的价值本质上是一种分布式的技术加速主义;

·开源是实现AGI的普惠化,是确保所有人类的智慧共同进化的唯一路径;

在演讲中,罗福莉首次明确解读了小米打造Agent语言基座模型的三个核心方向,解读了新模型背后的多项关键技术突破。对小米如何通向AGI,罗福莉也明确了小米的路径。

除了AI大礼包,今天会上,卢伟冰也分享了小米整体业务的诸多亮点。

卢伟冰说,2025年是小米“大发展”的一年,今年前三季度,小米收入同比增长32.5%,超过了3400亿元,经调整利润同比增长73.5%,其中手机销量中国市场1-10月排名第二。

未来五年,小米集团研发投入预计将超过2000亿元,2026年预计研发投入在400亿左右。

小米人车家生态究竟包括什么?卢伟冰这次给出详细拆解:

产品包括个人设备、出行设备、家庭设备;

核心技术包括芯片、OS、AI;

智能制造包括手机、汽车、大家电工厂;

什么是小米当前聚焦的核心,一目了然。

在大家最关心的AI方面,小米自研MiMo系列大模型家族赫然呈现:推理大模型、视觉推理大模型、原生端到端音频生成模型、端侧视觉语言大模型、具身大模型。

一个月前的11月12日,罗福莉在朋友圈正式官宣加入小米Xiaomi MiMo团队。就在昨晚,小米刚刚发布了最新的MiMo大模型MiMo-V2-Flash,性能媲美DeepSeek-V3.2,这也是罗福莉加入后MiMo团队亮出的首个新成果。

一、罗福莉首次解读小米大模型三个重点方向,算力和数据并非最终护城河

罗福莉一上台就回到了“6亿年前”,她说,AI正以非线性的方式重演人类大脑6亿年的进化史。

为什么大模型“智能”起源于语言?在罗福莉看来,语言是人类思维和物理世界在符号空间的“投影”,而大模型成功解码了人类思维在文本空间的投影。

小米从“语言”出发,构建了面向Agent时代的语言基座模型MiMo-V2-Flash。

在小米看来,超强的代码和工具调用能力是Agent沟通的高效“语言”,围绕极致推理效率设计的模型结构是“高带宽”的Agent协作的关键,全新后训练范式则能够保证高效稳定的扩展强化学习训练。

这三个方面是小米聚焦的重点。

罗福莉特别提到,MiMo-V2-Flash模型并不大,但在代码和Agent测评基准测试中已经达到全球开源模型TOP2。

MiMo-V2-Flash的推理效率是其突出优势,在全球大致相同水位的顶尖模型速度和成本象限里,MiMo-V2-Flash实现了低成本和高速度优势。

具体来看,小米围绕极致推理效率来设计模型结构,采用了Hybrid SWA架构,固定KV Cache,增强长文推理,此外,团队采用3层MTP推理加速并行Token验证,实现推理速度2-2.6倍的提升。

在全新后训练范式方面,团队采用了Dense&Token-Level的强化学习。

当前MiMo-V2-Flash已经初步具备了模拟世界的能力,比如通过HTML写操作系统、模拟太阳系、画一颗圣诞树。

今天发布会现场,罗福莉宣布MiMo-V2-Flash发布即开源,模型权重、技术报告都开源,API限时免费。

对于未来的Agent发展,罗福莉提到,下一代智能体系统,不是一个“语言模拟器”,而是一个真正理解我们世界、并与之共存的“智能体”。

Agent执行从“回答问题”到“完成任务”,具有记忆、推理、自主规划、决策、执行的能力。

Omni感知统一多模态感知,为AI理解物理世界打下基础,嵌入眼镜等智能终端、融入日常工作流。

在通往AGI的路上,罗福莉团队希望补全缺失的演化拼图,单纯Scaling UP参数量不够,他们要让LLM回到“演化课堂”,补上它跳过的关键学习步骤。

简单来说,他们非常看重AI与真实世界的交互,强调多模态。

罗福莉特别提到,相比生物演化的稳固根基,AI的发展有些像“空中楼阁”。在她看来,AI进化的下个起点,一定是有一个能跟物理世界交互的模型。

AI不仅要看懂画面,还要理解背后的物理规律;AI不仅要推理文本,而是理解世界的运作逻辑。

罗福莉说,这一观点并非共识,行业中也有不少人认为语言就可以实现最终的AGI,比如Ilya。

在她看来,算力和数据也并非最终的护城河,真正的护城河,是科学的研究文化与方法,是将未知问题结合模型优化转化为可用产品的能力。

罗福莉现场也开启了“招聘会”,她提到,小米大模型Core团队是研究、产品与工程深度耦合的年轻团队,“小而美”却充满创业精神,他们极度好奇、追求真理。

罗福莉提到,在她刚刚开始研究时,开源模型与顶尖模型的代差有三年,而今天这一差距已经缩短到了“数月”。

他们相信开源的价值,开源的价值本质上是一种分布式的技术的加速的主义。在罗福莉看来,开源是实现AGI的普惠化,是确保所有人类的智慧共同进化的唯一路径。

未来,从数据的极致压缩,到算法的范式创新,再到与物理空间的深度链接,小米与全球AI共同定义未来。

95后罗福莉本科就读于北京师范大学计算机专业,硕士毕业于北京大学计算语言学研究所计算语言学专业。她曾在阿里巴巴达摩院主导开发了多语言预训练模型VECO,并推动了AliceMind的开源工作,2022年入职DeepSeek,参与了MoE大模型DeepSeek-V2的研发。

集诸多光环于一身,来到小米的罗福莉,其动向一直是业内关注的焦点。

结语:猛攻Agent基座模型,小米人车家生态全力冲刺AI

AI,显然是整场小米生态大会围绕的核心关键词。

面向AI未来,小米的机会点显然不止于AI手机,手机、PC、穿戴、IoT、汽车,小米人车家全生态均能与AI深度融合,小米在大模型方面的AI基础能力提升则进一步加速了这一进程。

卢伟冰近日曾提到,小米AI大模型业务过去投入持续增长,“AI与现实世界深度融合”已被列为小米未来十年核心战略。显然,面对AI这场硬仗,小米已经做好准备All in,“兵马和粮草”都在加码筹备。

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Comments

We need your insight to fill this gap
Leave a comment