2025 AI 现状报告解读: 基于 100 万亿 tokens 数据分析
发布于 2025年12月3日
当我们在谈论 AI 的时候,我们在谈论什么?是跑分榜上的数字,还是推特上的热门演示?真正的真相往往隐藏在海量的实际使用数据中。OpenRouter 基于其平台上的 100万亿 Tokens 数据,发布了一份震撼的实证研究报告。 这份报告不仅揭示了“推理模型”如何吞噬算力,还打破了开源与闭源的刻板印象,更提出了一个有趣的“灰姑娘水晶鞋”效应。以下是主要发现的深度解读。
一、开源与闭源的博弈 —— 从垄断到百花齐放
过去一年,AI 生态最显著的变化就是开源模型(OSS)的崛起。

30% 的平衡点
虽然闭源模型(如 Anthropic 和 OpenAI 的产品)仍然占据主导地位,但开源模型的使用量已稳定占据总量的 30% 左右 。这说明开源不再只是“玩具”,它已经成为生产环境的重要组成部分。
中国开源模型
中国开源模型领域崛起,来自中国的模型表现尤为抢眼。2024年底,中国开源模型的份额还微不足道(约1.2%),但在 DeepSeek V3、Qwen 等强力模型的推动下,其份额曾一度攀升至全平台所有流量的近 30%。这反映了中国模型在高频迭代和质量上的巨大飞跃。
市场格局的碎片化
曾经,DeepSeek 一家独大,占据了开源流量的半壁江山。但在 2025 年夏天之后,市场出现了明显的“碎片化” 。如今,Qwen、Llama、Mistral、DeepSeek 等多家模型平分秋色,没有任何单一模型能占据超过 25% 的开源份额 。这对开发者是好消息:我们不再被单一模型绑定,有了更多选择。

“中杯”才是最香的
报告发现了一个有趣的趋势:“中型模型”正在崛起。小于15B参数的“小模型”使用量正在下降,而 15B-70B 参数的“中型模型”(如 Qwen2.5 Coder 32B)正在成为市场新宠。用户在寻找能力与效率的最佳平衡点。
二、Agentic Inference —— AI 使用方式的根本性转变
如果你觉得现在的 AI 变慢了,那是因为它在“思考”。

推理模型已占半壁江山
这是报告中最具冲击力的数据:推理优化模型(Reasoning Models)的使用量占比已经超过了 50% 。从 OpenAI 的 o1 到 DeepSeek R1,用户不再满足于简单的文本生成,而是需要模型进行多步逻辑推理。
提示词变长了 4 倍
自 2024 年初以来,每个请求的平均 Prompt(提示词)长度增长了近 4 倍,从 1.5k tokens 增加到了 6k tokens 以上 。这说明用户正在向 AI 投喂更复杂的上下文——代码库、长文档、对话历史。AI 正在从“聊天机器人”转变为“分析引擎”。
编程是核心驱动力
这种增长不是均匀分布的。编程类(Programming) 任务的 Prompt 长度是通用任务的 3-4 倍。开发者正在把整个文件甚至项目结构丢给 AI 进行调试和生成。
三、我们到底在用 AI 做什么?—— 编程与角色扮演的双重奏
抛开所有的商业包装,用户的实际行为非常诚实。

编程:从 11% 到 50% 的爆发
在所有模型的使用中,编程类请求的占比经历了爆炸式增长。从2025年初的 11% 飙升至最近的 50% 以上 。AI 辅助编程(Copilot 模式)已经成为开发者的标配。
角色扮演:开源模型的王牌
在开源模型(OSS)的使用中,角色扮演占据了超过 50% 的份额 。这不仅是闲聊,更包括复杂的游戏场景设定、互动小说和情感陪伴。开源模型因为其更宽松的内容限制和可定制性,成为了创意和娱乐的首选。
有趣的对比
Anthropic (Claude): 超过 80% 的流量用于编程和技术任务,是名副其实的“干活工具”。 DeepSeek: 大部分流量用于角色扮演和闲聊,具有极强的消费者粘性。 Google: 用途最杂,覆盖法律、科学、翻译等,像是一个通用百科全书。
四、地理与经济——亚洲崛起与价格弹性

亚洲市场的爆发
AI 的算力消费正在去中心化。亚洲地区的支出占比从最早的 13% 翻倍增长至 31% 。这不仅是因为亚洲在造模型,更是因为亚洲有着庞大的企业采纳和创新应用需求。
杰文斯悖论 (Jevons Paradox)
报告发现,AI 需求的价格弹性很弱,但存在明显的“杰文斯悖论”效应:当模型变得更便宜、更高效时,人们的总消耗量反而增加了 。便宜的模型(如 Gemini Flash 或 DeepSeek V3)被集成到了更多高频应用中,导致 Token 消耗量激增。
“高价区”与“平价区” 市场明显分层
高价高频区: 如 Claude 3.7 Sonnet,用户愿意为顶级的推理能力支付溢价。 低价高频区: 如 DeepSeek V3,以极致的性价比捕获了海量长文本和日常任务。
五、“灰姑娘的水晶鞋”效应——用户留存的秘密
这可能是报告中最具理论深度的部分。OpenRouter 提出了 “灰姑娘水晶鞋效应” (Cinderella Glass Slipper effect) 。

什么是水晶鞋效应?
当一个新模型(灰姑娘)出现,并完美解决了某类用户之前无法解决的痛点(穿上了水晶鞋),这批用户就会成为该模型的 “基石用户群” (Foundational Cohorts) 。即便后来出了更新的模型,这批用户往往也不会迁移,因为他们的工作流已经与该模型深度绑定 。
失败的案例
如果一个模型发布时没有解决任何新的“未解难题”,只是单纯的“够用”,它就无法通过“水晶鞋”测试,用户留存率会极低(如 Llama 4 Maverick 的某些表现) 。
DeepSeek 的“回旋镖”效应 (Boomerang Effect)
DeepSeek 的用户留存展现出了一种奇特的“回旋镖”形态:用户在使用一段时间后流失(可能是去尝试新模型),但在几个月后又重新回来 。这说明在对比了一圈后,用户发现还是 DeepSeek 在性价比或特定能力上最香。
结尾
AI 的下半场是“分工”。这份 100万亿 Token 的报告告诉我们,AI 市场并没有走向单一垄断,而是走向了复杂的多元生态。
- 对于开发者:没有万能的模型。你需要像组装乐高一样,用 Claude 写代码,用 DeepSeek 做文本处理,用 Gemini 做长文档分析。
- 对于企业:Agentic Inference(代理推理)是未来。别再只盯着简单的对话框,要开始思考如何让模型调用工具、进行多步思考来解决复杂问题。
2025年,AI 不再是神话,它是水电煤,是每一行代码,是每一个创意背后的引擎。
本文基于 OpenRouter 《State of AI》 2025年度报告解读。
原文阅读:https://openrouter.ai/state-of-ai
如果你觉得这篇文章对你有帮助,欢迎点赞、分享,你的支持是我持续创作的最大动力!