国产大模型DeepSeek通义千问小米大模型AI学习工具

AI 前沿精选 #03: 多款国产大模型发布 deepseek-prover-v2、qwen3、mimo-7b

May 5th, 2025

大模型

DeepSeek-Prover-V2 发布

DeepSeek 在五一节前发布了 DeepSeek-Prover-V2，不同于通用的大模型，这个是一个专为形式化定理证明而设计的模型。

它更侧重于需要严格推理的场景，例如自动定理证明、复杂逻辑推演和数学问题求解。这种专业化特性使其在科研、工程等领域展现出独特的应用潜力。

这里有他的 DeepSeek-Prover-V2 Paper 地址

Qwen3 系列大模型发布，基准测试超越 DeepSeek

Qwen3 系列大模型发布，开源了两个 MoE 模型，六个 Dense 模型。

Qwen3-235B-A22B：拥有 2350 多亿总参数和 220 多亿激活参数的大模型，基准测试超越 DeepSeek-R1、o1，与 Gemini-2.5-Pro 不相上下。 Qwen3-30B-A3B：拥有约 300 亿总参数和 30 亿激活参数的小型 MoE 模型，基准测试超越 DeepSeek-V3。

Qwen3 模型支持思考模式（会逐步推理，经过深思熟虑后给出最终答案）和非思考模式（提供快速、近乎即时的响应）。支持 119 种语言和方言。还增强了的 Agent 能力、代码能力，同时也加强了对 MCP 的支持。

对于开发者，还提供了 Qwen-Agent ，内部封装了工具调用模板和工具调用解析器。

发布博客：Qwen3 Blog

在线体验：chat.qwen.ai

小米发布 MiMo-7B 系列大模型

MiMo-7B 系列模型是专为推理任务而生的大型语言模型，通过预训练与训练后阶段的双重优化实现突破。

大量评估表明，MiMo-7B-Base 展现出卓越的推理潜力，性能甚至超越参数量达 320 亿的模型。经过强化学习调优的最终版本 MiMo-7B-RL，在数学、编程及通用推理任务中全面超越 OpenAI o1-mini。

Huggingface：Xiaomi MiMo

技术报告：MiMo-7B-Technical-Report

GPT-4o 应“性格”问题回滚

OpenAI 回滚了一项很有争议的 GPT-4o 更新，导致了模型表现得过度迎合与谄媚，甚至对用户明显错误或有害的想法也予以认同。

OpenAI 发现问题的根源在于过度的优化短期用户反馈（如点赞），而未充分考量长期交互质量。

官方对此进行了解释：Sycophancy in GPT-4o

提示词

Agent 系统提示词汇总

system-prompts-and-models-of-ai-tools 这个仓库汇集了 v0、Cursor、Manus、Same.dev、Lovable、Devin、Replit Agent、Windsurf Agent 和 VSCode Agent（以及其他开源）系统提示。

另外，我也写了一篇系统提示词拆解学习的文章可以学习：精读 Cursor、v0 提示词: 如何编写强大的 Agent 系统提示词

工具推荐

NotebookLM

NotebookLM 可以说是非常强大的学习助手、笔记工具。

他的常见用法：

上传材料，然后可以针对材料内容进行问答
基于材料生成学习指南、简报文档、常见问题解答、时间轴等功能
基于材料生成【对话形式】的音频，类似于播客，直接听音频学习

你可以将输出语言设置为中文，让输出内容更加符合你的习惯。

地址：NotebookLM

DeepWiki

DeepWiki 是 Devin 出的一个包含了所有 GitHub 存储库的免费百科全书。不仅仅是存储库的使用文档，还将其分解为了高级系统层次结构，现在不用看源码就可以快速了解一个仓库的架构。

地址：DeepWiki

秘塔 Al 今天学点啥

秘塔 Al 今天学点啥，可以一键将网站或文件分析成一个学习视频（AI 语音讲解+PPT）。

地址：秘塔 Al 今天学点啥

国产大模型DeepSeek通义千问小米大模型AI学习工具

AI 前沿精选 #03: 多款国产大模型发布 deepseek-prover-v2、qwen3、mimo-7b

May 5th, 2025

大模型

DeepSeek-Prover-V2 发布

DeepSeek 在五一节前发布了 DeepSeek-Prover-V2，不同于通用的大模型，这个是一个专为形式化定理证明而设计的模型。

这里有他的 DeepSeek-Prover-V2 Paper 地址

Qwen3 系列大模型发布，基准测试超越 DeepSeek

Qwen3 系列大模型发布，开源了两个 MoE 模型，六个 Dense 模型。

对于开发者，还提供了 Qwen-Agent ，内部封装了工具调用模板和工具调用解析器。

发布博客：Qwen3 Blog

在线体验：chat.qwen.ai

小米发布 MiMo-7B 系列大模型

MiMo-7B 系列模型是专为推理任务而生的大型语言模型，通过预训练与训练后阶段的双重优化实现突破。

Huggingface：Xiaomi MiMo

技术报告：MiMo-7B-Technical-Report

GPT-4o 应“性格”问题回滚

OpenAI 回滚了一项很有争议的 GPT-4o 更新，导致了模型表现得过度迎合与谄媚，甚至对用户明显错误或有害的想法也予以认同。

OpenAI 发现问题的根源在于过度的优化短期用户反馈（如点赞），而未充分考量长期交互质量。

官方对此进行了解释：Sycophancy in GPT-4o

提示词

Agent 系统提示词汇总

system-prompts-and-models-of-ai-tools 这个仓库汇集了 v0、Cursor、Manus、Same.dev、Lovable、Devin、Replit Agent、Windsurf Agent 和 VSCode Agent（以及其他开源）系统提示。

另外，我也写了一篇系统提示词拆解学习的文章可以学习：精读 Cursor、v0 提示词: 如何编写强大的 Agent 系统提示词

工具推荐

NotebookLM

NotebookLM 可以说是非常强大的学习助手、笔记工具。

他的常见用法：

上传材料，然后可以针对材料内容进行问答
基于材料生成学习指南、简报文档、常见问题解答、时间轴等功能
基于材料生成【对话形式】的音频，类似于播客，直接听音频学习

你可以将输出语言设置为中文，让输出内容更加符合你的习惯。

地址：NotebookLM

DeepWiki

地址：DeepWiki

秘塔 Al 今天学点啥

秘塔 Al 今天学点啥，可以一键将网站或文件分析成一个学习视频（AI 语音讲解+PPT）。

地址：秘塔 Al 今天学点啥

On this page

AI 前沿精选 #03: 多款国产大模型发布 deepseek-prover-v2、qwen3、mimo-7b

大模型

DeepSeek-Prover-V2 发布

Qwen3 系列大模型发布，基准测试超越 DeepSeek

小米发布 MiMo-7B 系列大模型

GPT-4o 应“性格”问题回滚

提示词

Agent 系统提示词汇总

工具推荐

NotebookLM

DeepWiki

秘塔 Al 今天学点啥

On this page

AI 前沿精选 #03: 多款国产大模型发布 deepseek-prover-v2、qwen3、mimo-7b

大模型

DeepSeek-Prover-V2 发布

Qwen3 系列大模型发布，基准测试超越 DeepSeek

小米发布 MiMo-7B 系列大模型

GPT-4o 应“性格”问题回滚

提示词

Agent 系统提示词汇总

工具推荐

NotebookLM

DeepWiki

秘塔 Al 今天学点啥