AI 前沿精选 #03: 多款国产大模型发布 deepseek-prover-v2、qwen3、mimo-7b
发布于 2025年5月5日
大模型
DeepSeek-Prover-V2 发布
DeepSeek 在 五一节前发布了 DeepSeek-Prover-V2,不同于通用的大模型,这个是一个专为形式化定理证明而设计的模型。
它更侧重于需要严格推理的场景,例如自动定理证明、复杂逻辑推演和数学问题求解。这种专业化特性使其在科研、工程等领域展现出独特的应用潜力。
这里有他的 DeepSeek-Prover-V2 Paper 地址
Qwen3 系列大模型发布,基准测试超越 DeepSeek
Qwen3 系列大模型发布,开源了两个 MoE 模型,六个 Dense 模型。
Qwen3-235B-A22B:拥有 2350 多亿总参数和 220 多亿激活参数的大模型,基准测试超越 DeepSeek-R1、o1,与 Gemini-2.5-Pro 不相上下。 Qwen3-30B-A3B:拥有约 300 亿总参数和 30 亿激活参数的小型 MoE 模型,基准测试超越 DeepSeek-V3。
Qwen3 模型支持思考模式(会逐步推理,经过深思熟虑后给出最终答案)和非思考模式(提供快速、近乎即时的响应)。 支持 119 种语言和方言。 还增强了的 Agent 能力、代码能力,同时也加强了对 MCP 的支持。
对于开发者,还提供了 Qwen-Agent ,内部封装了工具调用模板和工具调用解析器。
发布博客:Qwen3 Blog
在线体验:chat.qwen.ai
小米发布 MiMo-7B 系列大模型
MiMo-7B 系列模型 是专为推理任务而生的大型语言模型,通过预训练与训练后阶段的双重优化实现突破。
大量评估表明,MiMo-7B-Base 展现出卓越的推理潜力,性能甚至超越参数量达 320 亿的模型。经过强化学习调优的最终版本 MiMo-7B-RL,在数学、编程及通用推理任务中全面超越 OpenAI o1-mini。
Huggingface:Xiaomi MiMo
GPT-4o 应“性格”问题回滚
OpenAI 回滚了一项很有争议的 GPT-4o 更新,导致了模型表现得过度迎合与谄媚,甚至对用户明显错误或有害的想法也予以认同。
OpenAI 发现问题的根源在于过度的优化短期用户反馈(如点赞),而未充分考量长期交互质量。
官方对此进行了解释:Sycophancy in GPT-4o
提示词
Agent 系统提示词汇总
system-prompts-and-models-of-ai-tools 这个仓库汇集了 v0、Cursor、Manus、Same.dev、Lovable、Devin、Replit Agent、Windsurf Agent 和 VSCode Agent(以及其他开源)系统提示。
另外,我也写了一篇系统提示词拆解学习的文章可以学习:精读 Cursor、v0 提示词: 如何编写强大的 Agent 系统提示词
工具推荐
NotebookLM
NotebookLM 可以说是非常强大的学习助手、笔记工具。
他的常见用法:
- 上传材料,然后可以针对材料内容进行问答
- 基于材料生成学习指南、简报文档、常见问题解答、时间轴等功能
- 基于材料生成【对话形式】的音频,类似于播客,直接听音频学习
你可以将输出语言设置为中文,让输出内容更加符合你的习惯。
地址:NotebookLM
DeepWiki
DeepWiki 是 Devin 出的一个包含了所有 GitHub 存储库的免费百科全书。不仅仅是存储库的使用文档,还将其分解为了高级系统层次结构,现在不用看源码就可以快速了解一个仓库的架构。
地址:DeepWiki
秘塔 Al 今天学点啥
秘塔 Al 今天学点啥,可以一键将网站或文件分析成一个学习视频(AI 语音讲解+PPT)。
地址:秘塔 Al 今天学点啥