
2025年5月,全球AI领域迎来重磅更新——阿里巴巴开源新一代通义千问模型Qwen3(简称千问3),以参数量仅为DeepSeek-R1的1/3、成本大幅下降的优势,性能全面超越DeepSeek-R1、OpenAI-o1等顶尖模型,登顶全球最强开源模型。与此同时,Meta推出独立AI应用对标ChatGPT,小米开源首个推理大模型Xiaomi MiMo,工信部也宣布加强大模型研发布局,AI行业竞争进入白热化阶段。
阿里千问3:全球最强开源模型的三大突破
-
混合推理架构,算力消耗大幅降低
千问3是国内首个“混合推理模型”,将“快思考”(低算力秒回简单问题)与“慢思考”(多步骤深度推理复杂问题)集成于同一模型,显著节省算力。其采用混合专家(MoE)架构,总参数量235B,但激活仅需22B,部署成本仅为同类模型的1/3。 -
性能全面领先,多项评测刷新纪录
• AIME25奥数测评:81.5分,超越OpenAI-o1(79.2分)和DeepSeek-R1(70.0分)。 • LiveCodeBench代码能力评测:70.7分,超过Grok3(70.6分)。 • 多语言支持:覆盖119种语言,包括斯瓦西里语等低资源语种。 -
低成本部署,加速AI应用落地
仅需4张H20显卡即可部署满血版千问3,显存占用降低67%,适合企业端、云服务及移动设备。
Meta入局AI助手大战:社交化AI应用挑战ChatGPT
Meta正式推出独立AI应用Meta AI,基于自研Llama 4模型,主打社交化功能:
• Discover信息流:展示用户与AI的互动内容,支持点赞、评论和二次创作,增强社交属性。
• 全双工语音模式:支持实时打断、重叠对话,体验更接近真人交流。
• 未来商业化:计划推出付费套餐和广告,探索盈利模式。
小米开源MiMo-7B:小参数碾压大模型
小米首次公开推理大模型Xiaomi MiMo-7B,主打高效推理能力:
• 7B参数超越32B模型:在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)中,得分超过OpenAI o1-mini和阿里QwQ-32B。
• 强化学习优化:通过Test Difficulty Driven Reward算法,解决训练中的奖励稀疏问题,RL训练速度提升2.29倍。
• 端侧部署:轻量化设计适配手机、智能硬件,推动AI落地消费电子场景。
政策与行业动态
- 工信部加强大模型布局:推动通用和行业大模型研发,建设工业数据集,加速AI赋能制造业。
- 首部AI翻译指南发布:中国译协发布《生成式AI翻译应用指南》,规范人机协同翻译流程。
- 复古硬件运行AI:研究者成功在1982年Commodore 64电脑上运行简化版Llama2模型,展示AI的极致优化潜力。
结语
阿里千问3的发布标志着中国开源模型站上全球巅峰,而Meta和小米的入局则预示AI应用竞争将更趋多元化。随着政策支持与技术迭代,2025年或成为AI普惠落地的关键转折点。
商派官方订阅号
领取相关报告
近期文章
相关文章
产品推荐
- B2B/B2B2b/S2B2B数字化系统 经销商订货管理数字化解决方案