【AI日报】阶跃星辰Step 3.5 Flash登顶OpenRouter;清华0.8B模型刷榜直逼7B;美团AI「小团」全量上线;Anthropic发布金融Agent十件套;Gemma 4推理速度翻3倍
1. **阶跃星辰Step 3.5 Flash登顶OpenRouter,开源模型首次霸榜**
阶跃星辰发布的新模型Step 3.5 Flash在OpenRouter平台实现调用量登顶,成为首个在该榜单霸榜的开源模型。这标志着国产开源模型在推理效率和实际部署性价比上已获得全球开发者认可。
Step 3.5 Flash采用稀疏MoE架构,在保持较强推理能力的同时大幅降低推理成本,使其更适合大规模API调用场景。OpenRouter作为全球最大的模型路由平台之一,其调用量数据直接反映开发者对模型实用性的真实投票。此次登顶不仅是阶跃星辰的技术突破,也预示着开源模型在全球AI基础设施中的话语权正在快速提升。
2. **清华团队0.8B模型刷榜,销毁10万块GPU后的逆袭**
清华大学团队在经历大规模算力消耗后,成功训练出仅0.8B参数的模型,性能却直逼7B级别模型。据披露,团队在研发过程中累计消耗超过10万块GPU的算力资源,最终通过创新的模型架构设计和训练策略,实现了参数效率的极致优化。
该模型在多个基准测试中表现出色,证明小模型通过算法优化仍可在特定任务上媲美大模型。这一成果对边缘计算、端侧AI部署具有重要参考价值,意味着在算力受限场景下也能获得接近大模型的智能水平。
3. **美团AI「小团」全量上线,本地生活进入智能体时代**
美团正式全量上线AI助手「小团」,这是国内首个深度整合本地生活服务的AI Agent。小团能够理解用户复杂的本地服务需求,自动完成商家筛选、优惠券匹配、路径规划、预订下单等全流程操作。与通用对话AI不同,小团直接对接美团生态内的数百万商家和数亿SKU,具备实时库存查询、动态定价感知、个性化推荐等能力。美团此举标志着本地生活服务从”人找服务”向”服务找人”的范式转变,AI Agent正在成为连接用户与万亿级本地生活市场的新入口。
4. **Anthropic发布金融Agent十件套,Claude攻入华尔街**
Anthropic推出面向金融服务和保险行业的十个即用型Agent模板,覆盖投研、客户覆盖、财务运营等核心场景。这些模板以插件形式集成到Claude Cowork和Claude Code中,同时提供Claude Managed Agents的Cookbook,使企业能在数天内将Claude部署到实际金融工作中,而非数月。模板涵盖投研领域的Pitchbook构建、可比公司分析、财报审阅,以及运营领域的KYC审查、总账对账、月度结账等。Anthropic同步推出Microsoft 365插件,支持Claude在Excel、PowerPoint、Word和Outlook间无缝流转上下文。配合Claude Opus 4.7在Vals AI金融Agent基准测试中64.37%的领先成绩,Anthropic正快速渗透金融服务业这一高价值市场。
5. **Google Gemma 4引入多令牌预测,推理速度提升3倍**
Google发布Gemma 4系列模型的多令牌预测(MTP)草案器技术,通过推测解码实现高达3倍的推理加速,同时保持输出质量不下降。该技术允许模型在单次前向传播中预测多个未来令牌,配合KV缓存共享机制,在消费级GPU上即可运行26B MoE和31B Dense版本的Gemma 4。相关代码已在Hugging Face和Kaggle开源,支持LiteRT-LM、MLX、Hugging Face Transformers和vLLM等主流推理框架。这一技术突破显著降低了高性能AI模型的部署门槛,使开发者在笔记本或消费级显卡上也能获得接近数据中心的推理体验。
6. **全双工语音Agent开源,2小时完成对话式AI搭建**
一个全新的开源全双工语音Agent项目在GitHub发布,开发者可在2小时内完成具备实时双向对话能力的AI系统搭建。该系统突破传统轮次对话限制,支持自然打断、实时响应、背景噪音处理等全双工语音交互核心能力。项目提供了完整的工具链和示例代码,涵盖语音活动检测、流式语音识别、低延迟语音合成等模块,可直接集成到客服、陪伴、教育等场景。全双工语音交互是下一代人机交互的关键技术,此次开源将大幅降低企业和开发者构建实时语音AI的门槛。
7. **Windows 11积极更新节奏调整,Win12或提前发布**
微软正在调整Windows 11的更新策略,加速功能迭代节奏,这一变化被业内解读为Windows 12可能提前发布的信号。据透露,微软正在将更多AI能力深度整合到操作系统核心层,包括本地大模型推理、语义搜索、智能调度等功能。Windows 11的更新频率提升意味着微软正在为下一代操作系统的核心技术进行提前验证。随着AI PC市场的快速成长,微软需要在操作系统层面提供更强的AI原生支持,以对抗macOS在创意和专业领域的竞争压力。Win12的提前布局也反映出微软对AI时代操作系统话语权的迫切争夺。
8. **Meta CEO扎克伯格亲批版权侵权,出版商集体诉讼升级**
最新法庭文件披露,Meta CEO马克·扎克伯格亲自授权并鼓励公司使用受版权保护的内容训练AI模型,这一消息使针对Meta的版权侵权集体诉讼进一步升级。
出版商联盟指控Meta在训练Llama系列模型时大规模盗用书籍、文章等版权内容,而扎克伯格的直接参与将使Meta难以以”技术不可避免性”为由进行抗辩。该案判决结果将对整个AI行业的训练数据合规实践产生深远影响,可能迫使AI公司重新评估数据获取策略,并推动建立更规范的版权授权机制。
9. **Coinbase裁员14%,加密货币交易所的AI替代潮**
Coinbase CEO布莱恩·阿姆斯特朗宣布裁员约14%,这是加密货币行业在AI自动化浪潮下的又一波人事调整。阿姆斯特朗表示,AI工具已能替代大量运营、合规、客户支持等岗位的工作,公司需要在保持竞争力的同时优化成本结构。
Coinbase的裁员反映出AI技术正在重塑金融科技行业的就业结构——不是通过大规模替代,而是通过提升单兵作战能力来实现人力精简。这一趋势在金融科技、加密货币交易平台等数字化程度较高的领域尤为明显,传统的中后台岗位面临最大的替代压力。
10. **Chrome静默安装4GB AI模型引发隐私争议**
Google Chrome被曝在用户不知情的情况下,静默安装约4GB的Gemini Nano AI模型到用户设备,且即使用户手动删除,Chrome仍会自动重新下载。这一行为引发隐私倡导者的强烈抗议,认为其违反欧盟ePrivacy指令和GDPR的相关规定。以Chrome数十亿用户规模计算,单次模型推送的碳排放量高达6000-60000吨CO2当量,环境成本同样不容忽视。此事再次引发关于科技巨头是否有权在用户设备上部署大型AI模型的讨论,也凸显了AI普及过程中的隐私与可持续性双重挑战。
11. **AI基础设施成本曝光:Computer Use比结构化API贵45倍**
最新研究显示,基于视觉的Computer Use方案(让AI像人一样操作电脑界面)的成本是结构化API方案的45倍。这一惊人差距源于Computer Use需要截图、OCR、视觉理解等高开销操作,而结构化API直接调用后端服务,效率高出数十倍。研究报告指出,企业应谨慎评估哪些场景真正需要Computer Use,避免为不必要的”拟人化”付出巨额成本溢价。对于大多数自动化任务,精心设计的API集成仍是更经济、更可靠的选择。这一发现可能促使AI应用开发者重新思考Agent架构的设计取舍。
12. **金融Agent性能基准Vals AI发布,Claude Opus 4.7领跑**
Vals AI发布专门针对金融Agent的评测基准,覆盖投研分析、风险评估、合规审查等核心金融场景。Anthropic的Claude Opus 4.7以64.37%的综合得分领跑行业,展现出在金融专业任务上的显著优势,包括复杂财务建模、多文档交叉验证、监管合规判断等。该基准的推出填补了金融AI评测的空白,为金融机构选择AI供应商提供了量化依据。随着AI在金融领域的渗透加速,专业领域基准将取代通用基准,成为衡量模型商业价值的核心指标。
今日要点速览:阶跃星辰Step 3.5 Flash登顶OpenRouter开源榜首;清华0.8B小模型刷榜直逼7B性能;Anthropic十款金融Agent模板攻入华尔街;Google Gemma 4推理速度翻3倍;Meta版权侵权诉讼因扎克伯格亲批而升级;Chrome静默安装4GB AI模型引发全球隐私争议。
商派官方订阅号
领取相关报告
近期文章
- 【AI日报】马斯克庭审失态承认蒸馏OpenAI;1930年AI竟会写代码;DeepSeek V4遗漏Engram引热议;具身智能仿真框架GS-Playground开源
- AI浪潮下的“逆行者”:亚马逊云 CEO为何痛批用AI替代初级员工是“最蠢主意”?预防人才传承“断头铡”!
- 破局全渠道“五座大山”:商派OMS订单系统破解库存割裂与履单困局
- 【时尚日报】中国黄金承压、Swatch治理博弈、FILA网球童装与Vinted估值升温
- OMS订单管理系统常见问题FAQ:全渠道订单、库存、履约与售后的一次讲清
- 四大元老离职,俞敏洪疯狂发钱稳军心!300名员工获“人均百万”天价激励,总值约4.79亿元
- 五一开始,北京禁飞禁售无人机!大疆全面撤出,无人机迎来“强监管”时代
- 开云投资宝兰黄金;Qeelin推出首个香水系列;依视路AI眼镜贡献超传统品类;二手时尚交易平台Vinted估值80亿欧元;贝泰妮营收53.6亿元
沪公网安备 31010402000102号
电子营业执照