【AI日报】DeepSeek暂缓制裁、GLM-5.2开源冲击编码,AI Agent商业化与安全风险同日升温
今日AI热点集中在开源模型、AI Agent商业化、AI支付、具身智能与开源供应链安全:GLM-5.2、VibeThinker-3B和Qwen-Robot展示技术前沿,DeepSeek监管动向、AI支付授权与Mastra攻击提醒企业在拥抱AI时同步重视治理与风控。

DeepSeek暂未被美国列入实体清单,AI监管仍处观望窗口
美国方面暂未把DeepSeek、长鑫存储等一批中国科技企业加入Entity List,这让中美AI竞争的监管节奏出现短暂缓冲。对企业而言,这并不意味着风险消失,而是说明AI模型、芯片、数据与供应链仍会长期处在政策博弈之中。商派关注的企业数字化客户如果正在引入国产大模型或跨境AI服务,需要把合规、可替代模型、数据出境与供应商连续性纳入采购评估,而不是只看单次调用成本。
GLM-5.2开源权重发布,长程编码能力与成本优势成为焦点
Z.ai发布GLM-5.2,主打agentic coding、长程任务和百万级上下文窗口,并以MIT许可证开放权重。外部报道将其与GPT-5.5等闭源模型在长程编码基准上的表现和成本进行对比,强调企业可在自有或主权基础设施上部署,降低供应商锁定。对中国软件与零售科技公司来说,开源权重模型正在从“可玩”走向“可集成”,尤其适合代码生成、知识库问答、流程自动化等可控场景。
微博VibeThinker-3B引发小模型刷榜争议,基准可信度再次被审视
微博团队的VibeThinker-3B以仅30亿参数在数学、代码等推理测试中取得亮眼成绩,并引发AI社区对“小模型是否真的突破”与“benchmark是否被过度优化”的讨论。事件的价值不只在分数本身,而在于提醒企业采购AI能力时不能只看榜单名次。更稳妥的方法是把模型放进真实业务数据、真实流程和真实成本环境中评估,例如客服转化、商品运营、代码修复、报表生成等任务的准确率与可追责性。
逆矩阵完成超亿美元融资,通用世界模型窗口期被压缩到18个月
世界模型公司逆矩阵科技完成超亿美元种子++轮融资,并发布Physis-v0.1,方向覆盖具身智能、工业仿真、游戏物理和科学预测等场景。创始团队判断通用世界基座模型的关键窗口期已压缩至18个月,意味着资本和技术团队都在加速押注“能理解和预测物理世界”的模型。对零售与制造企业而言,世界模型短期未必直接落地到门店,但会影响数字孪生、供应链仿真、机器人巡检和自动化仓储的技术路线。
分子之心完成逾亿美元融资,AI蛋白质设计进入产业化验证阶段
由许锦波带队的分子之心完成A轮系列融资,累计融资逾亿美元,围绕MMFold、MMDesign和MoleculeOS建设AI蛋白质设计平台。AI制药和生物制造正从结构预测进入可设计、可验证、可交付的产业阶段,资本也开始更关注平台能否连接实验、生产和商业订单。虽然该方向距离商派核心电商业务较远,但它代表了AI从内容与办公工具进入硬科技研发基础设施的趋势。
阿里发布Qwen-Robot系列,具身大模型从看懂世界走向执行任务
阿里发布Qwen-Robot系列具身大模型,聚焦机器人在移动、观察、思考和执行之间的协同能力。具身智能的竞争重点正在从单点识别能力转向端到端任务完成,涉及视觉、语言、动作规划和真实环境反馈。对于零售行业,未来的价值可能出现在仓储拣选、门店巡检、货架识别、售后维修等环节,企业应提前梳理哪些物理流程可以被标准化为机器人任务。
AI支付竞速升温,支付宝、京东、微信都在重写“授权”规则
围绕AI替用户完成搜索、下单和支付,支付宝、京东、微信等平台正在探索新的AI支付与授权机制。真正的难题不是让AI点按钮,而是如何界定用户授权边界、交易风险、责任归属和可撤销机制。对商派客户来说,Agent式购物会重塑电商前台:未来消费者可能不是进入店铺逐页浏览,而是让AI代理直接比价、筛选和下单,品牌与平台需要提前准备结构化商品数据、可信评价和可被代理读取的服务规则。
Manus与Genspark收入快速增长,AI Agent开始接受商业化压力测试
AI Agent创业产品Manus和Genspark在巨头夹击下仍实现收入快速增长,说明用户愿意为“能完成任务”的AI工作流付费。Agent产品的商业化关键不再是聊天体验,而是能否稳定执行研究、检索、写作、表格、代码、投放等跨工具任务。企业数字化团队可以从低风险环节试点,例如销售线索整理、竞品监测、客服知识库维护、运营周报生成,再逐步接入订单和资金相关流程。
Anthropic暂停Claude Agent SDK按Token计费计划,Agent成本模型仍未定型
Anthropic暂缓Claude Agent SDK从固定/订阅模式转向按Token计费的计划,表示现阶段不做变更。这个动作反映出Agent类产品的成本结构仍在快速变化:长任务、多轮工具调用和后台执行会显著放大Token消耗,直接影响SaaS定价和企业预算。对计划接入Agent能力的公司来说,必须同时评估模型单价、任务成功率、重试成本、缓存策略和人工兜底,而不能只比较每百万Token价格。
Mastra npm组织遭供应链攻击,AI Agent框架生态敲响安全警钟
Mastra相关npm组织被曝遭供应链攻击,多个包被植入远程payload。AI Agent框架通常拥有访问代码仓库、浏览器、数据库、API密钥和内部文档的能力,一旦依赖链被污染,风险会比普通前端包更高。企业引入开源Agent框架时,应建立依赖锁定、包签名校验、最小权限、密钥隔离和沙箱执行机制,把AI创新纳入软件供应链安全治理。
GitHub Models停止向新客户开放,开发者AI平台路线继续调整
GitHub宣布GitHub Models不再向新客户开放,已有活跃客户暂不受影响,并建议新项目转向Azure AI Foundry。这个变化说明大厂AI平台正在收敛资源,把模型试用、托管、评测和企业级治理整合到更统一的云平台。对开发团队而言,选择AI开发基础设施时要关注迁移成本和生态绑定,尤其是模型网关、评测数据、权限体系和日志审计是否可迁移。
GitHub Code Quality即将GA,AI编程进入“质量治理”阶段
GitHub Code Quality计划在7月进入正式可用阶段,并支持组织级启用,预览阶段已有超过一万家企业使用。随着Copilot等AI编程工具普及,代码产量提升之后,企业更需要自动化质量门禁、覆盖率追踪、可维护性检查和安全扫描。AI编程的下一阶段不是让开发者少写代码,而是让平台能够持续识别AI生成代码的质量风险、重复逻辑和潜在漏洞。
Headroom、Ponytail、Codegraph等开源项目走红,开发者开始为AI节省Token
今日开源社区出现多款面向AI开发流程的新工具:Headroom通过压缩日志、工具输出和RAG chunks减少Token消耗,Ponytail尝试让AI Agent以更接近资深开发者的方式处理代码任务,Codegraph则用本地代码知识图谱帮助Claude Code、Codex、Gemini、Cursor等工具减少上下文浪费。这类项目共同指向一个趋势:当AI编码从演示走向日常使用,Token成本、上下文管理和代码理解质量会成为新的基础设施竞争点。
欧盟发布AI内容标注实践文件,生成式内容透明度进入倒计时
欧盟围绕AI Act透明度义务发布AI内容标注实践文件,覆盖deepfake、公共利益AI文本、人机交互提示和机器可读标记等场景。虽然具体执行仍需要行业适配,但内容平台、品牌营销和跨境电商都将面临更清晰的AI生成内容披露要求。商派客户在使用AI生成商品图、广告素材、短视频和客服内容时,应提前建立内部标注规则和素材留痕机制,避免未来合规成本集中爆发。
商派官方订阅号
领取相关报告
近期文章
- 【AI日报】DeepSeek暂缓制裁、GLM-5.2开源冲击编码,AI Agent商业化与安全风险同日升温
- 商派门店B2B订货系统解决方案:不止于下单,更是渠道数字化引擎
- 家电行业升级 = AI互动 + IP联名?泡泡玛特要做智能家电吗?
- AI日报:阿里Qwen-Robot三连发,GitHub AI容量承压,Agent基础设施升温
- AI大模型的“过敏原清单”公布!九大药方建立系统免疫
- 国家统计局:5月份国民经济运行总体平稳、向新向优!城镇调查失业率下降,居民消费价格温和上涨
- 【时尚日报】坦博尔IPO提速;Snow Peak重启中国;Ecoalf扭亏;Ferragamo加码香水
- 2026 年 618 电商节观察:低价补贴之后,品牌真正要拼的是全域经营能力
沪公网安备 31010402000102号
电子营业执照