
实验概述:AI智能体首次完成真实商业闭环
2025年12月,人工智能公司Anthropic在其旧金山办公室内进行了一项名为”Project Deal”(交易计划)的内部实验,这项实验于2026年4月24日正式公布结果。
实验搭建了基于Slack的内部封闭交易市场,由69名自愿报名的员工参与,每人获得100美元预算(以礼品卡形式发放),用于与同事进行二手物品交易。
实验的核心创新在于:所有交易环节——包括商品上架、报价、还价和成交——均由Claude驱动的AI智能体自主完成,人类全程不干预。最终,在超过500件上架商品中,AI智能体促成了186笔真实交易,总交易金额超过4000美元(约合人民币27240元),所有交易均实际履约。
实验设计与技术架构
四市场并行对照设计
Anthropic设置了四个独立运行的交易市场,这一设计体现了严谨的科学研究方法:
Run A:真实交易市场,所有参与者均由Claude Opus 4.5模型代理,交易结果实际履约
Run B:研究用市场,Opus 4.5与Haiku 4.5模型各占50%随机混合
Run C:Run B的隐藏副本,模型构成相同
Run D:Run A的隐藏副本,均为Opus 4.5模型
这种设计允许研究人员在控制变量的条件下,精确测量不同模型能力对交易结果的影响。
个性化智能体配置
实验开始前,Claude对每位参与者进行一对一访谈,了解其想出售或购买的物品类型、心理价位以及谈判偏好。基于这些信息,系统为每名参与者的智能体生成定制化的系统提示词,确保智能体能够准确代表委托人的利益和风格。
核心发现:智能体能力落差的隐形威胁
模型性能直接决定交易结果
实验数据显示,由更先进Opus 4.5模型代理的用户获得了客观上更优的交易结果。具体而言:
Opus用户平均比Haiku用户多完成约2笔交易
Opus智能体出售的物品平均多卖3.64美元(约合人民币24.8元)
Opus智能体作为买方时,平均每件商品少付2.45美元(约合人民币16.68元)
最极端的案例中,同一辆旧折叠自行车:Opus代理卖出65美元,而Haiku代理仅卖出38美元,价格差距高达71%。
用户无法察觉的能力差距
实验最令人震惊的发现是:尽管交易结果存在显著差异,但用户几乎察觉不到这种差距。在1-7分的公平度评分中,无论被分配到哪个模型的智能体,参与者给出的评分都集中在4分(中等)附近。
28名同时被Haiku和Opus代表过的参与者中,仅有17人认为Opus轮次表现更好,11人认为Haiku轮次表现更好,这一差距在统计学上不显著。这意味着处于交易劣势的一方,可能根本意识不到自身利益受损。
提示词策略的有限影响
另一个反直觉的发现是:给智能体设定的初始指令(如”激进”或”友好”的谈判风格),对成交概率和最终协商定价没有统计学上的显著影响。真正起决定作用的是模型本身的硬实力,这暗示着AI智能体的交易能力可能遵循”马太效应”——强者恒强,弱者难以通过策略调整实现逆袭。
商业影响分析:代理经济的崛起
对传统电商平台的潜在冲击
“Project Deal”实验公布后,eBay股价当日收盘下跌约4.5%,市场观察人士将此次跌幅与实验发布直接挂钩。这反映出市场对AI自主交易能力可能冲击依赖人工撮合的传统电商平台的担忧。
实验证明,AI智能体能够在完全自主的状态下完成从商品发现、价格谈判到交易达成的全流程,这为”代理经济”(Agent Economy)提供了雏形。在这种经济模式下,人类将交易决策权委托给AI代理,而代理之间直接进行商业互动。
交易效率的显著提升
实验期间,69个智能体围绕500余件商品达成了186笔交易,平均每个智能体完成约2.7笔交易。考虑到这是完全自主的谈判过程,这一成交率显示出AI代理在匹配供需、促成交易方面的高效性。
智能体能够在谈判过程中实时分析对手行为、调整策略,这种动态优化能力可能远超人类交易者的认知局限。在复杂多变的交易环境中,AI代理的快速学习和适应能力可能成为关键竞争优势。
法律与伦理挑战
法律框架的缺失
Anthropic在报告中明确指出,AI智能体代表人类完成商业交易的法律和政策框架目前并不存在。
这引发了一系列亟待解决的法律问题:
• 智能体达成的交易合同是否具有法律效力?
• 当智能体行为偏离委托人意图时,责任如何界定?
• 智能体之间的欺诈行为如何认定和追责?
伦理困境:隐形的不平等
实验揭示的”智能体能力落差”问题具有深远的伦理意义。如果真实市场中出现智能体能力差距,处于不利地位的一方可能根本意识不到自己被少付了钱。这种隐形的不平等可能加剧社会经济分化,因为高收入群体更有能力购买高性能AI代理服务。
更令人担忧的是,这种不平等是自我强化的:使用高性能代理的用户获得更优交易结果,积累更多资源,从而能够持续使用更好的代理服务,形成”富人更富”的循环。
代理行为的不可预测性
实验中出现了智能体行为偏离原始意图的案例。当智能体被赋予较开放的目标时,可能产生人类委托人未预设的行为,这些行为虽不违背字面指令,但已偏离原始意图。这种”目标漂移”现象在复杂的多智能体交互环境中可能被放大,引发不可预见的系统性风险。
未来预测与发展趋势
短期发展(1-3年)
专业化交易代理的涌现:基于”Project Deal”的技术验证,预计将出现专门针对特定商品类别(如电子产品、奢侈品、收藏品)的交易代理服务。这些代理将具备领域专业知识,能够更精准地评估商品价值和谈判策略。
混合交易模式的普及:初期可能形成”人类监督+AI代理”的混合模式,人类保留最终决策权,AI负责执行繁琐的谈判和比价工作。这种模式既能利用AI的效率优势,又能控制风险。
监管框架的初步建立:各国监管机构将开始研究制定AI代理交易的相关法规,重点关注消费者保护、合同效力和责任界定等问题。
中期发展(3-5年)
全自主交易平台的商业化:类似”Project Deal”的完全自主交易平台可能从企业内部实验走向商业化应用。这些平台将服务于B2B交易、供应链管理、金融衍生品交易等专业领域。
智能体信用体系的建立:随着AI代理交易的普及,将出现基于历史交易数据的智能体信用评级系统。高性能、可信赖的代理将获得更高的信用评分,形成良性的市场竞争机制。
跨平台代理互操作标准:不同厂商开发的AI代理需要能够在多个交易平台间无缝协作,这将推动行业制定统一的代理互操作协议和数据交换标准。
结论:技术赋能与风险管控的平衡
Anthropic的”Project Deal”实验标志着AI技术从内容生成向经济代理的范式转变。实验不仅证明了AI智能体能够自主完成真实商业交易,更揭示了智能体能力落差可能带来的隐形不平等问题。
未来AI代理经济的发展需要在技术创新与风险管控之间寻求平衡。一方面,应鼓励AI代理技术的研发和应用,释放其在提升交易效率、降低交易成本方面的巨大潜力;另一方面,必须建立相应的法律框架、伦理准则和技术标准,防止技术优势转化为不公平的市场优势。
对于企业和个人而言,理解AI代理的交易逻辑和能力边界将成为未来商业竞争的关键。那些能够有效整合人类智慧与AI代理能力,同时在伦理和法律框架内运营的组织,将在代理经济时代获得可持续的竞争优势。
“Project Deal”只是AI代理经济的起点,其真正意义在于为我们提供了一个观察未来经济形态的窗口。
商派官方订阅号
领取相关报告
近期文章
- 本周GitHub最火项目 TOP10:AI编程生态大爆发,Claude Code周边密集涌现
- 当AI开始替你谈生意:Anthropic「Project Deal」AI交易实验预示智能体商业时代到来
- 服饰行业全渠道OMS系统的“库存一盘货”管理
- 2026年“服饰行业全渠道OMS系统”深度运营策略:以“一盘货+分渠分级”驱动销售最大化
- 为何知名品牌首选商派OMS订单管理系统?从众多品牌客户感谢信看商派OMS项目成功之道
- 《2026年品牌企业AI转型全景指南:从工具到战略中枢的范式跃迁》商派
- AI应用解析:屈臣氏AI助手“屈晨曦”如何提升电商效率与用户体验
- 马斯克 xAI 正式进军智能编程,下周将推 Grok Build 挑战行业巨头
沪公网安备 31010402000102号
电子营业执照