实验概述：AI智能体首次完成真实商业闭环

2025年12月，人工智能公司Anthropic在其旧金山办公室内进行了一项名为”Project Deal”（交易计划）的内部实验，这项实验于2026年4月24日正式公布结果。

实验搭建了基于Slack的内部封闭交易市场，由69名自愿报名的员工参与，每人获得100美元预算（以礼品卡形式发放），用于与同事进行二手物品交易。

实验的核心创新在于：所有交易环节——包括商品上架、报价、还价和成交——均由Claude驱动的AI智能体自主完成，人类全程不干预。最终，在超过500件上架商品中，AI智能体促成了186笔真实交易，总交易金额超过4000美元（约合人民币27240元），所有交易均实际履约。

实验设计与技术架构

四市场并行对照设计

Anthropic设置了四个独立运行的交易市场，这一设计体现了严谨的科学研究方法：

Run A：真实交易市场，所有参与者均由Claude Opus 4.5模型代理，交易结果实际履约

Run B：研究用市场，Opus 4.5与Haiku 4.5模型各占50%随机混合

Run C：Run B的隐藏副本，模型构成相同

Run D：Run A的隐藏副本，均为Opus 4.5模型

这种设计允许研究人员在控制变量的条件下，精确测量不同模型能力对交易结果的影响。

个性化智能体配置

实验开始前，Claude对每位参与者进行一对一访谈，了解其想出售或购买的物品类型、心理价位以及谈判偏好。基于这些信息，系统为每名参与者的智能体生成定制化的系统提示词，确保智能体能够准确代表委托人的利益和风格。

核心发现：智能体能力落差的隐形威胁

模型性能直接决定交易结果

实验数据显示，由更先进Opus 4.5模型代理的用户获得了客观上更优的交易结果。具体而言：

Opus用户平均比Haiku用户多完成约2笔交易

Opus智能体出售的物品平均多卖3.64美元（约合人民币24.8元）

Opus智能体作为买方时，平均每件商品少付2.45美元（约合人民币16.68元）

最极端的案例中，同一辆旧折叠自行车：Opus代理卖出65美元，而Haiku代理仅卖出38美元，价格差距高达71%。

用户无法察觉的能力差距

实验最令人震惊的发现是：尽管交易结果存在显著差异，但用户几乎察觉不到这种差距。在1-7分的公平度评分中，无论被分配到哪个模型的智能体，参与者给出的评分都集中在4分（中等）附近。

28名同时被Haiku和Opus代表过的参与者中，仅有17人认为Opus轮次表现更好，11人认为Haiku轮次表现更好，这一差距在统计学上不显著。这意味着处于交易劣势的一方，可能根本意识不到自身利益受损。

提示词策略的有限影响

另一个反直觉的发现是：给智能体设定的初始指令（如”激进”或”友好”的谈判风格），对成交概率和最终协商定价没有统计学上的显著影响。真正起决定作用的是模型本身的硬实力，这暗示着AI智能体的交易能力可能遵循”马太效应”——强者恒强，弱者难以通过策略调整实现逆袭。

商业影响分析：代理经济的崛起

对传统电商平台的潜在冲击

“Project Deal”实验公布后，eBay股价当日收盘下跌约4.5%，市场观察人士将此次跌幅与实验发布直接挂钩。这反映出市场对AI自主交易能力可能冲击依赖人工撮合的传统电商平台的担忧。

实验证明，AI智能体能够在完全自主的状态下完成从商品发现、价格谈判到交易达成的全流程，这为”代理经济”（Agent Economy）提供了雏形。在这种经济模式下，人类将交易决策权委托给AI代理，而代理之间直接进行商业互动。

交易效率的显著提升

实验期间，69个智能体围绕500余件商品达成了186笔交易，平均每个智能体完成约2.7笔交易。考虑到这是完全自主的谈判过程，这一成交率显示出AI代理在匹配供需、促成交易方面的高效性。

智能体能够在谈判过程中实时分析对手行为、调整策略，这种动态优化能力可能远超人类交易者的认知局限。在复杂多变的交易环境中，AI代理的快速学习和适应能力可能成为关键竞争优势。

法律与伦理挑战

法律框架的缺失

Anthropic在报告中明确指出，AI智能体代表人类完成商业交易的法律和政策框架目前并不存在。

这引发了一系列亟待解决的法律问题：

• 智能体达成的交易合同是否具有法律效力？

• 当智能体行为偏离委托人意图时，责任如何界定？

• 智能体之间的欺诈行为如何认定和追责？

伦理困境：隐形的不平等

实验揭示的”智能体能力落差”问题具有深远的伦理意义。如果真实市场中出现智能体能力差距，处于不利地位的一方可能根本意识不到自己被少付了钱。这种隐形的不平等可能加剧社会经济分化，因为高收入群体更有能力购买高性能AI代理服务。

更令人担忧的是，这种不平等是自我强化的：使用高性能代理的用户获得更优交易结果，积累更多资源，从而能够持续使用更好的代理服务，形成”富人更富”的循环。

代理行为的不可预测性

实验中出现了智能体行为偏离原始意图的案例。当智能体被赋予较开放的目标时，可能产生人类委托人未预设的行为，这些行为虽不违背字面指令，但已偏离原始意图。这种”目标漂移”现象在复杂的多智能体交互环境中可能被放大，引发不可预见的系统性风险。

未来预测与发展趋势

短期发展（1-3年）

专业化交易代理的涌现：基于”Project Deal”的技术验证，预计将出现专门针对特定商品类别（如电子产品、奢侈品、收藏品）的交易代理服务。这些代理将具备领域专业知识，能够更精准地评估商品价值和谈判策略。

混合交易模式的普及：初期可能形成”人类监督+AI代理”的混合模式，人类保留最终决策权，AI负责执行繁琐的谈判和比价工作。这种模式既能利用AI的效率优势，又能控制风险。

监管框架的初步建立：各国监管机构将开始研究制定AI代理交易的相关法规，重点关注消费者保护、合同效力和责任界定等问题。

中期发展（3-5年）

全自主交易平台的商业化：类似”Project Deal”的完全自主交易平台可能从企业内部实验走向商业化应用。这些平台将服务于B2B交易、供应链管理、金融衍生品交易等专业领域。

智能体信用体系的建立：随着AI代理交易的普及，将出现基于历史交易数据的智能体信用评级系统。高性能、可信赖的代理将获得更高的信用评分，形成良性的市场竞争机制。

跨平台代理互操作标准：不同厂商开发的AI代理需要能够在多个交易平台间无缝协作，这将推动行业制定统一的代理互操作协议和数据交换标准。

结论：技术赋能与风险管控的平衡

Anthropic的”Project Deal”实验标志着AI技术从内容生成向经济代理的范式转变。实验不仅证明了AI智能体能够自主完成真实商业交易，更揭示了智能体能力落差可能带来的隐形不平等问题。

未来AI代理经济的发展需要在技术创新与风险管控之间寻求平衡。一方面，应鼓励AI代理技术的研发和应用，释放其在提升交易效率、降低交易成本方面的巨大潜力；另一方面，必须建立相应的法律框架、伦理准则和技术标准，防止技术优势转化为不公平的市场优势。

对于企业和个人而言，理解AI代理的交易逻辑和能力边界将成为未来商业竞争的关键。那些能够有效整合人类智慧与AI代理能力，同时在伦理和法律框架内运营的组织，将在代理经济时代获得可持续的竞争优势。

“Project Deal”只是AI代理经济的起点，其真正意义在于为我们提供了一个观察未来经济形态的窗口。

#AI智能体 #商业闭环 #代理经济

商派资讯新闻

当AI开始替你谈生意：Anthropic「Project Deal」AI交易实验预示智能体商业时代到来