Anthropic Economic Index Report: Economic Primitives

来源元数据

字段
发布方 Anthropic
日期 2026-01-15
作者 Ruth Appel, Maxim Massenkoff, Peter McCrory, Miles McCain, Ryan Heller, Tyler Neylon, Alex Tamkin
来源 URL https://www.anthropic.com/research/anthropic-economic-index-january-2026-report
格式 PDF 报告
归档副本 99-archive/research-reports/anthropic/Economic-Index_v4_2026.01.14_g.pdf
证据 ID E110, E111, E112, E113, E114, E115, E116, E117, E118

相关事实

事实 原始位置 证据 ID 研究维度
报告分析了 100 万条 Claude.ai Free、Pro 和 Max 对话随机样本,以及 100 万条第一方 API 记录。 第 17 页,注 1 E110 sample_scope
Claude.ai 和 1P API 样本均来自 2025 年 11 月 13-20 日。 第 17 页,注 1 E110 sample_period
报告提出五类 economic primitives:任务复杂度、人类和 AI 技能、工作/课程/个人用途、AI 自主性和任务成功率。 第 19 页,AI 使用维度 E110 measurement_framework
2025 年 11 月,前 10 个 O*NET 任务占 Claude.ai 使用的 24%,高于上一份报告的 23% 和 2025 年 1 月的 21%。 第 5 页,概览;第 6 页,模式变化 E111 task_concentration
对 1P API 企业客户而言,前 10 个任务在 2025 年 11 月占流量的 32%,高于 2025 年 8 月的 28%。 第 5 页,概览;第 6 页,模式变化 E111 task_concentration
修改软件以纠正错误是 2025 年 11 月最常见的任务,占 Claude.ai 使用的 6%,也占 1P API 记录的十分之一。 第 6-7 页,模式变化 E111 coding_tasks
2025 年 11 月,计算机和数学类任务占 Claude.ai 对话的 34%,占 1P API 流量的 46%。 第 7 页,图 1.2 讨论 E111 occupation_task_mix
对 API 客户而言,办公和行政支持任务在 2025 年 11 月上升 3 个百分点,达到 13%。 第 8-9 页,图 1.2 讨论 E112 enterprise_back_office
报告列举的 1P API 示例包括个性化 B2B 陌生销售邮件、商务邮件回复、发票处理系统、邮件分类和日程安排。 第 18 页,注 4 E112 enterprise_back_office
在 Claude.ai 上,增强型对话在 2025 年 11 月上升到 52%,自动化对话下降到 45%。 第 5 页和第 9 页,协作模式讨论 E113 augmentation_automation
Claude.ai 上的 directive 对话从 2025 年 8 月的 39% 下降到 2025 年 11 月的 32%。 第 9 页,协作模式讨论 E113 automation_mode
API 使用中 74% 与工作相关,64% 为 directive,约四分之三属于自动化;相比之下,Claude.ai 使用中 46% 与工作相关。 第 26 页,Claude.ai 与 API 比较 E113 enterprise_automation
在 Claude.ai 样本中,整体使用为 46% 工作用途、19% 课程用途和 35% 个人用途。 第 26 页,用途部分 E114 use_case_mix
软件开发请求中 64% 与工作相关;个人生活管理请求中这一比例为 17%。 第 25-26 页,图 2.2 和用途讨论 E114 use_case_mix
报告称,无论全球还是美国,Claude.ai 使用主要与工作相关。 第 29 页,地理章节 E114 work_use
综合多份报告,49% 的岗位已经在至少四分之一任务中出现 AI 使用。 第 43 页,有效 AI 覆盖部分 E115 occupational_task_coverage
报告把 effective AI coverage 定义为 Claude 可成功完成的工作日比例,并按任务成功率和劳动者花在各任务上的时间占比加权。 第 43 页,有效 AI 覆盖部分 E115 occupational_task_coverage
数据录入员、医学转录员和放射科医生在 effective AI coverage 排名中上升,因为被覆盖任务是其工作中耗时或高频的部分。 第 44-45 页,有效 AI 覆盖讨论 E115 occupational_task_coverage
对 Claude.ai 而言,要求低于高中教育水平的任务成功率约为 70%;大学水平对话的成功率约为 66%。 第 39 页,任务加速讨论 E116 task_success
API 任务成功率从耗时一小时以内任务的约 60%,下降到预计人类需要五小时以上任务的约 45%。 第 41 页,任务时长部分 E116 task_horizon
拟合后的 API 成功率曲线在 3.5 小时时穿过 50%;类似外推下 Claude.ai 的估计约为 19 小时。 第 42 页,任务时长部分 E116 task_horizon
Claude 覆盖任务的平均预测教育年限为 14.4 年,而 O*NET 全经济任务平均为 13.2 年。 第 46 页,任务内容部分 E117 skill_content
在任务移除练习中,报告发现净 deskilling 效应,因为 Claude 覆盖任务通常比剩余任务需要更高教育水平。 第 46-47 页,任务内容部分 E117 skill_content
报告把技术写作者、旅行代理和若干教学职业列为 deskilling 示例,把房地产经理列为 upskilling 示例。 第 46-47 页,任务内容部分 E117 skill_content
在可靠性调整前,报告复现了未来十年美国劳动生产率年增速隐含提高 1.8 个百分点的估计;Claude.ai 和 1P API 样本均为这一结果。 第 48-49 页,生产率部分 E118 productivity_estimate
按任务成功率调整后,生产率估计从每年 1.8 个百分点降至 Claude.ai 使用的 1.2 个百分点和 API 流量的 1.0 个百分点。 第 48 页,生产率部分 E118 productivity_estimate
在任务互补性 sigma = 0.5 且按任务成功率调整时,隐含生产率效应下降到 Claude.ai 的 0.8 个百分点和 API 的 0.6 个百分点。 第 50 页,图 4.6 讨论 E118 productivity_estimate

范围说明

  • 报告使用隐私保护方法分析 Claude.ai 和第一方 API 数据。
  • 观察单元是对话或 API prompt-response 记录,不是劳动者、团队、公司员工数或岗位广告。
  • 1P API 样本被描述为主要属于企业使用,但报告没有提供具名客户的人力结果。
  • 报告早于 Opus 4.5,并说明数据是在其发布前不久收集的。
  • 报告的任务成功率指标来自分类器输出,被描述为方向上准确,而非精确测量。