Anthropic Economic Index Report: Economic Primitives

来源元数据

字段	值
发布方	Anthropic
日期	2026-01-15
作者	Ruth Appel, Maxim Massenkoff, Peter McCrory, Miles McCain, Ryan Heller, Tyler Neylon, Alex Tamkin
来源 URL	https://www.anthropic.com/research/anthropic-economic-index-january-2026-report
格式	PDF 报告
归档副本	`99-archive/research-reports/anthropic/Economic-Index_v4_2026.01.14_g.pdf`
证据 ID	E110, E111, E112, E113, E114, E115, E116, E117, E118

相关事实

事实	原始位置	证据 ID	研究维度
报告分析了 100 万条 Claude.ai Free、Pro 和 Max 对话随机样本，以及 100 万条第一方 API 记录。	第 17 页，注 1	E110	sample_scope
Claude.ai 和 1P API 样本均来自 2025 年 11 月 13-20 日。	第 17 页，注 1	E110	sample_period
报告提出五类 economic primitives：任务复杂度、人类和 AI 技能、工作/课程/个人用途、AI 自主性和任务成功率。	第 19 页，AI 使用维度	E110	measurement_framework
2025 年 11 月，前 10 个 O*NET 任务占 Claude.ai 使用的 24%，高于上一份报告的 23% 和 2025 年 1 月的 21%。	第 5 页，概览；第 6 页，模式变化	E111	task_concentration
对 1P API 企业客户而言，前 10 个任务在 2025 年 11 月占流量的 32%，高于 2025 年 8 月的 28%。	第 5 页，概览；第 6 页，模式变化	E111	task_concentration
修改软件以纠正错误是 2025 年 11 月最常见的任务，占 Claude.ai 使用的 6%，也占 1P API 记录的十分之一。	第 6-7 页，模式变化	E111	coding_tasks
2025 年 11 月，计算机和数学类任务占 Claude.ai 对话的 34%，占 1P API 流量的 46%。	第 7 页，图 1.2 讨论	E111	occupation_task_mix
对 API 客户而言，办公和行政支持任务在 2025 年 11 月上升 3 个百分点，达到 13%。	第 8-9 页，图 1.2 讨论	E112	enterprise_back_office
报告列举的 1P API 示例包括个性化 B2B 陌生销售邮件、商务邮件回复、发票处理系统、邮件分类和日程安排。	第 18 页，注 4	E112	enterprise_back_office
在 Claude.ai 上，增强型对话在 2025 年 11 月上升到 52%，自动化对话下降到 45%。	第 5 页和第 9 页，协作模式讨论	E113	augmentation_automation
Claude.ai 上的 directive 对话从 2025 年 8 月的 39% 下降到 2025 年 11 月的 32%。	第 9 页，协作模式讨论	E113	automation_mode
API 使用中 74% 与工作相关，64% 为 directive，约四分之三属于自动化；相比之下，Claude.ai 使用中 46% 与工作相关。	第 26 页，Claude.ai 与 API 比较	E113	enterprise_automation
在 Claude.ai 样本中，整体使用为 46% 工作用途、19% 课程用途和 35% 个人用途。	第 26 页，用途部分	E114	use_case_mix
软件开发请求中 64% 与工作相关；个人生活管理请求中这一比例为 17%。	第 25-26 页，图 2.2 和用途讨论	E114	use_case_mix
报告称，无论全球还是美国，Claude.ai 使用主要与工作相关。	第 29 页，地理章节	E114	work_use
综合多份报告，49% 的岗位已经在至少四分之一任务中出现 AI 使用。	第 43 页，有效 AI 覆盖部分	E115	occupational_task_coverage
报告把 effective AI coverage 定义为 Claude 可成功完成的工作日比例，并按任务成功率和劳动者花在各任务上的时间占比加权。	第 43 页，有效 AI 覆盖部分	E115	occupational_task_coverage
数据录入员、医学转录员和放射科医生在 effective AI coverage 排名中上升，因为被覆盖任务是其工作中耗时或高频的部分。	第 44-45 页，有效 AI 覆盖讨论	E115	occupational_task_coverage
对 Claude.ai 而言，要求低于高中教育水平的任务成功率约为 70%；大学水平对话的成功率约为 66%。	第 39 页，任务加速讨论	E116	task_success
API 任务成功率从耗时一小时以内任务的约 60%，下降到预计人类需要五小时以上任务的约 45%。	第 41 页，任务时长部分	E116	task_horizon
拟合后的 API 成功率曲线在 3.5 小时时穿过 50%；类似外推下 Claude.ai 的估计约为 19 小时。	第 42 页，任务时长部分	E116	task_horizon
Claude 覆盖任务的平均预测教育年限为 14.4 年，而 O*NET 全经济任务平均为 13.2 年。	第 46 页，任务内容部分	E117	skill_content
在任务移除练习中，报告发现净 deskilling 效应，因为 Claude 覆盖任务通常比剩余任务需要更高教育水平。	第 46-47 页，任务内容部分	E117	skill_content
报告把技术写作者、旅行代理和若干教学职业列为 deskilling 示例，把房地产经理列为 upskilling 示例。	第 46-47 页，任务内容部分	E117	skill_content
在可靠性调整前，报告复现了未来十年美国劳动生产率年增速隐含提高 1.8 个百分点的估计；Claude.ai 和 1P API 样本均为这一结果。	第 48-49 页，生产率部分	E118	productivity_estimate
按任务成功率调整后，生产率估计从每年 1.8 个百分点降至 Claude.ai 使用的 1.2 个百分点和 API 流量的 1.0 个百分点。	第 48 页，生产率部分	E118	productivity_estimate
在任务互补性 sigma = 0.5 且按任务成功率调整时，隐含生产率效应下降到 Claude.ai 的 0.8 个百分点和 API 的 0.6 个百分点。	第 50 页，图 4.6 讨论	E118	productivity_estimate

范围说明

报告使用隐私保护方法分析 Claude.ai 和第一方 API 数据。
观察单元是对话或 API prompt-response 记录，不是劳动者、团队、公司员工数或岗位广告。
1P API 样本被描述为主要属于企业使用，但报告没有提供具名客户的人力结果。
报告早于 Opus 4.5，并说明数据是在其发布前不久收集的。
报告的任务成功率指标来自分类器输出，被描述为方向上准确，而非精确测量。