DeepSeek引发AI地震，中国版“人造卫星时刻”降临？

即时国际 · 发表于 2025-2-12 22:43:50

来都来了，注册个账号留下你的评论吧。

您需要登录才可以下载或查看，没有帐号？注册账号

x

深度求索R1模型的横空出世，如同在平静的美国（United States）人工智能领域投下了一颗重磅炸弹。英伟达（NVIDIA）股价应声下跌，多家科技公司市值蒸发，有人惊呼：这是中美人工智能霸权争夺战的“斯普特尼克时刻”！美国（United States）人工智能行业是否真的需要重新洗牌？这一事件又引发了哪些值得深思的问题？美国（United States）科技界在人工智能领域的投资堪称天文数字。高盛（Goldman Sachs）估计，未来几年科技巨头、企业和公用事业公司将在支持人工智能的资本支出上投入约1万亿美元。然而，众多观察人士，包括麻省理工学院（MIT）经济学教授、诺贝尔经济学奖得主德隆·阿西莫格鲁（Daron Acemoglu），长期以来都在质疑美国（United States）人工智能投资与发展的方向。所有头部企业都遵循基本相同的策略，整个行业似乎把鸡蛋都放在同一个篮子里，痴迷于规模扩张，笃信“扩展法则”，假设向模型输入更多数据和算力就能解锁更强大的能力，甚至有人断言“规模就是一切”。在深度求索事件之前，美国（United States）公司不愿考虑替代方案，即放弃基于海量数据集预训练、用于预测序列中下一个词的基础模型。他们几乎只专注于扩散模型和旨在执行人类（或类人）任务的聊天机器人。而深度求索似乎更倚重强化学习、专家混合方法（使用多个更高效的小模型）、知识蒸馏和精细化思维链推理。据报道，这种策略使其能够以极小成本开发出具有竞争力的模型。德隆·阿西莫格鲁（Daron Acemoglu）认为，该事件暴露了美国（United States）人工智能行业的“群体思维”，对更廉价、更具前景的替代方案的视而不见，加上过度炒作，正如其与西蒙·约翰逊（Simon Johnson）合著的《权力与进步》中所预言的。
三个问题浮出水面：1、中国（China）是否正在实现弯道超车？深度求索的成就在于工程实践：将相同方法以更高效的方式组合运用。中国（China）企业和科研机构能否迈出下一步，开创具有颠覆性的技术、产品和路径，仍有待观察。
2、深度求索似乎不同于多数依赖政府资助或为政府开发技术的中国（China）人工智能企业。如果这家从对冲基金剥离的公司此前是在雷达之外运作，那么当其进入聚光灯下，其创造力与活力能否延续？
3、深度求索事件是否意味着美国（United States）出口管制等遏制中国（China）人工智能研究的措施已然失效？虽然深度求索使用较旧的低性能芯片训练了最新模型（V3和R1），但若要实现更大突破和扩展，可能仍需最尖端芯片。德隆·阿西莫格鲁（Daron Acemoglu）表示，美国（United States）零和策略既不现实也不明智。与美国（United States）同行相似，深度求索也渴望开发通用人工智能，而创建训练成本显著降低的模型可能改变游戏规则。尽管我们尚不掌握深度求索模型开发的全部细节，也不明确其成就对人工智能产业未来的全部意义，但这家中国（China）新锐企业戳破了科技界对规模扩张的执念，甚至可能动摇了其自满情绪。

		自动登录	找回密码
密码			注册账号