868论坛

 找回密码
 注册账号
搜索
查看: 119|回复: 0
打印 上一主题 下一主题

DeepSeek引发AI地震,中国版“人造卫星时刻”降临?

[复制链接]
跳转到指定楼层
楼主
发表于 2025-2-12 22:43:50 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

来都来了,注册个账号留下你的评论吧。

您需要 登录 才可以下载或查看,没有帐号?注册账号

x
深度求索R1模型的横空出世,如同在平静的美国(United States)人工智能领域投下了一颗重磅炸弹。英伟达(NVIDIA)股价应声下跌,多家科技公司市值蒸发,有人惊呼:这是中美人工智能霸权争夺战的“斯普特尼克时刻”!美国(United States)人工智能行业是否真的需要重新洗牌?这一事件又引发了哪些值得深思的问题?美国(United States)科技界在人工智能领域的投资堪称天文数字。高盛(Goldman Sachs)估计,未来几年科技巨头、企业和公用事业公司将在支持人工智能的资本支出上投入约1万亿美元。然而,众多观察人士,包括麻省理工学院(MIT)经济学教授、诺贝尔经济学奖得主德隆·阿西莫格鲁(Daron Acemoglu),长期以来都在质疑美国(United States)人工智能投资与发展的方向。所有头部企业都遵循基本相同的策略,整个行业似乎把鸡蛋都放在同一个篮子里,痴迷于规模扩张,笃信“扩展法则”,假设向模型输入更多数据和算力就能解锁更强大的能力,甚至有人断言“规模就是一切”。在深度求索事件之前,美国(United States)公司不愿考虑替代方案,即放弃基于海量数据集预训练、用于预测序列中下一个词的基础模型。他们几乎只专注于扩散模型和旨在执行人类(或类人)任务的聊天机器人。而深度求索似乎更倚重强化学习、专家混合方法(使用多个更高效的小模型)、知识蒸馏和精细化思维链推理。据报道,这种策略使其能够以极小成本开发出具有竞争力的模型。德隆·阿西莫格鲁(Daron Acemoglu)认为,该事件暴露了美国(United States)人工智能行业的“群体思维”,对更廉价、更具前景的替代方案的视而不见,加上过度炒作,正如其与西蒙·约翰逊(Simon Johnson)合著的《权力与进步》中所预言的。
三个问题浮出水面:1、中国(China)是否正在实现弯道超车?深度求索的成就在于工程实践:将相同方法以更高效的方式组合运用。中国(China)企业和科研机构能否迈出下一步,开创具有颠覆性的技术、产品和路径,仍有待观察。
2、深度求索似乎不同于多数依赖政府资助或为政府开发技术的中国(China)人工智能企业。如果这家从对冲基金剥离的公司此前是在雷达之外运作,那么当其进入聚光灯下,其创造力与活力能否延续?
3、深度求索事件是否意味着美国(United States)出口管制等遏制中国(China)人工智能研究的措施已然失效?虽然深度求索使用较旧的低性能芯片训练了最新模型(V3和R1),但若要实现更大突破和扩展,可能仍需最尖端芯片。德隆·阿西莫格鲁(Daron Acemoglu)表示,美国(United States)零和策略既不现实也不明智。与美国(United States)同行相似,深度求索也渴望开发通用人工智能,而创建训练成本显著降低的模型可能改变游戏规则。尽管我们尚不掌握深度求索模型开发的全部细节,也不明确其成就对人工智能产业未来的全部意义,但这家中国(China)新锐企业戳破了科技界对规模扩张的执念,甚至可能动摇了其自满情绪。

Archiver|小黑屋|868论坛  

GMT+8, 2025-3-12 21:41 , Processed in 0.029924 second(s), 17 queries .

Powered by 868

© 2024-2025 868

快速回复 返回顶部 返回列表