868论坛

 找回密码
 注册账号
搜索
查看: 123|回复: 0
打印 上一主题 下一主题

“AI教母”李飞飞20美元炼成AI模型,力压OpenAI与Deepseek?

[复制链接]
跳转到指定楼层
楼主
发表于 2025-2-11 16:23:51 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

来都来了,注册个账号留下你的评论吧。

您需要 登录 才可以下载或查看,没有帐号?注册账号

x
人工智能领域再起波澜!“AI教母”李飞飞(Fei-Fei Li)及其团队近日宣布,他们仅用20美元便打造出一个名为“s1-32B”的AI推理模型,部分能力直逼OpenAI的o1及Deepseek-R1。如此低成本、高效能的AI模型,迅速引发行业内外的高度关注。



据报道,李飞飞(Fei-Fei Li)团队发表的论文显示,s1-32B模型在数学竞赛问题上的表现甚至超越了OpenAI的o1预览版。在MATH和AIME24数据集上,s1-32B模型的成绩比o1预览版高出27%。研究人员透露,s1-32B模型基于阿里巴巴的开源模型Qwen2.5-32B-Instruct,通过监督式微调(SFT)训练而成,整个训练过程仅耗时26分钟,利用16个英伟达(NVIDIA)H100 GPU即可完成。



为了提升模型的推理质量,研究团队在训练过程中采用了“预算控制”策略。他们通过加入“wait指令”等方式,强制延长模型的推理过程和思考时间,促使模型能够自我检查并修正错误的推理步骤。这一策略的成功应用,使得s1-32B模型能够在低成本的条件下,实现与OpenAI、Deepseek等公司的高端模型相媲美的性能。





关于李飞飞
李飞飞(Fei-Fei Li)是知名华裔美籍科学家,在人工智能、机器学习、计算机视觉等领域享有盛誉。她曾任斯坦福大学人工智能实验室主任,为人工智能领域的发展做出了卓越贡献,被誉为“AI教母”。

Archiver|小黑屋|868论坛  

GMT+8, 2025-3-12 14:42 , Processed in 0.030564 second(s), 17 queries .

Powered by 868

© 2024-2025 868

快速回复 返回顶部 返回列表