868论坛
标题:
“AI教母”李飞飞20美元炼成AI模型,力压OpenAI与Deepseek?
[打印本页]
作者:
即时国际
时间:
2025-2-11 16:23
标题:
“AI教母”李飞飞20美元炼成AI模型,力压OpenAI与Deepseek?
人工智能领域再起波澜!“AI教母”李飞飞(Fei-Fei Li)及其团队近日宣布,他们仅用20美元便打造出一个名为“s1-32B”的AI推理模型,部分能力直逼OpenAI的o1及Deepseek-R1。如此低成本、高效能的AI模型,迅速引发行业内外的高度关注。
据报道,李飞飞(Fei-Fei Li)团队发表的论文显示,s1-32B模型在数学竞赛问题上的表现甚至超越了OpenAI的o1预览版。在MATH和AIME24数据集上,s1-32B模型的成绩比o1预览版高出27%。研究人员透露,s1-32B模型基于阿里巴巴的开源模型Qwen2.5-32B-Instruct,通过监督式微调(SFT)训练而成,整个训练过程仅耗时26分钟,利用16个英伟达(NVIDIA)H100 GPU即可完成。
为了提升模型的推理质量,研究团队在训练过程中采用了“预算控制”策略。他们通过加入“wait指令”等方式,强制延长模型的推理过程和思考时间,促使模型能够自我检查并修正错误的推理步骤。这一策略的成功应用,使得s1-32B模型能够在低成本的条件下,实现与OpenAI、Deepseek等公司的高端模型相媲美的性能。
关于李飞飞
李飞飞(Fei-Fei Li)是知名华裔美籍科学家,在人工智能、机器学习、计算机视觉等领域享有盛誉。她曾任斯坦福大学人工智能实验室主任,为人工智能领域的发展做出了卓越贡献,被誉为“AI教母”。
欢迎光临 868论坛 (https://86666668.xyz/)
Powered by Discuz! X3.2