DeepSeek V3再次震撼硅谷,中美AI差距突然缩至3个月!
中国人工智能初创企业DeepSeek近日发布其最新大语言模型DeepSeek-V3-0324,以全面升级的技术架构向OpenAI、Anthropic等美国AI领军企业发起挑战。这一跨越式进展不仅彰显中国在人工智能领域的雄心,更将中美AI竞赛推向新高度。
01.AI创始人、前谷歌中国总裁李开复表示,DeepSeek通过算法创新和高效利用国产硬件,显著缩小了与美国领导者如OpenAI的技术差距。这一进展表明,中国在核心AI技术上仅落后美国三个月,甚至在某些领域已处于领先地位。李开复在接受路透社采访时表示:
“此前我认为差距在六到九个月,且全面落后。而现在,我认为在部分核心技术领域仅落后三个月,但在某些特定领域已实现领先。”
今年早些时候,DeepSeek发布了一款基于性能较低芯片训练的AI推理模型,引发了国际关注。该公司声称,该模型仅使用了价值600万美元的算力资源,分布在2000颗英伟达H800芯片上。相比之下,美国公司如OpenAI和Meta在类似项目上投入了数十亿美元。
本周在AI平台Hugging Face上发布的基准测试显示,DeepSeek最新模型DeepSeek-V3-0324在推理和编码等领域表现出竞争力。该模型具备先进的“思维链(chain-of-thought)”可视化功能,这一能力最初由OpenAI开发,但未向用户开放。
相较于前代产品,V3版本在以下维度实现显著提升:
- 推理能力:通过新型训练架构,解决复杂逻辑问题的效率提升40%
- 代码生成:在Python等编程语言的自动补全测试中准确率达92%,逼近GPT-4水平
- 成本优势:仅用价值600万美元的2000块英伟达H800芯片完成训练,成本仅为美国同类项目的1/20
"这不再是追赶游戏,我们正在定义AI的新未来。"DeepSeek技术负责人表示。该模型已向全球开发者开放,其开源策略直指Meta的Llama系列,形成"高性能+低成本"的双重竞争优势。
自2023年12月发布V1版本以来,DeepSeek保持着惊人的迭代速度:
- 2023.12:推出基础版V1模型
- 2024.01:发布优化版R1模型聚焦企业场景
- 2024.03:当前V3版本实现技术代际突破
这种"季度革命"式的更新频率,打破了行业常规的半年至一年升级周期,迫使西方巨头重新评估中国AI的进化速度。
李开复指出:“DeepSeek能够通过新的强化学习方法实现思维链功能,这表明他们正在追赶美国,快速学习,甚至可能更具创新性。”这一发展挑战了关于美国半导体制裁阻碍中国AI技术进步的观点。李开复将制裁描述为“双刃剑”,短期内制造了障碍,但也迫使中国企业在限制下创新。
版权声明:内容及插图归源作者所有。文章为源作者独立观点,不代表 雷电财经 立场。
温馨提示:如您对本文存在异议,或不巧侵犯了您的合法权益,请通过 [ 投稿须知 ] 联系我们删除!
下一篇:没有了