DeepSeek:成本低、性能强,中国AI模型挑战硅谷巨头

2025-02-07 20:28:59 大型语言模型 author

中国人工智能公司DeepSeek近日发布的DeepSeek-R1大模型引发全球关注,其以极低的成本和算力规模,实现了与美国顶级AI模型相媲美的效果,并在中美App Store登顶,超越ChatGPT。这一事件震惊了硅谷,甚至导致高盛发布报告,对冲基金开始观望美国AI模式的持续性,并撤离科技股押注,引发美股科技股抛售潮,英伟达等公司股价暴跌。 DeepSeek成立于2023年7月,由幻方量化创立,其创始人梁文锋拥有扎实的技术背景和丰富的量化投资经验。DeepSeek团队规模不大,主要由来自国内顶尖高校的本土人才组成,却在AI大模型领域取得了突破性进展,先后发布了DeepSeek-V2和DeepSeek-V3模型,其中DeepSeek-V3被誉为“来自东方的神秘力量”。 DeepSeek-R1模型的成功之处在于其低廉的训练成本(仅为GPT-4的十分之一)和低廉的运行成本(仅为OpenAI O1运行成本的三十分之一),这打破了传统“算力为王”的行业规则,也为AI大模型的发展提供了新的思路。DeepSeek-R1采用MIT许可协议,支持免费商用,进一步降低了使用门槛。 DeepSeek的爆火也带来了服务器压力,曾短暂出现服务波动甚至宕机现象,DeepSeek回应称系用户访问量激增和恶意攻击导致。创始人梁文锋表示,中国AI需要在原创和模仿之间做出选择,才能摆脱追随者的角色,建立独立的AI生态。英伟达虽然在声明中表示DeepSeek符合出口管制规定,并强调DeepSeek的成功也证明了其芯片的需求,但DeepSeek的崛起无疑对以高算力为核心的传统AI发展模式提出了挑战。Meta也已成立研究小组,研究DeepSeek的技术原理。

发表评论:

最近发表