就在最近,来自中国的AI公司DeepSeek,可以说是在AI圈掀起轩然大波。

DeepSeek基本上就是一个类似ChatGPT这样的大型语言模型,但它一出手发布的DeepSeek-R1就号称有着比肩甚至是超越OpenAI的o1模型,更重要的是它完全开源、完全免费。
目前,DeepSeek网站上主要能使用两种模型,一个是对应GPT 4o的DeepSeek V3、一个是对标了OpenAI o1推理模型的DeepSeek R1。

要知道,你需要每个月支付200美元来使用Open AI的o1模型,而现在有着同等实力的DeepsSeek是让你免费使用的,只有在部分的API费用才有进行一些简单的收费。

你不光是能够上网使用,还能下载部署到电脑,甚至还提供了手机用的版本。
也由于它开源的特性,这让许多人能够自己下载、微调DeepSeek模型,也因此有人认为DeepSeek才是真正意义上的“OpenAI”。

那么,DeepSeek究竟是何方神圣呢?据了解,这家公司始源于一家来自中国的量化投资基金High-Flyer Quant(幻方量化),从他们的官网来看,与他们相关的AI技术还不止DeepSeek。
为什么DeepSeek能做到免费开源?这也和成本息息相关,据了解,DeepSeek是一家“仅用550万美元训练预算的中国公司”,对比起接连数次融资,每次都要价数十亿美元甚至还要走盈利化路线的OpenAI来说,两者的成本完全不在一个量级。
DeepSeek的团队构成也是个趣闻,他们一反常态,不聘用经验丰富的行业老将,而是乐于挖掘没有工作履历的年轻人,根据与DeepSeek合作过的猎头公司透露,他们招募的技术人员中,工作经验在3-5年的都算多了。
幻方创始人梁文锋也表示,DeepSeel大多数开发人员都是应届毕业生或是具有一两年工作经验的人担任,比起经验,他们更看重潜力,梁文锋曾说:做一件长期的事,经验其实没那么重要,相比之下基础能力、创造性和热爱等更重要。
因此,DeepSeek也冲击了美国的AI龙头企业,像是NVIDIA股价跌幅一度来到5%、博通跌破4%、软银集团股价下跌6%,纳斯达克100指数期货跌1.8%,道指期货跌近0.5%。
与此同时,DeepSeek在美国区的App Store下载榜超越了ChaGPT
有消息指出,Meta还因此组建四个小组来解析DeepSeek,其中两个小队试图了解High-Flyer如何降低训练和运行DeepSeek的成本、第三个小组研究High-Flyer可能使用哪些数据来训练其模型,而第四个小组则正在考虑运用DeepSeek模型的特性来重构Meta的技术。
当然,DeepSeek还是有着自己的一些争议,比方说言论审查的问题,基于其国籍来源,有些问题注定是不能从DeepSeek身上获得解答的,至于这样的争议点是否会成为你使用它的阻碍,就很见仁见智了。
无论如何,可以看到DeepSeek的发展潜力都是巨大的,这势必也会对美国一众AI企业带来巨大的冲击,至于后续如何,就有待我们持续关注了。