okex欧易交易所封面图

okex欧易交易所

okex欧易交易所是国内最大的数字货币交易所,现在注册永久免20%手续费!

官网注册

国 AI 新创公司 DeepSeek 近期先后发布「DeepSeek-V3」和「DeepSeek-R1」两款大模型,由于标榜成本低廉、性能与 OpenAI 相当,震动矽谷,被认为可能改写 AI 大模型领域的游戏规则。

老高谈 DeepSeek 冲击

对此, YouTuber 老高昨日发布影片《引发全球大冲击的 DeepSeek,已经点燃中美之间一场没有硝烟的战争》,畅谈他对 DeepSeek 的看法。

老高指出, DeepSeek 的成功不仅在于其 AI 模型的性能与 ChatGPT 相当,更在于其极低的开发成本, DeepSeek 开发其顶级模型仅花费 560 万美元(实际成本目前外界其实众说纷纭,很可能没这么低),约为 OpenAI 的百分之一,这使 DeepSeek 在 AI 领域的竞争力大幅提升,并引发了市场对 AI 开发成本与效率的重新评估。

老高认为,DeepSeek 的最大突破在于其开源策略,与 OpenAI 的闭源模式不同,DeepSeek 将其 AI 模型公开,允许任何人下载并在本地运行,甚至可以用于商业用途。这一举措不仅大幅降低了企业和个人使用 AI 的门槛,还对 OpenAI 等依赖闭源模式盈利的公司造成巨大冲击。

DeepSeek 抄袭 ChatGPT?

此外,老高表示,DeepSeek 被指抄袭 ChatGPT 的说法明显不成立,因为 ChatGPT 采用闭源模式,其内部运作无法被外部抄袭,而 DeepSeek 作为开源项目,所有代码与数据都公开透明,若有抄袭行为 OpenAI 早已能够察觉。这就像某些知名作业系统因闭源而不易被模仿一样。

老高形容,DeepSeek 的成果与 ChatGPT 仅可能存在灵感上的相似,而非直接抄袭,因为没有人能看到对方的「烹饪秘诀」。

老高还宣称,DeepSeek 能成功,在于能绕过辉达的 CUDA 运算平台,一直以来,CUDA 就像一座核电厂,将强大的运算晶片能力转化为稳定高效的运算资源,形成了其难以逾越的技术壁垒。

CUDA 是辉达提供的平行运算平台和程式设计模型,允许开发者利用辉达 GPU 来进行高性能运算。

根据老高的说法,DeepSeek 可以绕过硬体对训练速度的限制,从而不再依赖 CUDA ,这意味著不论使用哪家公司的晶片,只要能接入这项技术,就有机会获取最大化的运算效能,无需使用 CUDA,进一步动摇辉达在运算市场中的垄断地位。

DeepSeek 真绕过辉达 CUDA 框架?

不过针对老高的说法,有专家向动区表示,老高影片中的论点有误,当前 Deepseek 绝对是使用辉达显卡进行运算,并且还是使用 CUDA 平台,绝非老高所称「绕过 CUDA 」。

专家指出,老高可能错误理解了近期的新闻,Deepseek 近期被传出有为未来可能面临的封杀做准备,即使无法使用辉达显卡,也有打算使用中国国产 GPU 作为运算来源(也有说法指中国仍然透过灰色手段获得大量辉达晶片),但这不代表该公司现在的模型正「绕过 CUDA 」在运行。

此前,Tom’s Hardware 曾报导称,DeepSeek 在使用辉达 H800 晶片进行训练时,部分功能使用辉达底层硬体指令 PTX语言,而不是高级编程语言 CUDA,北京航空航太大学副教授黄雷分析,绕过 CUDA 意味著 DeepSeek 可以直接根据 GPU 的驱动函数做一些新的开发,从而实现更加细微性的操作。

The End

文章声明:以上内容(如有图片或视频亦包括在内)除非注明,否则均为谈天说币原创文章,转载或复制请以超链接形式并注明出处。

上一篇 下一篇

相关阅读