DeepSeek 引发广泛关注,大模型应用落地将加速,加快大模型在 B 端和 C 端应用场景的落地

2025/3/6 16:08:23 1305 
 

DeepSeek-V3 和 DeepSeek-R1 陆续发布,国产大模型能力已可比肩海 外L军大模型。2024 年 12 月 26 日,杭州 AI 公司深度求索(DeepSeek) 正式发布 DeepSeek-V3 大模型版本并同步开源。根据 DeepSeek 网 站信息,DeepSeek-V3 为自研 MoE 模型,671B 参数,激活 37B,在 14.8T tokens 上进行了预训练。DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界 D的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 相当。在训练成本方 面,根据 DeepSeek 发布的技术文档论文信息,DeepSeek-V3 的训练时 长为 2788K 个 H800 GPU 小时,训练花费约为 557.6 万美元。2025 年 1 月 20 日,DeepSeek 正式发布复杂推理类大模型 DeepSeek-R1,性能对 齐 OpenAI o1 正式版。以 DeepSeek 系列大模型为代表的国产大模型性 能已可比肩海外L军大模型,且成本更低。

DeepSeek 系列大模型引发广泛关注,海内外巨头科技公司及云服务 平台厂商已相继接入。2025 年 1 月 15 日,DeepSeek 推出 AI 助手 DeepSeek App。2025 年春节期间,DeepSeek 系列大模型火爆出圈,引 发广泛关注。根据新浪财经 2 月 1 日引用彭博社信息,DeepSeek 的 AI 助手在 140 个市场中成为下载量多的移动应用。根据 Appfigures 的 数据,DeepSeek 的推理人工智能聊天机器人在 1 月 26 日登上苹果公司 App Store 的榜,并自那时以来一直保持的位置。同时, 也开始了对 DeepSeek 大模型的复刻。以港科大团队为例,港科大助理教 授 何 俊 贤的 团 队, 只 用了 8K 个 样 本, 就 在 7B 模型 上 复刻 出 了 DeepSeek-R1-Zero 和 DeepSeek-R1 的训练。当前,海内外巨头科技公 司及云服务平台厂商已相继接入了 DeepSeek 大模型,部分 AI 应用L域 相关企业也已开始了 DeepSeek 大模型的部署和应用。DeepSeek 大模型 获得了的广泛关注,认可度持续提升。我们认为,DeepSeek大模型的开源、低成本和G性能将大幅降低大模型的获得、部署和应用成本,将加快大模型在 B 端和 C 端应用场景的落地。另外,DeepSeek 大模型的出 圈将对大模型产业的竞争格局产生重要影响,将对海外L军大模型厂 商的L先性产生冲击,并同时将对算力的未来发展产生重要影响。

DeepSeek 大模型的出圈预计不改算力整体需求向上的态势,但推理和端 侧算力有望增长更快。DeepSeek 在算法效率和计算成本方面有着较大的 优势,短期内可能对训练算力的增长有一定的平抑效应,但是不改 AI 算 力整体需求长期上升的态势。AI 作为智能化发展的主要抓手,大模型 当前已应用于端侧、教育、金融、办公、传媒、医疗、智能汽车、企业服务等多个应用场景,应用L域广阔。DeepSeek 低成本而且开源的解决方 案,大幅降低了 AI 在各行各业应用的技术和成本门槛,为 AI 的产业化落地提供了更快的路径。推理和端侧的算力需求增长潜力非常大。同时,较低训练成本以及开源的 DeepSeek,有望带来更低 的大模型开发和使用门槛,基于该大模型开发的主体可能更多,也一定程度上为训练算力需求提供了支撑。DeepSeek 并不 是压缩了算力市场,反而为算力市场增加了更多的想象空间。DeepSeek 也在积J与国产 AI 算力平台合作。DeepSeek 大模 型与国产 AI 芯片适配的逐步成熟,将加快推动国产 AI 芯片在国内大模型训练端和推理端的应用,加快国产 AI 芯片产业链的 成熟,为国产 AI 芯片产业带来发展机遇,同时加快我国大模型产业的发展。



附件:DeepSeek 引发广泛关注,大模型应用落地将加速,加快大模型在 B 端和 C 端应用场景的落地



 
上一篇   下一篇
 
返回顶部
  技术支持
  关于创泽
  隐私条款
咨询热线
 
销售咨询
4006-935-088 / 4006-937-088
 
客服热线
4008-128-728

版权所有 @ 创泽智能机器人集团股份有限公司
运营中心 / 北京市·清华科技园九号楼5层
生产中心 / 山东省日照市开发区太原路71