DeepSeek 引发广泛关注,大模型应用落地将加速,加快大模型在 B 端和 C 端应用场景的落地

DeepSeek 引发广泛关注,大模型应用落地将加速,加快大模型在 B 端和 C 端应用场景的落地
2025/3/6 16:08:23	3361

DeepSeek-V3 和 DeepSeek-R1 陆续发布，国产大模型能力已可比肩海外L军大模型。2024 年 12 月 26 日，杭州 AI 公司深度求索（DeepSeek）正式发布 DeepSeek-V3 大模型版本并同步开源。根据 DeepSeek 网站信息，DeepSeek-V3 为自研 MoE 模型，671B 参数，激活 37B，在 14.8T tokens 上进行了预训练。DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型，并在性能上和世界 D的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 相当。在训练成本方面，根据 DeepSeek 发布的技术文档论文信息，DeepSeek-V3 的训练时长为 2788K 个 H800 GPU 小时，训练花费约为 557.6 万美元。2025 年 1 月 20 日，DeepSeek 正式发布复杂推理类大模型 DeepSeek-R1，性能对齐 OpenAI o1 正式版。以 DeepSeek 系列大模型为代表的国产大模型性能已可比肩海外L军大模型，且成本更低。 DeepSeek 系列大模型引发广泛关注，海内外巨头科技公司及云服务平台厂商已相继接入。2025 年 1 月 15 日，DeepSeek 推出 AI 助手 DeepSeek App。2025 年春节期间，DeepSeek 系列大模型火爆出圈，引发广泛关注。根据新浪财经 2 月 1 日引用彭博社信息，DeepSeek 的 AI 助手在 140 个市场中成为下载量多的移动应用。根据 Appfigures 的数据，DeepSeek 的推理人工智能聊天机器人在 1 月 26 日登上苹果公司 App Store 的榜，并自那时以来一直保持的位置。同时，也开始了对 DeepSeek 大模型的复刻。以港科大团队为例，港科大助理教授何俊贤的团队，只用了 8K 个样本，就在 7B 模型上复刻出了 DeepSeek-R1-Zero 和 DeepSeek-R1 的训练。当前，海内外巨头科技公司及云服务平台厂商已相继接入了 DeepSeek 大模型，部分 AI 应用L域相关企业也已开始了 DeepSeek 大模型的部署和应用。DeepSeek 大模型获得了的广泛关注，认可度持续提升。我们认为，DeepSeek大模型的开源、低成本和G性能将大幅降低大模型的获得、部署和应用成本，将加快大模型在 B 端和 C 端应用场景的落地。另外，DeepSeek 大模型的出圈将对大模型产业的竞争格局产生重要影响，将对海外L军大模型厂商的L先性产生冲击，并同时将对算力的未来发展产生重要影响。 DeepSeek 大模型的出圈预计不改算力整体需求向上的态势，但推理和端侧算力有望增长更快。DeepSeek 在算法效率和计算成本方面有着较大的优势，短期内可能对训练算力的增长有一定的平抑效应，但是不改 AI 算力整体需求长期上升的态势。AI 作为智能化发展的主要抓手，大模型当前已应用于端侧、教育、金融、办公、传媒、医疗、智能汽车、企业服务等多个应用场景，应用L域广阔。DeepSeek 低成本而且开源的解决方案，大幅降低了 AI 在各行各业应用的技术和成本门槛，为 AI 的产业化落地提供了更快的路径。推理和端侧的算力需求增长潜力非常大。同时，较低训练成本以及开源的 DeepSeek，有望带来更低的大模型开发和使用门槛，基于该大模型开发的主体可能更多，也一定程度上为训练算力需求提供了支撑。DeepSeek 并不是压缩了算力市场，反而为算力市场增加了更多的想象空间。DeepSeek 也在积J与国产 AI 算力平台合作。DeepSeek 大模型与国产 AI 芯片适配的逐步成熟，将加快推动国产 AI 芯片在国内大模型训练端和推理端的应用，加快国产 AI 芯片产业链的成熟，为国产 AI 芯片产业带来发展机遇，同时加快我国大模型产业的发展。附件：DeepSeek 引发广泛关注,大模型应用落地将加速,加快大模型在 B 端和 C 端应用场景的落地

上一篇下一篇

返回顶部 ∧

技术支持

关于创泽

隐私条款

咨询热线

销售咨询

4006-935-088 / 4006-937-088

客服热线

版权所有 @ 创泽智能机器人集团股份有限公司
运营中心 / 北京市·清华科技园九号楼5层
生产中心 / 山东省日照市开发区太原路71