DeepSeek

Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.

🇨🇳
AI消费者🇨🇳 CN非上市
deepseek.com

核心产品

DeepSeek-V3、DeepSeek-R1(前沿推理模型)

追踪供应链 →
详细简报▼ 展开

DeepSeek于2023年作为杭州量化对冲基金幻方科技的AI研究子公司成立。幻方在出口管制收紧之前积累了中国最大的GPU集群之一。由幻方CEO梁文鋒领导的创始团队将量化金融中的数值优化专业知识直接应用于AI训练效率,这被证明是决定性的竞争优势。 2024年12月发布的DeepSeek-V3和2025年1月发布的DeepSeek-R1,构成了自GPT-4以来对美国AI实验室最重大的竞争性冲击。DeepSeek声称V3的训练成本约为560万美元的GPU小时数——这一数字在细节上受到质疑,但仍指向了与美国同类前沿模型估计数亿美元相比的根本性效率差距。R1模型以一种独特方式将人类反馈强化学习与思维链推理相结合,产生了可与OpenAI o1竞争的基准结果,引发了英伟达股票的大幅抛售(即2025年1月27日的"DeepSeek时刻"),市场重新评估了前沿AI算力需求的假设。 DeepSeek的效率技术在技术层面具有实质意义。V3架构使用多头潜在注意力(MLA),通过低秩投影矩阵压缩KV缓存,大幅降低推理时的内存带宽压力。还采用256个专家中每token仅激活8个的MoE路由方案,以及FP8混合精度训练——这是当时在NVIDIA H800 GPU(H100的出口管制合规版本,NVLink互连带宽降低)上减少内存占用、提升吞吐量的创新方法。据报道,DeepSeek的训练在约2048块H800 GPU的集群上进行。 出口管制是DeepSeek硬件路线图的决定性约束。BIS 2023年10月规则将H100/H200 GPU列为向中国出口需要许可证的受控商品,后续2024/2025年规则进一步收紧。DeepSeek使用H800(购买时合规)的情况正受到审查,涉及这些芯片是否通过合法渠道获取。由于H800现已受控,DeepSeek正将未来训练转向华为昇腾910B和910C NPU,尽管与英伟达产品相比,其软件成熟度和互连带宽较低。 DeepSeek成果的地缘政治影响重塑了AI芯片出口管制辩论。那些认为限制先进GPU出口能维持持久性能差距的美国政策制定者,如今面临效率驱动方法可在一定程度上弥补硬件劣势的证据。与此同时,DeepSeek以宽松许可证开放发布模型权重,使其技术在全球范围内可获取,加速了MLA和MoE路由等架构创新向全球开源和专有模型开发的扩散。

关键路径 — 从原料硅到部署

云服务商

Huawei Cloud

华为云EI(AI)、基于昇腾910的ModelArts平台

云服务商

Alibaba Cloud

阿里云AI、含光800 NPU、通义千问

云服务商

Tencent Cloud

腾讯云AI、混元大模型、GPU HPC集群

AI消费者

DeepSeek

DeepSeek-V3、DeepSeek-R1(前沿推理模型)

影响DeepSeek的出口管制