DeepSeek

Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.

AI消费者🇨🇳 中国非上市

核心产品

DeepSeek-V3、DeepSeek-R1（前沿推理模型）

详细简报▼ 展开

重要原因

DeepSeek于2023年作为杭州量化对冲基金幻方科技的AI研究子公司成立。幻方在出口管制收紧之前积累了中国最大的GPU集群之一。由幻方CEO梁文鋒领导的创始团队将量化金融中的数值优化专业知识直接应用于AI训练效率，这被证明是决定性的竞争优势。 2024年12月发布的DeepSeek-V3和2025年1月发布的DeepSeek-R1，构成了自GPT-4以来对美国AI实验室最重大的竞争性冲击。DeepSeek声称V3的训练成本约为560万美元的GPU小时数——这一数字在细节上受到质疑，但仍指向了与美国同类前沿模型估计数亿美元相比的根本性效率差距。R1模型以一种独特方式将人类反馈强化学习与思维链推理相结合，产生了可与OpenAI o1竞争的基准结果，引发了英伟达股票的大幅抛售（即2025年1月27日的"DeepSeek时刻"），市场重新评估了前沿AI算力需求的假设。 DeepSeek的效率技术在技术层面具有实质意义。V3架构使用多头潜在注意力（MLA），通过低秩投影矩阵压缩KV缓存，大幅降低推理时的内存带宽压力。还采用256个专家中每token仅激活8个的MoE路由方案，以及FP8混合精度训练——这是当时在NVIDIA H800 GPU（H100的出口管制合规版本，NVLink互连带宽降低）上减少内存占用、提升吞吐量的创新方法。据报道，DeepSeek的训练在约2048块H800 GPU的集群上进行。出口管制是DeepSeek硬件路线图的决定性约束。BIS 2023年10月规则将H100/H200 GPU列为向中国出口需要许可证的受控商品，后续2024/2025年规则进一步收紧。DeepSeek使用H800（购买时合规）的情况正受到审查，涉及这些芯片是否通过合法渠道获取。由于H800现已受控，DeepSeek正将未来训练转向华为昇腾910B和910C NPU，尽管与英伟达产品相比，其软件成熟度和互连带宽较低。 DeepSeek成果的地缘政治影响重塑了AI芯片出口管制辩论。那些认为限制先进GPU出口能维持持久性能差距的美国政策制定者，如今面临效率驱动方法可在一定程度上弥补硬件劣势的证据。与此同时，DeepSeek以宽松许可证开放发布模型权重，使其技术在全球范围内可获取，加速了MLA和MoE路由等架构创新向全球开源和专有模型开发的扩散。

关联企业

点击芯片以追踪该企业的供应链。

Huawei Cloud Alibaba Cloud Tencent Cloud

关键路径 — 从原料硅到部署

最紧张的单一来源依赖关系（按顺序）。

云服务商

Huawei Cloud

华为云EI（AI）、基于昇腾910的ModelArts平台

云服务商

Alibaba Cloud

阿里云AI、含光800 NPU、通义千问

云服务商

Tencent Cloud

腾讯云AI、混元大模型、GPU HPC集群

AI消费者

DeepSeek

DeepSeek-V3、DeepSeek-R1（前沿推理模型）

影响DeepSeek的出口管制

荷兰EUV和DUV光刻设备出口管制（2023年9月）

荷兰外交部要求阿斯麦公司（ASML）为其深紫外线（DUV）光刻系统申请出口许可证，并扩大了对EUV系统的现有禁令。ASML是全球唯一的EUV设备制造商，该管控措施阻止中国获取生产先进制程芯片所需的设备。该政策是与美国和日本的出口管制框架协调制定的。

▲ 12家公司受影响

查看级联 →

美国—荷兰—日本半导体制造设备出口管制三边协调（2023年1月）

经过广泛外交谈判，美国、荷兰和日本于2023年1月27日前后就协调各自半导体设备出口管制框架达成非正式多边协议。随后，荷兰对阿斯麦（ASML）实施了DUV许可证要求（2023年9月生效），日本则将管制范围扩展至23类先进晶圆厂设备（2023年7月生效）。三边协调封堵了限制中国获取先进制程芯片生产所需设备的最大漏洞——此前，任何一国的单边限制均可通过其他国家加以规避。

▲ 12家公司受影响

查看级联 →

关于该公司

QDeepSeek的供应商有哪些？

DeepSeek在AI芯片供应链中依赖3个上游供应商。

Huawei Cloud (中国第三大云服务商；运营华为昇腾910 AI集群；与海思形成闭环——唯一拥有端到端国产芯片+云计算技术栈的中国云服务商)、Alibaba Cloud (中国第一大云服务商；部署阿里巴巴含光800 AI芯片（台积电代工）和华为昇腾；运营通义千问大模型)、Tencent Cloud (中国第二大云服务商；BIS出口管制后转向H20/华为昇腾的主要AI GPU买家；运营混元大模型)。

QDeepSeek的主要产品是什么？

由幻方量化支持的中国AI实验室；使用受限英伟达H800+华为昇腾开发了DeepSeek-V3/R1前沿模型；2025年1月打破全球AI定价格局

主要产品 DeepSeek-V3、DeepSeek-R1（前沿推理模型）