核心產品
阿里雲AI、含光800 NPU、通義千問
瓶頸狀態
🔴 2023年10月BIS規則實施後無法獲得英偉達H100/H200
詳細簡報▼ 展開
阿里雲是阿里巴巴集團(紐交所/港交所: BABA)的雲端運算子公司,是中國最大的雲端服務提供商,也是全球收入規模僅次於AWS和Azure的第三大雲端服務商。成立於2009年,2024財年年收入約150億美元,AI驅動的工作負載佔比持續增長。雲業務在中國大陸、香港、新加坡、日本、德國、澳大利亞和美國均設有資料中心,是亞洲雲端服務商中全球分布最廣的之一。 阿里巴巴的AI晶片戰略涵蓋三個硬體層次。第一,含光800 NPU於2019年發布,由台積電12nm工藝代工,由阿里巴巴達摩院專為電商推薦、圖像搜索和自然語言推理工作負載設計。含光800驅動淘寶和阿里巴巴廣告系統,每天處理數兆次推理查詢。它不是通用訓練晶片,而是高度專用的推理加速器——這一差異化方法降低了阿里巴巴核心工作負載對外部GPU的依賴。第二,阿里雲原本運營NVIDIA A100和H800叢集用於大規模AI訓練;但2023年10月BIS出口管制擴大後,無法再獲得H100/H200出口,已轉向英偉達中國合規版H20 GPU。第三,阿里雲已簽約華為昇騰910B叢集,作為需要高於H20互連頻寬的工作負載的國產備選方案。 阿里巴巴的通義千問(Qwen)大模型家族於2023年推出,已成為中國部署最廣泛的模型系列之一。Qwen模型覆蓋0.5B至72B參數規模,包含多模態變體(Qwen-VL)和程式碼專用版本(Qwen-Coder)。2024年6月發布的Qwen2系列在與LLaMA 3和Mistral等國際開放權重模型的基準測試中表現具競爭性。阿里巴巴以寬鬆許可證開源了大部分Qwen變體,截至2025年初,其在Hugging Face上的下載量使之成為最受歡迎的中文開放權重模型系列。 出口管制對阿里雲的影響是多維度的。H20 GPU——英偉達的降規中國合規產品——與H100/H200相比,NVLink頻寬和GPU間互連性能大幅降低,使大規模訓練效率下降。阿里巴巴的應對措施是加大投入模型效率技術、針對互連頻寬減少優化的分散式訓練框架,以及通過更長訓練時間進行彌補。Qwen訓練流水線已適配在華為昇騰叢集上運行,但軟體工具鏈成熟度仍低於CUDA。 阿里雲在國內市場與騰訊雲、華為雲和百度智能雲直接競爭,包括GPU租用、模型API服務和企業LLM部署在內的AI雲服務成為主要增長引擎。通義品牌將阿里巴巴AI產品統一於單一身份下,消費者端為通義千問聊天機器人,開發者端為通義API。淘寶、天貓、支付寶、餓了麼、釘釘等廣泛的消費者生態系統為AI功能提供了龐大的內部部署面,使阿里雲在國內AI市場份額上擁有全球同行難以複製的優勢。
關鍵路徑 — 從原料矽到部署
記憶體(HBM)
YMTC
Xtacking 3D NAND快閃記憶體(232層)
晶片設計
NVIDIA ▲
H100、H200、Blackwell B200 GPU
電力與冷卻
Vertiv ▲
液冷、UPS、PDU系統
雲端服務商
Alibaba Cloud
阿里雲AI、含光800 NPU、通義千問
AI消費者
DeepSeek
DeepSeek-V3、DeepSeek-R1(前沿推理模型)