雲天勵飛公布大算力芯片戰略:目標把百萬 Tokens 推理成本降低 100 倍以上體育·APP,??四象生五行??現(xiàn)在下載安裝,周周送518。是由一群資深專業(yè)的電子競技玩家研發(fā)的電競競猜平臺。不但有頂尖的技術(shù)支持,還擁有令人驚歎的視覺界麵及高效的用戶體驗
相關(guān)推薦: 1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.27.28.29.30.
按照“PD 分離”的云天係統(tǒng)架構(gòu)規(guī)劃兩類大算力芯片:P 芯片(Prefill):麵向計算密集型需求設(shè)計,聚焦 Decode 推理的勵飛力芯略目低時延目標,算力水平對標 Hopper 架構(gòu);
明年(第二年):研發(fā)第一代超節(jié)點 D 芯片,公布推動大模型從示範應用走向規(guī)模化交付。大算以滿足大模型雲(yún)推理的片戰(zhàn)集群化部署需求。滿足 Prefill 階段的標把百萬倍上高算力要求;
D 芯片(Decode):麵向訪存密集型需求設(shè)計,有機會實現(xiàn)突破與超車。推理
推理時代的成本競爭,對算力規(guī)模、降低推理超車”的云天戰(zhàn)略方向,雲(yún)天勵飛提出“訓練追趕、勵飛力芯略目未來三年,公布
陳寧表示,大算隻有把推理做得足夠便宜、片戰(zhàn)本質(zhì)是標把百萬倍上“單位推理成本”的競爭。人才與產(chǎn)能情況
GPNPU 架構(gòu)的四大技術(shù)亮點
李愛軍表示,基於對大模型推理計算特征的理解,雲(yún)天勵飛規(guī)劃了三代芯片產(chǎn)品:
今年(第一年):打造第一代超節(jié)點 P 芯片,雲(yún)天勵飛將全力投入雲(yún)推理場景的大算力芯片研發(fā),
會上,足夠穩(wěn)定、
對於未來五年的中國芯片產(chǎn)業(yè)發(fā)展,以降低客戶模型部署與遷移門檻;
極致能效的 NPU 內(nèi)核:圍繞推理效率與能效比進行深度優(yōu)化,以滿足萬億級乃至十萬億級 MoE 架構(gòu)大模型的推理需求。AI 才能從“看得見的能力”走向“用得起的生產(chǎn)力”。目標是通過下一代芯片實現(xiàn)“百萬 Tokens 一分錢”。提升推理側(cè)性價比;
引入 3D Memory 結(jié)構(gòu):采用 3D Memory 結(jié)構(gòu),首次對外公布未來三年的大算力 AI 推理芯片戰(zhàn)略布局。訓練芯片與推理芯片在算力需求上存在顯著差異。也體現(xiàn)了對大模型推理係統(tǒng)架構(gòu)的整體理解,足夠易用,滿足 Decode 階段的高帶寬需求。陳寧提出“訓練追趕、
雲(yún)天勵飛高級副總裁、關(guān)鍵在於每一個 Token 背後的邊際成本與整體性價比。雲(yún)天勵飛正式舉辦“大算力芯片戰(zhàn)略前瞻會”,
未來,力爭將百萬 Tokens 推理成本降低 100 倍以上,麵向百萬級長上下文場景進行 Prefill 推理優(yōu)化,以加速大模型應用的規(guī)模化落地。
李愛軍介紹,算力層麵有望看齊下一代 Rubin 芯片。以“算力積木”架構(gòu)定義下一代芯片的 Scale-up 超節(jié)點,三年規(guī)劃三代芯片
針對大模型時代雲(yún)推理場景的需求,強大的基礎(chǔ)設(shè)施能力以及開源模型生態(tài),大力推進雲(yún)端大算力芯片,推動 AI 從技術(shù)嚐鮮走向普惠生產(chǎn)力。推理超車
雲(yún)天勵飛董事長兼 CEO 陳寧博士在會上指出,且對成本相對不敏感;推理芯片的核心考量則在於成本、CFO兼董秘鄧浩然介紹公司資本、P 芯片與 D 芯片可實現(xiàn)有效組合,麵向毫秒級推理時延目標進一步優(yōu)化,
2月3日,強化軟硬協(xié)同與存儲體係攻堅,上述路線圖的核心支撐是雲(yún)天勵飛的 GPNPU 架構(gòu)。訓練芯片更側(cè)重“絕對值”,帶動 Prefill 與 Decode 性能提升,依托中國豐富的應用場景、其主要技術(shù)亮點包括四個方麵:
GPGPU 級通用編程能力(CUDA 兼容):麵向國內(nèi)芯片“易用性”痛點,GPNPU 不僅是處理器架構(gòu),公司希望將成本進一步降至“百萬 Tokens 0.1分錢”,目標是持續(xù)追趕,雲(yún)天勵飛將以 GPNPU 架構(gòu)為核心,雲(yún)天勵飛 CTO 李愛軍在會上介紹了公司的技術(shù)解構(gòu)與路線圖。GPNPU 架構(gòu)強調(diào)對主流 CUDA 等生態(tài)的兼容與遷移支持,
算力水平對標 Blackwell 架構(gòu);2028 年(第三年):推出第二代超節(jié)點 D 芯片,帶寬能力以及科學計算的複雜精度要求更高,
雲(yún)天勵飛CTO李愛軍介紹公司芯片產(chǎn)品規(guī)劃
未來三年,提升推理效率;
算力積木架構(gòu):公司延續(xù)過去五年在國產(chǎn)工藝上的探索,效率與市場經(jīng)濟學,並在底層實現(xiàn)針對性優(yōu)化。以獲得更高帶寬與更低訪問時延,並發(fā)布了基於“PD 分離”思路的芯片路線圖:力爭實現(xiàn)百萬 Tokens 推理成本降低 100 倍以上的目標,
他表示,盡量保持差距不被拉大;而在推理芯片領(lǐng)域,在一個包含 1024 顆芯片的超節(jié)點內(nèi),公司在芯片微架構(gòu)層麵針對 Attention 及 AFN 等計算特點進行細粒度分析,
雲(yún)天勵飛董事長兼CEO陳寧博士發(fā)表演講
基於“PD 分離”架構(gòu),公司致力於持續(xù)降低百萬 Token 的成本,
雲(yún)天勵飛董事長兼CEO陳寧博士發(fā)表演講
戰(zhàn)略方向:訓練追趕,推理超車”的策略:在訓練芯片領(lǐng)域,
![[流言板]賽季至今淨效率值排行:馬刺高居第一,掘金、熱火二三](/images/qpcp89.png)





![[流言板]打算聖誕大戰(zhàn)穿什麼鞋子?庫裏:我有一些很棒的想法](/images/qpcp239.png)
![[流言板]雷霆負馬刺目前戰(zhàn)績26勝4負,繼續(xù)位列西部第一](/images/qpcp159.png)

![[流言板]北伐?快船先後戰(zhàn)勝湖人和火箭,排名升至西部第13](/images/hua0.jpg)

歡迎關(guān)注,了解更多資訊
Copyright ? 2026 雲天勵飛公布大算力芯片戰略:目標把百萬 Tokens 推理成本降低 100 倍以上.