人妻中文字幕一区二区三区四区 ,日韩人妻av一区二区在线,精品91福利在线观看

DeepSeek的一串“符號”背后：對國產(chǎn)芯片意味著什么？

來源：21世紀經(jīng)濟報道21財經(jīng)APP作者：趙云帆2025-09-03 07:36

“UE8M0 FP8是針對即將發(fā)布的下一代國產(chǎn)芯片設計?！?/p>

這是深度求索公司8月份在新發(fā)布新模型DeepSeek V3.1的文檔中所留下的一個關鍵信息。

整個8月下旬，這串“符號”成為國產(chǎn)芯片與算力行業(yè)在資本市場狂歡的“財富密碼”。然而，對于非行業(yè)專業(yè)投資者來說，只有一頭霧水，很難明白這串略顯晦澀的代碼到底意味著什么，可以讓市場如此興奮。

“UE8M0 FP8”到底是什么意思？為什么它能引發(fā)資本市場對國產(chǎn)芯片的高度關注？而我們又需注意哪些不確定性？21世紀經(jīng)濟報道記者采訪了數(shù)位AI和算力行業(yè)人士，并嘗試為這三個問題找到一些解答。

極致的效率追求

首先“UE8M0 FP8”是什么意思？

“FP”即“浮點”，是計算機二進制計算的基礎單位，與“INT”整數(shù)計算相對應，常以科學計數(shù)法表達數(shù)據(jù)，適用于圖形處理、科學計算、深度學習等應用場景?！癋P8”即代表8位浮點，以此類推，F(xiàn)P16、FP32分別代表16位和32位浮點。而每個浮點位又分別用于記錄符號（+、-）、“E”階數(shù)（指數(shù)）、“M”尾數(shù)（小數(shù)）等關鍵數(shù)據(jù)信息，“通過科學計數(shù)法計算的方式”來記錄數(shù)據(jù)。

所以，“UE8M0 FP8”，即代表無符號、8位指數(shù)、0位尾數(shù)的參數(shù)格式。

一個恰如其分的比喻是，“指數(shù)位E”是人工智能丈量世界的尺的刻度，它既能測量微觀世界的塵埃，也能丈量宏觀世界的山河——但是，它需要符號位和尾數(shù)“M”來幫它確認精度。而在主流的參數(shù)格式FP8、FP16、FP32等中，其主流參數(shù)格式對應的指數(shù)位分別為4位、5位和8位。

其中，“FP32”是科學計算、模型訓練和推理的金標準，但因浮點位數(shù)高，計算資源耗費巨大，常用“混合”了FP16、FP8的混合精度進行高效化替代。

而“UE8M0”，就仿佛一個“百招會不如一招鮮”的高手，將自己所有的技能點全部聚焦到自己的量程之上，由此達到和FP32同樣的數(shù)據(jù)范圍。

“E8M0是用8位表示指數(shù)部分，尾數(shù)部分為0，所以Scale（標度）的值范圍上和FP32差不多，因為FP32也是8位表示指數(shù)部分，可以保證量化范圍大，有利于模型訓練的數(shù)值穩(wěn)定?！鼻叭蝾^部數(shù)據(jù)庫企業(yè)高管許天（化名）告訴記者：“所以我理解E8M0對比FP32速度更快，對比E5M2類的FP8數(shù)值范圍更大，訓練更穩(wěn)定。”

當然，純粹的“UE8M0”，自然會以舍棄精度作為代價。但是，由于Transformer架構(gòu)（一種采用注意力機制的深度學習架構(gòu)）下的AI大模型，其關鍵自注意力機制原本就依賴于浮點的大量程，因此 “UE8M0”創(chuàng)造了一種“犧牲局部精度，換取全局穩(wěn)定”的人工智能計算格式。

“UE8M0 FP8指的是一種為中國市場而特別定制的模型格式，能有效降低計算功耗，基于芯片規(guī)格的限制，此格式對中國的芯片廠商比較友好?！監(jiān)mdia首席分析師蘇廉節(jié)告訴記者。“相比之下，海外的廠商是直接采用標準的FP，如E3M4或E5M2等?！?/p>

為“中國AI+”而生

那么“UE8M0 FP8”為何適用于國產(chǎn)芯片？

毫無疑問，受制于技術積淀時間較短，而基于中國標準的算力生態(tài)建設還需完善，因此，國產(chǎn)算力硬件在制程、速率、電耗等標準上存在較大的提升空間。

而采用“UE8M0 FP8”格式深度適配國產(chǎn)芯片，并不僅僅是一項技術上的選擇，更是基于國產(chǎn)芯片的發(fā)展現(xiàn)狀、實際產(chǎn)業(yè)需求以及特定應用場景所共同推動的結(jié)果。本質(zhì)上是一次用算法創(chuàng)新彌補硬件短板，用生態(tài)協(xié)同構(gòu)建自主路線的戰(zhàn)略考量。

比如，國產(chǎn)芯片在先進制程（如7nm及以下）的制造和封裝技術上與國際頂尖水平存在差距，直接影響了芯片的算力密度。主流的矩陣乘法和卷積等編碼方式需要耗費極大算力以保留精度，而UE8M0的純指數(shù)編碼格式，將計算簡化為指數(shù)移位和加法操作，大幅降低了大量算力負荷。

與此同時，長期以來AI領域由英偉達CUDA生態(tài)主導，導致國產(chǎn)芯片往往需要兼容CUDA，且難以充分發(fā)揮自身硬件特性，也很難開拓性地建立自己的生態(tài)系統(tǒng)。

而“UE8M0”作為一種更加開源、未被單一廠商綁定的格式，可能成為國產(chǎn)芯片重建生態(tài)體系的關鍵。

無獨有偶，雖然未來“UE8M0 FP8”仍然會基于混合精度模式驅(qū)動語言類大模型應用，但是廣義的人工智能又絕非“大語言模型”這么簡單。比如，在今年年初DeepSeekV2問世之后，不僅人們在生活之中開始處處使用大語言模型交互，而且更多的企事業(yè)單位也對DeepSeek進行本地化、私有化部署，并通過語料后訓練等用于各種專用用途。

事實上，除大語言模型之外，明確定義的專用用途AI大模型更需具備大量程、高穩(wěn)定、高效率的算力特點。

比如，常被應用于自動駕駛和人形機器人具身智能的多模態(tài)VLA模型，滿足高效計算、大內(nèi)存帶寬和極大動態(tài)范圍的需求，特別是在處理多模態(tài)、大規(guī)模數(shù)據(jù)且部署在計算資源受限的邊緣設備時，優(yōu)勢明顯；而在工業(yè)質(zhì)檢、政務文檔處理等場景，往往需要低延遲、高準確率的AI模型，并且對成本敏感。

簡而言之，在明確定義的專用場景之中，“UE8M0 FP8”能夠發(fā)揮其高效、穩(wěn)定的特點，在配合混合參數(shù)精度的情況下，很可能是更適合“中國速度”，以及千行百業(yè)“AI+”的參數(shù)格式。

留意“不確定性”

當然，這個“UE8M0”背后仍然蘊藏著不確定性，如人形機器人精確操作依賴高精度的VLA架構(gòu)，如原生的中文大語言模型，也需要高精度來顯得更為“智慧”。

8月以來，隨著DeepSeekV3.1的發(fā)布，AI芯片企業(yè)寒武紀股價8月漲幅高達110%。

資料顯示，寒武紀的算力芯片思元590及可能于未來發(fā)布的690系列芯片均原生支持FP8計算，而沐曦、燧原等國產(chǎn)AI芯片廠商也均表態(tài)其適配FP8計算。

8月末，阿里巴巴公司也宣稱，其即將推出自研的AI算力芯片，并且會適配英偉達的CUDA生態(tài)，但未明確其是否適配FP8參數(shù)格式。

那么，DeepSeek所預言的下一代FP8芯片究竟歸屬哪家？21世紀經(jīng)濟報道記者咨詢多位業(yè)內(nèi)人士之后，仍未獲得進一步的信息。記者獲得的絕大部分說法是：各家均沒有明確的跡象，顯示其使用了“UE8M0 FP8”混合參數(shù)模型。

“我認為這是DeepSeek在向國產(chǎn)芯片行業(yè)提出自己的標準，”另一位中資全球化數(shù)字科技企業(yè)高管告訴記者：“這一邏輯的根源是，DeepSeek已經(jīng)在中國獲得了絕對的行業(yè)地位和市占率，因此它有能力讓芯片廠商根據(jù)自己的生態(tài)系統(tǒng)去定義芯片設計?！?/p>

這位不具名高管還向記者透露，雖然國產(chǎn)芯片對英偉達Hooper架構(gòu)系列芯片的追趕已初見成效，如寒武紀等公司宣稱其新品能力在專用場景下的能力達到H100的80%，但隨著英偉達Blackwell系列芯片的推出（其甚至采用了FP4的混合精度架構(gòu)），以及特供中國B30a系列芯片的發(fā)貨，國產(chǎn)芯片追趕國際一流芯片能力上仍有較長的路要走。

不過，多數(shù)受訪專家認為，國內(nèi)企業(yè)芯片最終將獲得成功，這需要仰賴其性能具備充分競爭優(yōu)勢。

責任編輯：李志強

DeepSeek

FP8

芯片設計

聲明：證券時報力求信息真實、準確，文章提及內(nèi)容僅供參考，不構(gòu)成實質(zhì)性投資建議，據(jù)此操作風險自擔

下載“證券時報”官方APP，或關注官方微信公眾號，即可隨時了解股市動態(tài)，洞察政策信息，把握財富機會。

網(wǎng)友評論

登錄后可以發(fā)言

發(fā)送

網(wǎng)友評論僅供其表達個人看法，并不表明證券時報立場