日韩人妻av一区二区-精品国产综合区久久久久久蜜臀-色女激情五月激情五月-99热国产这里只有的精品

DeepSeek的一串“符號”背后:對國產(chǎn)芯片意味著什么?
來源:21世紀經(jīng)濟報道21財經(jīng)APP作者:趙云帆2025-09-03 07:36

“UE8M0 FP8是針對即將發(fā)布的下一代國產(chǎn)芯片設計?!?/p>

這是深度求索公司8月份在新發(fā)布新模型DeepSeek V3.1的文檔中所留下的一個關鍵信息。

整個8月下旬,這串“符號”成為國產(chǎn)芯片與算力行業(yè)在資本市場狂歡的“財富密碼”。然而,對于非行業(yè)專業(yè)投資者來說,只有一頭霧水,很難明白這串略顯晦澀的代碼到底意味著什么,可以讓市場如此興奮。

“UE8M0 FP8”到底是什么意思?為什么它能引發(fā)資本市場對國產(chǎn)芯片的高度關注?而我們又需注意哪些不確定性?21世紀經(jīng)濟報道記者采訪了數(shù)位AI和算力行業(yè)人士,并嘗試為這三個問題找到一些解答。

極致的效率追求

首先“UE8M0 FP8”是什么意思?

“FP”即“浮點”,是計算機二進制計算的基礎單位,與“INT”整數(shù)計算相對應,常以科學計數(shù)法表達數(shù)據(jù),適用于圖形處理、科學計算、深度學習等應用場景?!癋P8”即代表8位浮點,以此類推,F(xiàn)P16、FP32分別代表16位和32位浮點。而每個浮點位又分別用于記錄符號(+、-)、“E”階數(shù)(指數(shù))、“M”尾數(shù)(小數(shù))等關鍵數(shù)據(jù)信息,“通過科學計數(shù)法計算的方式”來記錄數(shù)據(jù)。

所以,“UE8M0 FP8”,即代表無符號、8位指數(shù)、0位尾數(shù)的參數(shù)格式。

一個恰如其分的比喻是,“指數(shù)位E”是人工智能丈量世界的尺的刻度,它既能測量微觀世界的塵埃,也能丈量宏觀世界的山河——但是,它需要符號位和尾數(shù)“M”來幫它確認精度。而在主流的參數(shù)格式FP8、FP16、FP32等中,其主流參數(shù)格式對應的指數(shù)位分別為4位、5位和8位。

其中,“FP32”是科學計算、模型訓練和推理的金標準,但因浮點位數(shù)高,計算資源耗費巨大,常用“混合”了FP16、FP8的混合精度進行高效化替代。

而“UE8M0”,就仿佛一個“百招會不如一招鮮”的高手,將自己所有的技能點全部聚焦到自己的量程之上,由此達到和FP32同樣的數(shù)據(jù)范圍。

“E8M0是用8位表示指數(shù)部分,尾數(shù)部分為0,所以Scale(標度)的值范圍上和FP32差不多,因為FP32也是8位表示指數(shù)部分,可以保證量化范圍大,有利于模型訓練的數(shù)值穩(wěn)定?!鼻叭蝾^部數(shù)據(jù)庫企業(yè)高管許天(化名)告訴記者:“所以我理解E8M0對比FP32速度更快,對比E5M2類的FP8數(shù)值范圍更大,訓練更穩(wěn)定。”

當然,純粹的“UE8M0”,自然會以舍棄精度作為代價。但是,由于Transformer架構(gòu)(一種采用注意力機制的深度學習架構(gòu))下的AI大模型,其關鍵自注意力機制原本就依賴于浮點的大量程,因此 “UE8M0”創(chuàng)造了一種“犧牲局部精度,換取全局穩(wěn)定”的人工智能計算格式。

“UE8M0 FP8指的是一種為中國市場而特別定制的模型格式,能有效降低計算功耗,基于芯片規(guī)格的限制,此格式對中國的芯片廠商比較友好?!監(jiān)mdia首席分析師蘇廉節(jié)告訴記者。“相比之下,海外的廠商是直接采用標準的FP,如E3M4或E5M2等?!?/p>

為“中國AI+”而生

那么“UE8M0 FP8”為何適用于國產(chǎn)芯片?

毫無疑問,受制于技術積淀時間較短,而基于中國標準的算力生態(tài)建設還需完善,因此,國產(chǎn)算力硬件在制程、速率、電耗等標準上存在較大的提升空間。

而采用“UE8M0 FP8”格式深度適配國產(chǎn)芯片,并不僅僅是一項技術上的選擇,更是基于國產(chǎn)芯片的發(fā)展現(xiàn)狀、實際產(chǎn)業(yè)需求以及特定應用場景所共同推動的結(jié)果。本質(zhì)上是一次用算法創(chuàng)新彌補硬件短板,用生態(tài)協(xié)同構(gòu)建自主路線的戰(zhàn)略考量。

比如,國產(chǎn)芯片在先進制程(如7nm及以下)的制造和封裝技術上與國際頂尖水平存在差距,直接影響了芯片的算力密度。主流的矩陣乘法和卷積等編碼方式需要耗費極大算力以保留精度,而UE8M0的純指數(shù)編碼格式,將計算簡化為指數(shù)移位和加法操作,大幅降低了大量算力負荷。

與此同時,長期以來AI領域由英偉達CUDA生態(tài)主導,導致國產(chǎn)芯片往往需要兼容CUDA,且難以充分發(fā)揮自身硬件特性,也很難開拓性地建立自己的生態(tài)系統(tǒng)。

而“UE8M0”作為一種更加開源、未被單一廠商綁定的格式,可能成為國產(chǎn)芯片重建生態(tài)體系的關鍵。

無獨有偶,雖然未來“UE8M0 FP8”仍然會基于混合精度模式驅(qū)動語言類大模型應用,但是廣義的人工智能又絕非“大語言模型”這么簡單。比如,在今年年初DeepSeekV2問世之后,不僅人們在生活之中開始處處使用大語言模型交互,而且更多的企事業(yè)單位也對DeepSeek進行本地化、私有化部署,并通過語料后訓練等用于各種專用用途。

事實上,除大語言模型之外,明確定義的專用用途AI大模型更需具備大量程、高穩(wěn)定、高效率的算力特點。

比如,常被應用于自動駕駛和人形機器人具身智能的多模態(tài)VLA模型,滿足高效計算、大內(nèi)存帶寬和極大動態(tài)范圍的需求,特別是在處理多模態(tài)、大規(guī)模數(shù)據(jù)且部署在計算資源受限的邊緣設備時,優(yōu)勢明顯;而在工業(yè)質(zhì)檢、政務文檔處理等場景,往往需要低延遲、高準確率的AI模型,并且對成本敏感。

簡而言之,在明確定義的專用場景之中,“UE8M0 FP8”能夠發(fā)揮其高效、穩(wěn)定的特點,在配合混合參數(shù)精度的情況下,很可能是更適合“中國速度”,以及千行百業(yè)“AI+”的參數(shù)格式。

留意“不確定性”

當然,這個“UE8M0”背后仍然蘊藏著不確定性,如人形機器人精確操作依賴高精度的VLA架構(gòu),如原生的中文大語言模型,也需要高精度來顯得更為“智慧”。

8月以來,隨著DeepSeekV3.1的發(fā)布,AI芯片企業(yè)寒武紀股價8月漲幅高達110%。

資料顯示,寒武紀的算力芯片思元590及可能于未來發(fā)布的690系列芯片均原生支持FP8計算,而沐曦、燧原等國產(chǎn)AI芯片廠商也均表態(tài)其適配FP8計算。

8月末,阿里巴巴公司也宣稱,其即將推出自研的AI算力芯片,并且會適配英偉達的CUDA生態(tài),但未明確其是否適配FP8參數(shù)格式。

那么,DeepSeek所預言的下一代FP8芯片究竟歸屬哪家?21世紀經(jīng)濟報道記者咨詢多位業(yè)內(nèi)人士之后,仍未獲得進一步的信息。記者獲得的絕大部分說法是:各家均沒有明確的跡象,顯示其使用了“UE8M0 FP8”混合參數(shù)模型。

“我認為這是DeepSeek在向國產(chǎn)芯片行業(yè)提出自己的標準,”另一位中資全球化數(shù)字科技企業(yè)高管告訴記者:“這一邏輯的根源是,DeepSeek已經(jīng)在中國獲得了絕對的行業(yè)地位和市占率,因此它有能力讓芯片廠商根據(jù)自己的生態(tài)系統(tǒng)去定義芯片設計?!?/p>

這位不具名高管還向記者透露,雖然國產(chǎn)芯片對英偉達Hooper架構(gòu)系列芯片的追趕已初見成效,如寒武紀等公司宣稱其新品能力在專用場景下的能力達到H100的80%,但隨著英偉達Blackwell系列芯片的推出(其甚至采用了FP4的混合精度架構(gòu)),以及特供中國B30a系列芯片的發(fā)貨,國產(chǎn)芯片追趕國際一流芯片能力上仍有較長的路要走。

不過,多數(shù)受訪專家認為,國內(nèi)企業(yè)芯片最終將獲得成功,這需要仰賴其性能具備充分競爭優(yōu)勢。

責任編輯: 李志強
聲明:證券時報力求信息真實、準確,文章提及內(nèi)容僅供參考,不構(gòu)成實質(zhì)性投資建議,據(jù)此操作風險自擔
下載“證券時報”官方APP,或關注官方微信公眾號,即可隨時了解股市動態(tài),洞察政策信息,把握財富機會。
網(wǎng)友評論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換