本站AI自動判斷提供您所需要的app下載:點我下載安裝,你懂的APP
9 月 2 日,Nvidia 終于發布了大家翹首以盼的 RTX 30 系列(安培架構)的顯卡。尤其是 RTX 3070,比起上一代的顯卡王者 RTX 2080Ti,在游戲里平均幀率高出 8% 的基礎上,價格卻低了整整一倍。
雖然通過 Steam 最新的顯卡數據 來看,GTX 10 系在 PC 玩家群體中依然是主流,隨著下半年游戲潮的到來,《賽博朋克 2077》《看門狗:軍團》《消逝的光芒 2》等等支持實時光追的游戲會越來越多;加上即將到來的「雙十一」購物季,對于老用戶、尤其是堅守在 10 系顯卡的用戶來說,剁手升級的時間似乎已經到了。
那么什么是實時光線跟蹤,傳統游戲是怎么打造光照效果的,升級 RTX 顯卡能帶來什么,RTX 30 系列的實際性能到底如何?在這篇文章中,我們就來對上面這些問題進行梳理。
傳統的游戲光照效果是如何實現的根據初中所學習的生物和物理知識,我們之所以能看見東西是因為光源發出的光在傳播中遇到了不同材質的物體,產生了反射、折射、漫反射、散射等光學現象,這些不同的光學效果帶來的最后一部分光刺激到了人眼視網膜上的感光細胞,我們才得以看到不同顏色的物體。
所以不同材質的物體從相同角度來看給我們的觀感不一樣,相同材質從不同角度看過去的感覺也會不一樣。在沒有光或者光線很暗的時候,我們也很難看清楚東西。
真實環境的光線遠比游戲復雜 圖片來自 @unsplash
和現實世界不同,傳統的游戲世界在重現這種光照效果時更加注重「最終效果」。我們不妨從兩個方面來理解傳統游戲世界的光照實現方式:
P.S. 我并非專業游戲開發從業者,也對圖形學沒有深入研究,所以只能簡單地介紹下原來游戲里是怎么處理光線的,如果我有哪方面解釋錯誤歡迎大家在評論區指正。
首先,現代 3D 模型實際上都是通過三角形構成的,這是因為:
三角形是最簡單的多邊形,少于3個點就不能成為一個面。所以通過三角形可以節約算力。
三角形必然在同一個平面內的,4 個或以上的點的多邊形不一定在一個平面內,多余的點可能在這個面之上或者之下。所以通過三角形可以減少差錯。
除了從三角形的邊看三角形、三角形會變成線段以外,三角形無論從其他角度來看都是三角形。所以通過三角形可以在必要的時候直接忽視。
同時三角形的面數決定了模型的精細程度,模型精度越高,三角形數目也就越多,性能開銷也就越大。
由三角形構成的模型,越復雜的模型也越精細
接下來,我們要知道什么是「光柵化」。
由于我們的屏幕是一個二維的平面,但是大部分的游戲模型卻都是三維的,為了能讓三維的模型正確顯示在二維平面上,我們就需要通過一系列的過程去轉換它們:
讀取模型的頂點,并根據頂點畫三角形
將三角形用近似連點描邊的方式轉化成屏幕上的像素(三維坐標系可以是小數,而屏幕二維坐標只能是整數,這也是模型最后出現鋸齒的元兇)
根據算法計算屏幕像素點到底是在三角形內還是三角形外。在三角形內部的,就上色,在三角形外部的,就不上色。
最后判斷這個三角形哪些部分被前面其他三角形遮擋了,對于遮擋的部分就不需要上色,來減少不必要的性能開銷。
光柵化工作原理
這個整個過程我們就叫它「光柵化」,通過「光柵化」我們就可以完美地將創作者想要呈現的畫面呈現出來,同時游戲里的光的實現也是在「光柵化」這個過程里實現的,只需要對三角形內部的像素進行額外的上色步驟即可:
首先模型的三角形都有對應的固有顏色(皮膚有固有的膚色、頭發有固有的發色),所以將模型轉化到二維像素以后,可以通過每個三角形的顏色為每個屏幕上的像素分配一個初始顏色值。接下來要根據場景里的其他光源來進一步的像素處理來改變像素的顏色,最后還需要根據紋理(皮革有皮革的紋理,布料有不同的材質)對像素做最后的處理,進而生成應用于像素的最終顏色。
我知道這個過程對大多數人來說都很抽象,我換個更生動形象的說法來說,基于光柵化的游戲光線處理,實際上是你看到的畫面里所有的物體在自行發光,而不是和生活中一樣通過折射、反射等手段傳遞光線。這也就是我們在上面所說的以渲染「最終效果」為主要手段。
光柵化的優點在于可以足夠快,程序員可以預先寫好光線的程序來處理小面積的光線,還可以制作光照貼圖,在需要的時候和環境再進行渲染呈現(靜態光照效果)來減少處理壓力;但是缺點也很明顯:不夠真實,比方說游戲中的物體投影大部分時候都是一整塊顏色相同的區域(陰影貼圖),但是我們仔細觀察生活會發現由于光的復雜性實際上的投影由近到遠是越來越淺的。
投影和更接近真實的投影 圖片來自 unreal 引擎官網
光線追蹤:用更現代的技術再現光線相比之下,實時光線跟蹤可以營造比傳統處理方式更加真實的光線,它通過逆向跟蹤與假想照相機鏡頭(或者眼睛)相交的光作為工作原理,來實現對光線的實時追蹤。
逆向跟蹤遠比真實地模擬光線相互作用的效率要高很多,因為大部分的光經過多次反射會逐漸消失,最后也不會進入眼睛,減少不必要的模擬會讓最后的計算壓力小很多。
通過逆向跟蹤實現的實時光線跟蹤
實時光線跟蹤技術最終的產物大家或多或少也都接觸過了,電影院里能看到的不少好萊塢大片,在特效制作過程中其實都會用到光線追蹤技術,最終生成以假亂真的特效場景——這背后往往需要以億為單位的龐大運算量,每一幀的畫面都需要高性能計算機花費數小時的運算。而這僅僅是在設計好一切之后的視覺運算,相比于電影提前設計好了場景和環境的光線計算,游戲的隨機性顯然更大,實時光線跟蹤的實現難度自然也更高。
那么如何把光線跟蹤引入到游戲中呢?
作為第一個將光線跟蹤技術引入的顯卡,Nvidia 在 RTX 20 系列中專門設計了幾組 RT Core 來加速逆向跟蹤光線的過程,比起 GTX 10 系列,RT Core 能夠在實時光線跟蹤這件事情上擁有更好的性能,表現在游戲中就是,開啟實時光線跟蹤以后 RTX 20 系列的顯卡平均幀數會更高。
具體而言,RTX 在游戲中實時光線跟蹤主要有三種不同的實現方式:
陰影
高級反射
全局光照
僅陰影
僅陰影的代表游戲就是《古墓麗影》,這也是實時光線跟蹤最簡單的實現方式,只需要確定動態光源的數量和位置就可以給游戲帶去動態陰影的效果,在任何的表面和環境下都能獲得逼真自然的陰影效果。
上:未開啟光追;下:開啟光追,人物有了更真實的投影
高級反射
高級反射的代表游戲是《戰地 5》,光線需要實時跟蹤場景里的所有物體才能正確精準地表現出反射效果,所以很多時候會造成很大的計算壓力,因此這里往往還會引入傳統的反射處理方法:屏幕空間法,只要畫面中你能看到的物件不出現、被遮擋或是不可見,就不會產生反射。這也是為什么有些游戲中鏡子看不見背后的人的原因。
上:開啟光追;下:未開啟光追,小汽車更融入環境里了
全局光照
最復雜的實時光線跟蹤方式則是實現全局光照,《地鐵:離去》和《控制》都利用了實時光線跟蹤去實現全局光照。無論是光源、反射還是投影都是實時光線跟蹤計算得到的,這可以進一步提高光照的準確度,更好地烘托游戲場景和氛圍。
上:未開啟光追,下:開啟光追;房間內的光照更為準確,給人的感受更為真實
但是實現全局光照的壓力真的是太大了:在沒有 RT Core 的 GTX 系列的顯卡上打開《地鐵:離去》的實時光線跟蹤,1080Ti 的表現直接從「高刷模式」掉到了「電影級畫質」,幀率從 149 掉到了 38。
進一步了解實時光線跟蹤技術和傳統技術在最后營造的畫面上有什么不同。
所以正如前面提到的電影工業里的實時光線跟蹤十分考驗計算能力一樣,即便有 RT Core 這樣的計算核心進行加速,在原生分辨率下開啟實時光線跟蹤也會帶來非常嚴重的幀率下滑;受限于成本, Nvidia 也不可能無限制地堆砌 RT Core 數量(不然就真的沒幾個人買得起了)。
有沒有什么辦法在不降低分辨率的情況下仍能獲得穩定的幀率呢?
DLSS:讓高分辨率光追成為可能既然高分辨率不能達到穩定的幀率,那不如先降低分辨率渲染,再用算法提升到較高的分辨率,這樣不就高分辨率和穩定幀率兼得了嘛。
沒錯,這其實也是目前大部分游戲機的處理 4K 畫面輸出的辦法。但是用什么算法提升分辨率呢?
圖片來自知乎 @一疼 ETN
很多人會想到的第一個方法可能是插值技術。借助插值,我們可以很輕松地將 1080P 畫面提升至 4K 分辨率,但簡單插值效果并不好,對游戲這種特殊的渲染內容而言,還會帶來額外的鋸齒。
所以 Nvidia 選擇了用深度學習去計算畫面,也就是我們看到的 DLSS 技術。
DLSS 的全稱是 Deep Learning Super Sampling(深度學習的超采樣),它主要通過 RTX 20 系列引入的 Tensor Core 硬件加速了深度學習,來對實時渲染的圖片實現非常高質量的超分辨率。
在 RTX 30 系列發布以前,DLSS 2.0 就已經發布了,對比上一代的 DLSS 有如下改進:
4 倍的實時超采樣
2 倍的處理速度
通用模型
媲美甚至超越原生分辨率的畫面
4 倍的實時超采樣,讓我們在一個極低的分辨率下就可以獲得一個高分辨率,比方說只需要渲染一個 540P 的畫面即可生成一個 1080P 的最終畫面,大幅度減少了顯卡壓力。加上全新的算法方式,最后獲得甚至可以超越原生 1080P 的畫面。
圖片來自知乎 @文刀秋二
高達 2 倍的處理速度,主要體現在一段時間內可以處理的幀數會更多了,搭配 4 倍的實時超采樣,最后的結果就是渲染的性能會暴漲游戲幀率直線上升。以《控制》為例,4K 分辨率下光追效果全開(全局光照),直接把 2060 的 8 FPS 提升到了 36 FPS,讓 PPT 有了可玩性,堪稱魔法。
圖片來自知乎 @文刀秋二
而使用通用模型可以快速在多個完全不同的場景、引擎和風格的游戲中部署 DLSS,讓所有的游戲利用同一個神經網絡實現高質量的超采樣。
本來在游戲圖形領域,性能和畫質絕對是成反比的,要想要更好的畫質,就一定要犧牲性能。而通過 DLSS 2.0 這種魚和熊掌兼得的革命性技術,我相信原生分辨率渲染輸出很快就會變成過去式,超采樣的畫面不僅不差,反而可能會更好。
左:未開啟 DLSS 的原生 1080P,右:開啟 DLSS 的 1080P
那 RTX 30 系列顯卡怎么買?在上一代 RTX 20 系列顯卡推出以后,我們就已經見識到了游戲實時光線跟蹤帶來的魅力。而這次更加令人矚目的是 Nvidia 宣稱 RTX 3080 有 2 倍于 RTX 2080 的性能,價格還只需要 700 美元,對比RTX 2080 推出的時候售價高達 800 美元的售價,這根本就是加量反而還降價了。
等等,真有「2 倍性能」那么夸張嗎?
RTX 3080 提升了多少?首先,聊聊所謂的 RTX 3080 對比 RTX 2080 提高了的 2 倍性能這一點,在 LTT 視頻中 Nvidia 表示這個 2 倍專指《雷神之錘 2 RTX》和《我的世界 RTX》兩個游戲下的性能提高了 2 倍,另外值得一提的是這兩個游戲的光追都是全局光照。
那么 RTX 3080 性能到底怎么樣:
圖片來自 LTT
在 2K 原生分辨率下進行實時光追,RTX 3080 不僅和定位相同的 RTX 2080 比提升了 20%~75% ,同時也比價格更高的 2080Ti 也快了不少。
而在 4K DLSS 2.0 分辨率下,作為現在「顯卡殺手」的微軟模擬飛行 2020,RTX 3080 跑出了 41FPS 的優秀成績,遠比 2080 和 2080Ti 強上不少。對于即將入手非公版 3080 的我來說,終于可以安安靜靜地開飛機了。
圖片來自 LTT
圖片來自 LTT
在 4K DLSS 2.0 分辨率下打開實時光追進行游戲,3080 最低也能夠保證「電影級幀率」,雖然看起來并不好看,但是和上一代的旗艦對比足夠了,況且還有一個能以 8K 分辨率運行游戲的 3090 呢。
關于 RTX 3080 的完整測試可以點擊 此處 觀看,這里結合 LTT 的視頻、超能網的測評以及 TECHPOWERUP 的測評,簡單總結下和 RTX 2080 比性能有多少提升:
光線追蹤開,DLSS 關:RTX 3080 ≈ 2x RTX 2080 ≈ 1.5x RTX 2080 Ti
光線追蹤開,DLSS 開:RTX 3080 ≈ 1.8x RTX 2080 ≈ 1.37x RTX 2080 Ti
光線追蹤關 ( 或不支持 ) :RTX 3080 ≈ 1.67x RTX 2080 ≈ 1.34x RTX 2080 Ti
所以,雖然一般情況下 RTX 3080 很難達到 RTX 2080 的兩倍,但是它的提升幅度仍然非??捎^,跑起游戲來真的是非常強勁,加上今年即將到來的游戲大部分都會支持實時光追技術,看起來 RTX 30 系列非常值得入手。
價格差距那么大,買哪款?如果你關注 RTX 3080 的非公版首發價格,就會發現同型號首批 30 系顯卡的首發價格從 5500 元~7500 元不等,價格差距非常大。
其實不止 RTX 3080,其他顯卡也是這樣——雖然核心都是 RTX 3080,但是顯卡核心周圍的板載電容、散熱設計等等,都會導致顯卡價格出現差距。一般來說,一張顯卡的價格受下列幾個因素影響:
芯片的基礎價格:RTX 3070 核心和 RTX 3080 價格就不一樣
芯片體質:更好的體制意味著核心可以更容易 Boost 到更高的頻率,意味著可以在部分復雜場景里保持更高的幀率;或是能夠保證長期超頻使用下的穩定性。
散熱設計:更好的散熱設計意味著核心可以更容易停留在更高的頻率,意味著可以在部分復雜場景里保持更高的幀率。或者在正常情況下保證更靜音的體驗,有誰會不愛靜音呢。
用料做工:電容的用料、電容的多少也會影響到顯卡的性能和穩定性,尤其是超頻后的穩定性。像是有的適用于 ITX 主板的短卡,因為工藝集成高所以更貴。另外像是這次 3080 非官版系列也有雙 8pin 和三 8pin 供電的區別。
外觀設計:有些用戶喜歡更炫酷的外觀,像是顯示屏、發光元件,這部分的價格也不便宜;而有些特殊配色要價也不便宜。
品(xing)牌(yang)溢價:部分品牌也是有一定比例的品牌溢價的,當然也確實有很多人愿意埋單。
所以某張顯卡到底價值多少,不僅要看紙面數據,還得結合我們看不見的各種因素綜合考慮。
價格預算是第一要義,由于顯卡定價的因素過多,關于這個方面我只能說在購買的時候一定在有預算的基礎上再有一個購買目標,是更喜歡炫酷的外觀還是偏好靜音,這樣可以快速挑選出合適自己的幾張顯卡,搭配著拆解或者測評,來決定最后的選擇。
另外由于這次產能有限,如果不是真的很急的話,不要急著買有溢價的顯卡。
尺寸購買顯卡的時候還需要考慮機箱塞不塞的下這個體積的卡,比方說你一個 ITX 機箱一般來說肯定塞不下 ATX 尺寸的顯卡的,這個一般在搜索時帶上 ITX 這樣的關鍵詞就可以避免了。
顯卡的厚度也會影響到能不能正常使用,這次 RTX 3080 有的是占據三槽位的,有的是則是兩槽位的,三槽位的在一部分主板上可能會擋住另外一個 PCI-E 槽,如果這個 PCI-E 槽有在使用的話,就只能選擇購買兩槽位的版本。
關于這點可以去主板官方去查詢 PCI-E 槽之間的距離與顯卡的厚度進行比較。
部分機箱的硬盤盒可能也會限制可安裝顯卡的長度,這點可以通過機箱說明書或者在機箱官網查詢到。而對于購買了品牌機的人群來說,升級顯卡的時候需要參照品牌機官網的說明,一般品牌機官網有詳細的說明
電源這次 RTX 30 系列整體功耗屬實高了不少,電源到底要多少才比較合適呢?
這里要說個前提,顯卡功率不是線性的,也不會像在軟件里顯示得那么平滑,而是會在短時間里沖到一個非??鋸埖闹翟僭诙唐陂g內回落。雖然電源能有一定的過載輸出的能力,但是長期過載輕則游戲閃退黑屏系統不穩定,重則損傷電源甚至影響到電腦里別的部件,所以電源一定要買夠功率才行。
非??鋸埖?3090 峰值功率,來自 fcpowerup
我這里引用 fcpowerup 的結果,在處理器是 i9-9900K 的時候,對于 RTX 3080 來說,電源至少需要 750 W;對于 RTX 3090 來說,電源至少需要 950W。滿足這一要求即可安全穩定地進行游戲,而不會出現黑屏游戲閃退、電源損耗過大的情況,如果 CPU 等級更高的話還需要用更大的電源。
小結上面其實已經提到,我這次其實也打算買一塊非公版的 RTX 3080。所以文章的最后,我就簡單分享一下我的具體選購思路吧,僅供參考。
首先確定不買公版:公版的會把熱風往 CPU 散熱器那邊吹,我用的又是風冷,怕 CPU 散熱壓力太大,所以我最終選擇了非公。
接下來預算:期望預算和公版差不多,大概在 5500~5800 元左右搞定。
同時檢查現有的硬件的兼容性:850W 的金牌電源足夠了,機箱長度足夠,主板空間也足夠大。
再去京東把所有的 RTX 3080 顯卡和即將上架的顯卡的顯卡數據列出,順便看看有沒有測評能進一步完善數據無法體現出來的東西。再定一個目標幫助去掉不必要的選擇:和公版性能差不多、沒有 RGB、安靜。
最后我選擇了影馳 RTX 3080 金屬大師,沒過多的 RGB,風扇 RGB 可以關閉,整體風格比較硬朗。本來決定等價格回落點就是它了,不過現在聽說未來 RTX 3080 還有 20G 顯存版,所以我還是等等好了。
以上就是本文的全部內容,希望它能幫助到你。
人物簡介
胡偉武是著名的計算機領域專家,任龍芯中科技術有限公司董事長,也是我國第一顆通用處理器龍芯的總設計師。他堅持自主研發,主持研制了“龍芯”系列芯片,實現了我國CPU關鍵核心技術的突破。2020年,他榮獲北京市突出貢獻中關村獎,摘得北京科學技術最高獎桂冠。這也是北京市科學技術獎勵大會首次頒發“人物獎”。
“龍芯之父”胡偉武。受訪者供圖
傳承
龍芯為國家安全做了貢獻,這個目標已經基本做到了。當然這還不夠,我們希望為整個產業發展做貢獻,能支撐產業發展形成生態,是我的目標。我從事教學,我在中國科學院大學教學生。我不覺得這是負擔,而是我工作的一部分?,F在人才主要都在X86和ARM體系上學出來的,我們要讓他們在龍芯體系上學習計算機。讓我很感動的是中小學老師的一呼百應,他們很有情懷,非常支持自主安全的龍芯體系。今年,有兩三萬臺龍芯電腦將走進全國的中小學校,教育系統的總含量應該達到兩三千萬臺。
上世紀90年代末,通用計算機大量涌入中國市場,國內誕生了一批通用計算機生產企業,但作為計算機系統運算和控制核心的CPU全部依賴進口。2001年,33歲的胡偉武在中科院計算所組建了課題組,開始了自主CPU“龍芯”的研制。
20年來,龍芯曾有高光時刻,也經歷過低谷。時光荏苒,“龍芯之父”胡偉武的頭發已經斑白,但他的初心沒有變——穩扎穩打做“人民的CPU”。經過20年的積累,“龍芯”CPU性能正在不斷提高,逼近市場主流產品的水平。
“自主信息產業體系建設是一項復雜任務,既要有只爭朝夕的奮發,又要有十年磨劍的堅持。”未來十年,胡偉武有更加深遠的考慮——打造Wintel(微軟+英特爾)體系和AA(ARM+安卓)體系之后的第三套生態體系。他相信,在兩三年內,龍芯將有能力走向開放市場和國際市場。
勤奮的學霸
如果用現在的網絡流行語形容,青少年時期的胡偉武,是名副其實的“學霸”。
1968年,胡偉武出生于浙江永康。在當時,農村孩子總是重復走父母的老路——長大當農民。但在父親的鼓勵下,胡偉武立志長大以后要當科學家、搞科研?!拔覐男】串媹蠛碗娪埃貏e羨慕穿著白大褂的科研人員、拿著圖紙的工程師。我心里有向往,學習也格外用功。”
上世紀70年代,農村學生沒有輔導書。胡偉武的父親是名鄉村教師,在縣里參加教師培訓后將培訓書籍和應用題集帶回了家。小學三年級暑假,胡偉武把兩本厚厚的應用題集全部做完?!霸谀且院?,小學所有應用題,沒有一個老師做得過我”。教語文的父親鼓勵他背成語詞典,大年初一家里來了客人,大人們寒暄聊天,他圖清靜,冒著大雪跑到后山去背成語。
在小學和初中階段,由于父親工作調動,胡偉武不斷轉學。每次轉到新學校,那里的第一名就換成了他。胡偉武回憶說,當時年少氣盛,如果分數被第二名追得太緊,他心里都會不舒服。
備戰高考時,胡偉武形容自己是從題海中沖出來的?!白鲱}做到什么程度?就是我買一本新的書回來,發現找不到沒做過的題目?!?986年,他以浙江省理科第29名的高考成績考入中國科學技術大學計算機專業,他記得,當時中科大計算機專業的平均錄取成績比清華大學還高30分。
大學期間,胡偉武愈加勤奮。偶爾周六晚上他去看場電影,回到宿舍覺得特別內疚,后悔浪費了兩個小時,于是周日一大早就到圖書館去上自習,想把時間補回來。
“龍芯零號”與原始創新
“我們這一代計算機人自主化的基因來自第一代計算機人的傳承。”胡偉武這樣說。
上世紀80年代,我國科技工作者為兩彈一星、石油勘探等國家重大工程造計算機?!爱敃r的計算機‘從沙子做起’,完全自主,沒有一點對外依賴?!贝髮W期間的胡偉武有一個心愿——“如果這輩子有機會能夠參與做一臺生產生活中使用的計算機,我就很開心了,哪怕是做一個邊角模塊,就沒白學計算機?!?/p>
教胡偉武計算機專業課的老師,是做過真正計算機的一批人,有人負責運算部件,有人負責控制部件,各展所長。1989年,讀大四的胡偉武進入實驗室做科研,他費盡周折做了相當于計算機“大腦”的核心部件——CPU(中央處理器),把DOS操作系統跑了起來。
“我當時做的相當于Intel 8086微處理器芯片。8086有幾萬個晶體管,我們買到的小芯片只有幾十個晶體管。沒有錢做電路板,我們就用電烙鐵把四百多個芯片連接在一起,把X86指令系統實現了一遍。”后來,胡偉武將其稱為“龍芯零號”。
1991年9月,胡偉武被保送進入中科院計算所讀研究生,師從我國計算機事業的重要創始人、中國第一個計算機三人小組成員夏培肅院士。彼時,中國已經不再自己造計算機,轉而購買國外工業化批量生產便宜的計算機。完全市場化后,計算機研發從兩個核心領域退出,一個是CPU,一個是操作系統。當時,胡偉武的研究方向為分布式共享存儲,他多次發表論文并參加國際會議。
5年后,胡偉武獲得博士學位,博士論文入選“首屆全國百篇優秀博士學位論文”。根據當時的國家政策,他可以獲得公派出國的機會。一位國外教授向他伸出橄欖枝,承諾讓他帶領一個科研團隊。此時,他的大學同學一多半去了美國硅谷,收入頗豐。還有一些同學在外企工作,月薪上萬。
是否出國做科研?猶豫不決的胡偉武向夏培肅征求意見。“夏老師叫我不要出國,她說我們國家計算機領域還有一些方面存在不足,我們要為國家做貢獻。我聽從老師的教導,留在了計算所。”
在計算所,胡偉武跟隨夏培肅做基礎研究項目,和所里做應用項目的同事相比,收入差了一大截。計算所另一個部門的領導相中他能干、責任心強,想“挖”他去自己的部門接班,許諾為他加薪分房。當時,胡偉武的孩子剛出生,家里卻沒有住房,一家人住在哥哥家,到計算所上班要花上兩小時。
他有點動心,換部門不算違背老師的希望,既沒出國也還在計算所工作。“我跟愛人商量,她一句話點醒了我,說你現在離開課題組,如果不是因為科研做不下去,而是為了生活問題,就怕你將來會后悔?!?/p>
有了妻子的支持,胡偉武內心不再矛盾,繼續拿著每月800元的工資,跟著夏培肅做基礎研究?!艾F在的說法叫原始創新。”
“做不出CPU,提頭來見”
上世紀90年代后期,我國高性能計算機跟美國相比差距巨大。石油勘探、天氣預報等工作使用的高性能機,需要通過特批方式購買。然而買回來的機器,仍然要在對方的監督下使用。
“我們經常聽到‘玻璃房子’的故事。通透的玻璃房里,放著一臺從美國買來的超級計算機。中國科學家得在美方監視下上機操作,不得用于軍事目的?!?/p>
在這些故事的“刺激”下,中國科研人員決心要做自己的高性能機。1998年,夏培肅聯合金怡濂院士、周毓麟院士主持召開香山科學會議,討論我國高性能機發展問題,胡偉武作為會議秘書參會。會議最終聚焦在CPU的自主研發上,大家認為,通用CPU是核心技術,不可受制于人?!敖疴ピ菏康囊痪湓捵屛矣∠笊羁?,他說CPU一定要做,哪怕做個586(處理器),也得試試看。586和當時市場上的主流CPU差了好幾代。”
CPU被認為是計算機的“大腦”。但當時,我國要不要自主做CPU沒有形成共識,由于研發CPU投入過大,“造不如買”的觀點一直盛行。1999年,同為夏培肅學生的李國杰就任計算所所長,他一邊改革提升科研人員的薪酬待遇,一邊呼吁在“十五”期間(第十個五年計劃)做中國自主的CPU。
2000年10月,胡偉武回母校中科大為計算所招生。10年后再次回到實驗室,他看到大學時期做的機器還在那里,滿桌子的芯片、電烙鐵把他“帶回”激情燃燒的歲月。他激動地給當時計算所的系統結構室主任唐志敏打電話,誓言“做不出CPU,提頭來見”。
不久后,李國杰突然在一次所內會議上宣布,由33歲的胡偉武承擔研發CPU的課題,并為他拉來了100萬的資金。事先并不知情的胡偉武倍感振奮,帶領團隊投入了忘我的攻關中。
“龍芯1號”誕生
時至今日,“龍芯”誕生的故事,聽起來依舊很“燃”。
胡偉武還記得2001年8月19日的天氣?!澳翘毂本├纂娊患?,通過四個月的努力,我們終于做出了龍芯的原型系統,把操作系統跑起來了?!彼忉屨f,CPU處理器芯片就好像一本書,可以批量生產;而原型系統把設計邏輯寫到可編程的FPGA芯片里,相當于把一篇文章寫到空白的本子里。這一進展立刻引起了中科院的重視,中科院設立方向性項目,并給予課題組500萬的支持。
當時課題組成員“玩命”攻關,他們有一種觀點——我們現在落后那么多,要是大家每周工作5天,每天只工作8小時,恐怕很難趕上,必須像當年搞“兩彈一星”一樣拼命。
胡偉武回憶說,有一次團隊被一個問題卡住了,大家六、七天沒有回家,困了就睡在辦公室的上下鋪?!爱敃r正是伏天,我們的衣服是黏在身上的,自己聞起來都覺得有一股餿味兒。”后來問題被解決,胡偉武回家洗了個澡,感覺走在路上渾身輕飄飄的,“像要飛起來一樣”。
緊急攻關時,團隊過著“食不知味”的日子。問題被解決那天,團隊三位成員來到志新橋旁邊的粥鋪,一口氣吃光了17個碟子。熬通宵的日子讓胡偉武對人的生理極限有了新的認識。“凌晨1點到2點的時候最困,熬過去就好了。連熬七天的時候,第二天和第三天最困,熬過去就不困了。”
2002年8月10日凌晨6時08分,中科院計算所北樓105房間掌聲雷動。安裝了“龍芯1號”CPU的計算機正常啟動工作,屏幕上如約出現“login:”字樣?!褒埿尽闭Q生,意味著中國人只能依靠進口CPU制造計算機的歷史終結。
課題組成員給“龍芯”取了一個有傳統特色的小名“狗?!保M昂灭B活”,音譯成英文就是Godson。
告別體制,下海辦企業
“十五”期間,龍芯解決了一個問題,即中國能不能做CPU,答案是能。接下來的5年,龍芯要解決另一個問題——國產CPU能不能用?“十一五”期間,兩條線交織展開。一條線是龍芯CPU產業化,一條線是研發的繼續深入。
最初走向市場,龍芯曾屢屢碰壁。但由于自主研發的CPU事關國家戰略安全,不久后,涉及安全的特定領域開始“點名”要在項目中應用龍芯CPU,雖然沒有大規模鋪開,但龍芯得以在特定場景應用起來。在研發上,龍芯從單核變成了四核,性能有所提高。
胡偉武也意識到,龍芯不能在科學院的體制內做下去了?!翱萍紕撔乱獮榻洕鐣l展服務,我們要到市場中去,服務客戶,否則寫再多的論文,拿再多的獎評也沒用”。2010年,龍芯課題組絕大多數技術骨干告別計算所,轉型開始市場化運作。“當時多數龍芯骨干都從科學院計算所辭職,一些在讀博士退學,大家下了很大決心。”時任中科院院長的路甬祥院長專門批示,要求科學院有關部門落實龍芯團隊的股權激勵。
2001年到2010年,龍芯前10年的研發,靠的是中央政府投入的多個項目總共4億元的課題經費,可以算是“天使投資”。2010年起,資本接力棒傳到地方政府。當時有人對胡偉武說,辦CPU企業是沒人理你的,他覺得自己被當做堂吉訶德,“長矛就是龍芯,風車是兩個主流CPU,一個是Intel,一個ARM。我想做第三個,但沒人敢投資。”胡偉武曾想把企業設在天津,為了讓龍芯留在北京、留在中關村,北京市政府牽頭投資1億元,帶動民營企業跟投1億,為此,中關村管委會開了26次協調會。
走出“至暗時刻”
胡偉武坦言,2010年,龍芯完成了組織上的轉型,但思想上尚未轉型,團隊覺得國家項目指南就是做CPU的出發點,結果走了很多彎路。最大的彎路,就是對性能理解的偏差。龍芯做的是專用的高性能。
“打個比方來說,Intel在繁華的商業中心蓋了100層的大樓,里邊有餐飲、辦公、酒店和娛樂配套設施。我也蓋了一座100層的大樓,蓋完后發現這座樓沒有停車場,周邊是土路,也沒有任何配套。樓本身是高的,但是不好用。這就是市場跟技術的區別。”
彼時,龍芯陷入困境,盡管CPU已經開在特定領域應用,但效果并不理想,CPU性能出現了十幾倍的差距。“2012年,龍芯開始面臨危機,國家重大專項資助的重心不再支持自主通用CPU。當時外出開會,很多專家領導都會同情和安慰我。”同時,也有外國大企業找來,要合作辦企業,給龍芯技術授權。胡偉武看得清楚,誘惑背后的潛臺詞是繳槍不殺?!澳阌昧藢Ψ降臇|西,自己的技術能力就會受到損傷,但對方永遠不會把最好的給你。”
此時,胡偉武的凝聚力和龍芯團隊的“信仰”讓大家選擇了堅守,團隊核心骨干中沒有一個人被互聯網企業挖走,去拿一兩百萬的年薪,而是留在龍芯拿一萬的月薪。團隊保持低成本運營,通過艱苦轉型走出低谷。
“現在回想起來,國家項目的‘斷糧’對我們是有幫助作用的。這倒逼我們放下身段,俯下身子去真正了解客戶需求。”胡偉武說,龍芯開始開拓小而散的工控市場,使用于特定設備中的芯片批量不大,一年可能也就幾千片,這些小系統服務起來很辛苦,就像在鹽堿地上耕種一樣,但認真耕種至少可以解決溫飽問題。
2015年,龍芯收入上億,實現盈虧平衡。至今,龍芯系列產品已廣泛應用在黨政、能源、電力、石油、交通等行業。
打造第三套生態體系
全球的信息產業有兩個體系支撐,一個是Wintel(微軟-英特爾),一個是AA(安卓-ARM)體系。2008年,龍芯提出打造第三套生態體系。“龍芯的目標不是光賣芯片,我們要打造新的體系?!?/p>
胡偉武說,當前如果Intel推出新CPU,微軟推出新操作系統,全中國的電腦都得升級;如果ARM推出新CPU、安卓推出新版本,中國的手機也得升級?!耙鉀Q軟件的問題,需要融入已有的體系。但主導權在人家手里,產業是沒利潤的?!?/p>
從中關村50平米的實驗室中起步,龍芯已經走過二十年的旅程?!敖涍^20年的努力,我們已經完成了技術補課?!彼f,目前龍芯CPU的性能已經逼近市場主流產品水平,“用龍芯電腦打開文件,會覺得比Intel x86電腦還快?!蓖瑫r,龍芯推出了自己的指令系統,以支撐生態。他說,龍芯下一步發展的重點是生態建設,未來十年將完成從技術補課向生態建設的轉變,從政策性市場向開放市場的轉變。
說起龍芯自主指令系統,胡偉武說,指令系統就是計算機硬件的“語言”。就像中國人可以用英文寫文章賺錢,但不可能基于英文構建中國的民族文化。通過合資或者授權可以用國外指令系統做產品,但是不可能構建自主的信息技術體系和產業生態。
今年7月,龍芯3A5000處理器發布,這是首款采用自主指令系統LoongArch的處理器芯片,性能逼近國際主流水平?!按钶d龍芯3A5000處理器的電腦已經在電子政務、金融、能源、交通等領域試用。用戶反饋說體驗到它的性能,這是量變到質變的過程。自主指令系統不再依賴任何國外的技術授權,很多合作伙伴認為這具有里程碑式的意義?!?/p>
大眾何時能用上龍芯電腦?胡偉武稱,爭取在“十四五”期間完成從政策性市場向開放市場轉變?!澳壳褒埿綜PU的性能沒有問題,但在軟件生態方面還需要彌補,目前龍芯電腦可以上瀏覽器、跑國產的軟件,但跑不了photoshop等部分軟件,現在還在試錯迭代的階段?!彼f,未來龍芯將嘗試在電商銷售幾千塊錢的筆記本,讓公眾夠得著、試試看。在兩、三年內,龍芯將在生態配套方面完成新一輪的迭代,屆時性價比會更好。
匠人心聲
新京報:你覺得在完成自己的成就中,如何呈現匠心精神?
胡偉武:用養孩子的耐心來做產品。有些產品像養豬,養一年就出欄了;有些產品像養牛,養三年可以干活了;有些產品像養孩子,得養二、三十年才有出息。做CPU就是養孩子。同樣是1000個人年,1000人干一年和100人干十年的效果是完全不一樣的。匠心就是有耐心,不急于求成。
新京報:在你的生活和工作中,哪些東西是你一直堅守的?
胡偉武:三個堅持。堅持為人民做龍芯的根本宗旨,堅持自力更生艱苦奮斗的工作作風,堅持實事求是的思想方法。在每次做重要的人生選擇時,少考慮對自己有多大好處,多考慮對國家人民有多大好處。比如同樣是做CPU,通過自主研發構建自主信息技術體系,而不是通過引進技術做產品融入國外體系,這是一條很難走的路,但走通后對國家人民的好處最大。我發現,每次人生選擇時主要考慮對人民有沒有好處,幾十年下來對自己好處也是最大的。
新京報:你感覺你獲得的最大的快樂是什么?
胡偉武:就是《論語》中說的“學而時習之,不亦悅乎”。結合應用中發現的問題不斷進行研發迭代,產品性能不斷提高,從而滿足更多應用,在更多的應用中又發現新問題,如此往復。具體地說,研制出一款新產品性能得到大幅度提高,龍芯的產品在各個領域得到應用,又紅又專的龍芯團隊后浪推前浪快速成長,這三種情況真是令人產生難以言表的內心快樂。
新京報:什么時候是你認為最艱難的時候?能夠堅持下去的原因是什么?
胡偉武:研發龍芯雖然很辛苦,但不用特別焦慮,是單維度的困難。但2012年-2013年,我們面對的是市場、技術、管理等多維度的問題,當時有一段時間幾乎發不出來工資。最終堅持下來是源于內心的信念感。夏老師臨終前在病床上跟我說,她這輩子最大的心愿就是做好中國的計算機事業,我們這代人沒搞好,你要搞得比我好。所以我覺得這個事情不完成是不行的。我一直以來接受的教育也是科研要解決國家的問題,所以我從來沒有想過退縮。
新京報:你希望未來還取得怎樣的成就,對于未來有怎樣的期待?
胡偉武:龍芯為國家安全做了貢獻,這個目標已經基本做到了。當然這還不夠,我們希望為整個產業發展做貢獻,能支撐產業發展形成生態,是我的目標。
新京報:你還從事教學工作嗎?
胡偉武:我從事教學,我在中國科學院大學教學生。我不覺得這是負擔,而是我工作的一部分。我們要打造第三套信息技術體系,在教育方面有兩個痛點。一是我們有2000多個有計算機專業的高校,都在教學生怎么用計算機,而不是教學生怎么造計算機。主要的原因是老師自己沒造過,而我是造過的,所以我們把本科生和研究生的課程重新編寫,把我們造計算機的過程呈體系性地表現出來,CPU的源代碼對高校開放。
胡偉武在指導研究生。受訪者供圖
第二個痛點是我國中小學的信息化課程成為微軟培訓班。我們要努力改變,讓學校教授自主平臺。要建第三套生態體系,人才體系是其中一部分。現在人才主要都在X86和ARM體系上學出來的,我們要讓他們在龍芯體系上學習計算機。
讓我很感動的是中小學老師的一呼百應,他們很有情懷,非常支持自主安全的龍芯體系。今年,有兩、三萬臺龍芯電腦將走進全國的中小學校,教育系統的總含量應該達到兩、三千萬臺。
新京報:2020年,你榮獲北京市突出貢獻中關村獎,這也是北京市科學技術獎勵大會首次頒發“人物獎”。你覺得這個獎項授予你的意義在于什么?
胡偉武:我覺得北京市在釋放一個非常重要的信號,鼓勵大家像我們一樣從科研院所走出來,為經濟社會發展服務,這是會受到尊重和認可的。我們已經把論文寫在市場這個大地上了,不是寫在紙上了。
每一代科研人員有自己的使命,我們這代計算機人為國家經濟社會發展服務,解決制約國家經濟社會發展的一些關鍵性問題,這也是非常重要的。
當然,我也從來沒見過這么多獎金,我的工資不高,300萬獎金相當于我十年的工資。
新京報記者 張璐
編輯 陳東 張磊 校對 柳寶慶 賈寧