集成顯卡前塵往事 hd4000相當于什么顯卡 _生活經驗

PC/服務器領域過去的“集成顯卡”，現在的“核心顯卡”，一度被戲稱為“亮機卡”——因為相比于“獨立顯卡”，其圖形計算性能不值一提，能滿足操作系統圖形界面的最基礎性能要求就不錯的，不要說用來玩游戲、做設計。
不過這兩年，處理器廠商的核顯競爭似乎內卷了起來。Intel的11代酷睿處理器96EU規模的Xe核顯，在圖形計算跑分上已經趕超筆記本上的入門級GPU（英偉達GeForce MX350）；今年AMD這邊的Ryzen 6000系列處理器RDNA 2核顯（Radeon 680M）性能都超越10年前的GPU卡皇（Radeon HD 7970）了...實在是不得不讓人驚嘆時代發展之迅猛。

文章插圖
來源：極客灣
現在的AMD Ryzen 6000系列移動處理器，靠核顯跑1080p高畫質的《艾爾登法環》，游戲幀率就能上40fps；更不用說應付常規的網游和競技類游戲。Intel很快要發布的13、14代酷睿預計還會在核顯規格上持續內卷，讓核顯性能再上臺階。
拋開蘋果M1 Max/Ultra這種芯片不談，雖說集顯和真正的高性能獨顯比起來，性能仍然是不值一提的；但以前的“亮機卡”現在都能玩3A游戲了。這核顯的發展究竟經歷了怎樣的過程？作為EE歷史課系列，本文嘗試回顧過去這幾十年， “集成顯卡”的發展史。
“集成顯卡”的定義問題按照我們分析歷史事物的常規，首先還是要來定義一下究竟什么是“集顯” 。中文稱其為“集成顯卡”，實際英文是Integrated Graphics Processor（或iGPU）。在中文語境里， “顯卡”一詞似乎已經轉義為指代GPU ，而不再特指板卡形態的硬件。“集成顯卡”原本就不是板卡，而是一顆芯片、一片die或者die上的一部分。本文也沿用這種約定俗成的說法。
而“核顯”（核心顯卡）可以認為是集顯的某種進化形態。更早以前的集顯雖然說是“集成”的，但它主要是和北橋芯片集成在一起，和CPU離得還是比較遠的；而從2010年開始，Intel將GPU和CPU放到了同一顆芯片上，“核顯”這個說法就出現了——也就進化成了真正的“集顯” 。
這是我們探討集顯進化史的基礎。實際上，和CPU放在一起的GPU，無論如何都沒有了板卡形態，但中文仍然親切地稱呼它為“核心顯卡” 。Intel官方也沿用了“集成顯卡”“核心顯卡”這樣的說法，我們也就不再做嚴格區分了。
前“集顯”時代早在1995年（或之前）就已經有集成的圖形控制器問世了。Weitek、矽統（SiS）都有這樣的芯片產品。比如說矽統的SiS6204 ，應當就是第一顆針對Intel處理器、應用于PC的集成圖形控制器，與北橋芯片是集成到了一起的；而再略早一點的Weitek則面向SPARC平臺推出過對應的產品。
可見自古以來，“集顯”最早就在于表達，從事圖形計算工作的處理單元與其他處理器放在一起；雖然這里的“顯”究竟是graphcis controller還是graphics processor還是可以做區分的。當時GPU這個詞都還沒有出現，且圖形單元的構成也還遠不像現在這么復雜。
矽統當年發布的集顯包含最高分辨率支持到1280x1024 1680萬色的集成VGA，以及帶視頻解碼器接口（Philips SAA 7110）的64位BitBLT引擎，支持色彩空間轉換、視頻縮放、色鍵視頻覆蓋等。最初似乎只有矽統、ALi（揚智科技）兩家公司獲得了面向Intel奔騰處理器生產芯片組的第三方授權。
1999年SGI（硅圖，Silicon Graphics Inc）發布兩款工作站產品，采用Intel奔騰處理器，以及自己設計的Cobalt集顯——據說這顆芯片的成本比一般的CPU還好高。SGI首款集顯的價值在于采用UMA統一內存架構，即圖形處理器和CPU共享系統內存，雖然當時的UMA和現在我們常說的UMA（如蘋果M1芯片的UMA）差異還是比較大的。
同年，Intel自己發布了代號為Whitney的i810芯片組——其中就包含Intel自己發布的首顆集顯——位于北橋芯片內部（代號為i752），集顯時代大概應該是從這個時候正式拉開序幕的。
Intel在獨顯市場的失利從PC GPU的市場份額來看，現在市占率最高的并不是英偉達，而是Intel——從Jon Peddie Research今年一季度的數據來看， Intel在PC GPU市場的份額達到了60%，相對的英偉達是21% ， AMD為19%（這份數據也需要考慮到AMD的集顯）。這當然主要歸功于Intel這么多年都在推自家的集顯或核顯產品。畢竟大部分PC用戶并不需要高算力的獨立GPU 。

文章插圖
來源：Jon Peddie Research
現在我們知道，Intel前不久發布了自家的獨立顯卡產品，打算和英偉達、AMD一較高下。不過這可不是Intel進駐GPU或獨立顯卡的開端。這家公司在其發展歷程中，始終與圖形計算處理器、加速卡有著千絲萬縷的聯系。
早在上世紀80年代，Intel看到NEC、日立等公司的獨立圖形控制器產品生意挺紅火，也打算進駐這一市場。1986年Intel發布82786圖形協處理器（并且在此之前就和NEC有過圖形技術授權合作）。后來持續有多家公司（AIB顯卡廠商）基于這顆芯片推出了板卡產品。不過其實Intel和同期的競爭對手比起來是沒有技術優勢的。
1998年，相對更知名的i740獨顯問世——這是一顆主頻220MHz、2-8MB VRAM顯存的獨立顯卡，支持DirectX 5.0和OpenGL 1.1 。Intel其實很清楚其顯存容量相比同期競爭對手過小的問題。Intel的想法是充分利用彼時AGP接口的一大特性：板卡可以去用主內存。i740上的小顯存只用作frame buffer幀緩沖，而所有的圖形紋理都放在系統主內存里。這樣一來i740的成本也就比較低了。
不過這么做的弊端也很明顯：內存讀取速度緩慢，成為性能的巨大瓶頸；而且還和CPU爭搶帶寬資源。加上Intel糟糕的驅動， i740算是相當失敗的產品。即便Intel后續要求主板廠商捆綁銷售，也未能挽回其頹勢。
i740產品開發同期，還是有些行業八卦可以聊的。1995年，大名鼎鼎的洛克希德馬?。↙ockheed Martin）開設了一個新的部門叫Real3D（據說是因為模擬器圖形技術比較花錢，洛克希德馬丁決定回點血）。Real3D的首個客戶就是世嘉。憑借世嘉在街機市場的巨大成功，Real3D的圖形加速器產品出貨量相當之大。

文章插圖
同期Intel正準備在這一領域一展拳腳。所以協同當時的另一家公司（Chips and Technologies），一起和Real3D展開合作。這就是后來i740誕生的背景。與此同時Intel也購入了Real3D的部分股權。
如前所述， i740失敗了。Intel就把Real3D從洛克希德馬丁那里買了下來。之后有一段Real3D遺產的八卦故事，包括ATI搶了一部分人、3dfx和Real3D打專利官司、Intel把Real3D的全部IP都賣給了3dfx（后來自然成為了英偉達的一部分），后續又有ATI參與的專利官司等...
然后Intel就退出了獨立顯卡市場，畢竟i740銷量不怎么樣，還鬧出一大堆的破事。在此之后， Intel主攻方向就變成了集顯...若說Intel在獨顯市場的嘗試，后續還有個Larrabee項目——但產品以胎死腹中告終，這些將來我們可以在單獨探討Intel的GPU歷史話題中再做分享。
據說i740的失敗，以及Real3D的一系列變故，給Intel造成了不小的打擊。當時Intel內部甚至傳出不會再涉足獨顯的傳言。不過2007年Larrabee項目、2012年的Xeon Phi，以及現如今的Arc獨顯，都說明Intel和GPU藕斷絲連的關系始終在持續。跑題了，我們繼續回到集顯這個話題；起碼在i740以后，Intel的圖形計算主戰場都轉向了集顯與核顯。只不過這些應該也是集顯得以發展的必要條件。
Intel集顯上半場發展簡史1999年的i810芯片組，及其中的i752集顯，可以說是i740的迭代——可見技術仍然是有延續性的。受限于篇幅，我們不打算細致介紹Intel自1999年發布首顆集顯以后都經過了怎樣的迭代路徑。不過其中仍有一些標志性事件值得單獨拿出來談一談。
2001年有幾個重要事件。第一是矽統針對其集顯產品加入了T&L（Transform, Clipping, and Lighting）支持——這是圖形計算領域的一項重要特性，包括3D場景的2D化、只保留場景中可見的部分、基于光照信息轉化場景中各個面的色彩信息。從這個時候開始，“集成顯卡”稱謂才真正變得名正言順；至少它在功能上完整了不少。
第二件事情是英偉達針對AMD處理器平臺，推出了nForce 220集顯，當然也是集成到主板芯片組里面的。不久后英偉達就和在技術轉向后的Intel發生矛盾，兩家公司打起了曠日持久的官司。英偉達后來于2012年退出了集顯市?。?致彼時該市場只剩下AMD、Intel和威盛。
第三件事則是2001年，Intel建立Extreme Graphics集顯家族——這個系列的集顯名稱沿用到了2004年。初代Extreme Graphics集成在i830芯片組內部，配套的處理器是奔騰III-M 。二代Extreme Graphics出現了筆記本平臺版，配套奔騰M處理器。這時期的集顯基本就是亮機卡，頂多可以玩一些老游戲。其實即便是2004年的GMA 900集顯（i915芯片組），內部都還沒有頂點著色器（vertex shader），需要依靠CPU來做這部分工作；且主內存帶寬低，性能自然不需要太多指望。
從2002年開始，ATI也開始造集顯，初代IGP 320（ATI A3）。如果以Intel的集顯產品型號為依據，則PC市場的集顯后續經歷了GMA系列（2004年起)、HD Graphics系列（2010年起）、Iris系列（銳炬，2013年起）。從2010年的HD Graphics開始，集顯開始有了“核顯”基因。

文章插圖
從集顯走向“核顯”早在2006年AMD收購ATI之際，AMD就期望要造所謂“真正的集成GPU”，就是將CPU和GPU放到同一顆芯片，甚至同一片die上（雖然感覺這在移動領域似乎一點也不新鮮）。但以當時的技術來看， AMD和ATI不同的fab廠、不同的設計工具，還有企業文化方面的差異，都讓這樣的工作充滿挑戰。
2010年， Intel率先把32nm工藝的CPU die，和45nm工藝的GPU die放到了同一個封裝內，CPU和GPU算是正式會師了，這對于降低延遲還是有相當價值的。而且HD Graphics在性能上相比更老的GMA有了不小的提升：23個EU（執行單元），最高900MHz 43.2GFLOPS算力，能夠以最高40fps速率解碼H.264 1080p視頻。
當時Intel已經開始宣稱核顯要面向休閑和主流PC游戲。似乎對于這顆Westmere架構處理器，很多人才承認它作為iGPU的名副其實；這才算是“integrated”集成。
2011年，Sandy Bridge架構處理器（2代酷睿）問世，隨之而來的是第二代HD Graphics核顯。而且這次的核顯更進了一步，GPU和CPU真正放到了同一顆die上。AMD也是在這一年將APU理念付諸實踐。從架構來看， Sandy Bridge處理器上的GPU已經可以和CPU共享L3 cache ，我們在此前的UMA解讀文章里，詳細介紹過這種架構。
翌年HD Graphics 4000核顯伴隨Ivy Bridge處理器（3代酷睿）出現的時候，有關Intel核顯性能的宣傳就全面開啟了——當時的不少媒體口徑都在說“堪比獨顯”（感覺和現在上演的是同一個劇本）。不過即便HD 4000性能的確大幅攀升，還能以低畫質暢玩《英雄聯盟》，但也僅限于此了。即便這在當時也稱得上驚艷了，集顯的風是從這個時候全面吹起來的。

文章插圖
左邊那片小die就是Broadwell的eDRAM
在Xe核顯（11代酷睿）之前，近代Intel核顯發展相對激進的應該是Broadwell（5代酷睿，2014年）——這一代的Iris Pro銳炬核顯基于GT3e架構，片上特別配了128MB的集成eDRAM ，核顯規格稱得上豪華。據說其性能達到了GeForce GT 730的水平——雖然現在聽起來不算什么。
值得一提的是，除了API方面的支持迭代、架構變化、規模增大，歷代核顯也在多媒體支持上有顯著提升，包括各類格式的編解碼硬件加速——這好像也是當代集顯乃至獨顯內卷的重要組成部分。誰讓蘋果在這方面那么愛堆料呢。
集顯發展史上的其他故事Intel集顯發展史上有一款十分有趣的處理器，代號Kaby Lake-G（8代酷睿，2018年）。這顆芯片的有趣之處在于，同時集成在一個封裝內的核顯，乃是AMD的Radeon RX Vega M 。Intel官方推出了一款搭載AMD核顯的Intel處理器，聽起來有沒有很新奇？
從Kaby Lake-G的外形來看，這代芯片總共有3片die，一片是Intel CPU，一片是AMD GPU，還有一片是4GB HBM2顯存，有沒有感覺十分高級？這款處理器同時也是Intel比較早期的2.5D高級封裝（EMIB）試水產品。從堆料來看，核顯性能應該是同一代酷睿核顯的2.5倍。

文章插圖
采用AMD核顯的Intel處理器Kaby Lake-G
從當年的實測性能來看，Kaby Lake-G圖形算力應該和筆記本GeForce GTX 1050差不多，有些測試還超過了1050——現在的大部分核顯都還做不到這樣的程度，應該算是核顯方面彼時最有誠意之作了吧；只是這樣的合作在歷史上都是不可多得的。
不過集顯的發展故事也不僅限于PC設備。隨便舉幾個例子，2004年高通發布MSM6150/6550，其中就有ATI的Imageon“集顯”（也就是后來的Adreno GPU）；2005年德州儀器的OMAP2420“集顯”是來自Imagination的PowerVR GPU，應用于諾基亞N95手機；擴展開去，現在的手機AP SoC都應該說是集成了“顯卡”的芯片。
游戲主機、掌機市場的核顯就更為常見了：比如任天堂的Switch游戲機基于英偉達的Tegra處理器；2013年，PS4和Xbox One X都采用AMD的APU；那么實際在更多市場都有類似的應用，比如奧迪2008年就把英偉達的Tegra芯片加到了汽車的信息娛樂系統中。
這方面的基因造就了現在蘋果Mac所用的M系列芯片都是“核顯”，且核顯性能按照蘋果的說法是媲美GeForce RTX 3090這種民用市場的獨顯最高配的，當屬“集顯”或“核顯”的究極形態了吧。不過蘋果封閉生態的特殊性，以及其盈利方式與傳統芯片公司的差異決定了他可以這么做；但其他芯片公司大概率是無法發展這種程度的“核顯”的。
【集成顯卡前塵往事 hd4000相當于什么顯卡】
AMD的APU理念，與蘋果的篇章續寫我們沒有以AMD處理器為線索，來寫這段集顯發展史可能是不對的。AMD收購ATI以后，就在努力打造APU芯片——也就是將CPU和GPU放到同一顆die上，并構建UMA統一內存架構為基礎的HSA聯盟。這段歷史我們，也挺有意思。
2011年AMD推出的首款APU代號Llano ，結合了4顆K10 CPU，以及Radeon HD 6000系列GPU，放在同一顆die上。這顆芯片基于GlobalFoundries的32nm工藝。
當時AMD的理念是期望GPU日常能夠頻繁參與到通用計算工作中來，隨時把有高度并行需求的密集型數值計算任務交給GPU去做，讓CPU和GPU真正作為同一顆芯片來用。只不過AMD的號召力不足以支撐起這樣的生態，除了在游戲主機領域得到普及，PC平臺的APU生態是事實上失敗的。
不過APU客觀上促成了集顯性能的內卷。所以AMD都是基于強核顯性能這一理念來推APU芯片的，Intel也對應地在每一代做核顯性能加強。所以我們才能在這兩年看到PC處理器核顯性能的持續飛躍。

文章插圖
今年的RDNA 2核顯勉強都能玩3A游戲了；12CU規格的Radeon 680M，算力單元規模相當于Radeon RX 6400（雖然存儲系統還是差遠了）。雖說和歷史上出現過的一些核顯怪胎不同，但還是讓英偉達的入門級獨顯首次感到了白色恐怖。
另外比較有趣的是，AMD雖然未能在APU with HSA的理念上真正有所斬獲，但蘋果續寫了這個故事。蘋果在M1芯片發布之際就在宣傳UMA統一內存架構——這不是什么新東西；只不過以蘋果的半封閉生態，及蘋果的生態號召力，蘋果GPU參與更多通用計算工作加速顯得更為尋常。
而且蘋果芯片發家于手機AP SoC，基因里有著天然的“核顯”屬性，GPU就是和CPU放在同一片SoC芯片上的。這么算來， M1 Max/Ultra也都屬于“核顯”范疇，以其規模堆砌程度，應當還沒有核心芯片可與之在絕對性能上相提并論。或許蘋果的M1 Ultra正是AMD當年APU理念締造之初的終極目標，包括統一內存架構，以及接近高端獨顯顯存帶寬的內存帶寬（800GB/s）水平。雖說蘋果的GPU究竟能干嘛，那又是另一個話題了。
責編：Momoz