集成顯卡前塵往事 hd4000相當于什么顯卡

PC/服務器領域過去的“集成顯卡”,現在的“核心顯卡”,一度被戲稱為“亮機卡”——因為相比于“獨立顯卡”,其圖形計算性能不值一提,能滿足操作系統圖形界面的最基礎性能要求就不錯的,不要說用來玩游戲、做設計 。
不過這兩年,處理器廠商的核顯競爭似乎內卷了起來 。Intel的11代酷睿處理器96EU規模的Xe核顯,在圖形計算跑分上已經趕超筆記本上的入門級GPU(英偉達GeForce MX350);今年AMD這邊的Ryzen 6000系列處理器RDNA 2核顯(Radeon 680M)性能都超越10年前的GPU卡皇(Radeon HD 7970)了...實在是不得不讓人驚嘆時代發展之迅猛 。

集成顯卡前塵往事 hd4000相當于什么顯卡

文章插圖
來源:極客灣
現在的AMD Ryzen 6000系列移動處理器 , 靠核顯跑1080p高畫質的《艾爾登法環》,游戲幀率就能上40fps;更不用說應付常規的網游和競技類游戲 。Intel很快要發布的13、14代酷睿預計還會在核顯規格上持續內卷,讓核顯性能再上臺階 。
拋開蘋果M1 Max/Ultra這種芯片不談,雖說集顯和真正的高性能獨顯比起來,性能仍然是不值一提的;但以前的“亮機卡”現在都能玩3A游戲了 。這核顯的發展究竟經歷了怎樣的過程?作為EE歷史課系列,本文嘗試回顧過去這幾十年 , “集成顯卡”的發展史 。
“集成顯卡”的定義問題按照我們分析歷史事物的常規,首先還是要來定義一下究竟什么是“集顯” 。中文稱其為“集成顯卡”,實際英文是Integrated Graphics Processor(或iGPU) 。在中文語境里 , “顯卡”一詞似乎已經轉義為指代GPU , 而不再特指板卡形態的硬件 。“集成顯卡”原本就不是板卡,而是一顆芯片、一片die或者die上的一部分 。本文也沿用這種約定俗成的說法 。
而“核顯”(核心顯卡)可以認為是集顯的某種進化形態 。更早以前的集顯雖然說是“集成”的,但它主要是和北橋芯片集成在一起,和CPU離得還是比較遠的;而從2010年開始,Intel將GPU和CPU放到了同一顆芯片上,“核顯”這個說法就出現了——也就進化成了真正的“集顯” 。
這是我們探討集顯進化史的基礎 。實際上 , 和CPU放在一起的GPU,無論如何都沒有了板卡形態,但中文仍然親切地稱呼它為“核心顯卡” 。Intel官方也沿用了“集成顯卡”“核心顯卡”這樣的說法,我們也就不再做嚴格區分了 。
前“集顯”時代早在1995年(或之前)就已經有集成的圖形控制器問世了 。Weitek、矽統(SiS)都有這樣的芯片產品 。比如說矽統的SiS6204 , 應當就是第一顆針對Intel處理器、應用于PC的集成圖形控制器,與北橋芯片是集成到了一起的;而再略早一點的Weitek則面向SPARC平臺推出過對應的產品 。
可見自古以來,“集顯”最早就在于表達,從事圖形計算工作的處理單元與其他處理器放在一起;雖然這里的“顯”究竟是graphcis controller還是graphics processor還是可以做區分的 。當時GPU這個詞都還沒有出現,且圖形單元的構成也還遠不像現在這么復雜 。
矽統當年發布的集顯包含最高分辨率支持到1280x1024 1680萬色的集成VGA,以及帶視頻解碼器接口(Philips SAA 7110)的64位BitBLT引擎,支持色彩空間轉換、視頻縮放、色鍵視頻覆蓋等 。最初似乎只有矽統、ALi(揚智科技)兩家公司獲得了面向Intel奔騰處理器生產芯片組的第三方授權 。
1999年SGI(硅圖,Silicon Graphics Inc)發布兩款工作站產品,采用Intel奔騰處理器,以及自己設計的Cobalt集顯——據說這顆芯片的成本比一般的CPU還好高 。SGI首款集顯的價值在于采用UMA統一內存架構 , 即圖形處理器和CPU共享系統內存 , 雖然當時的UMA和現在我們常說的UMA(如蘋果M1芯片的UMA)差異還是比較大的 。
同年,Intel自己發布了代號為Whitney的i810芯片組——其中就包含Intel自己發布的首顆集顯——位于北橋芯片內部(代號為i752),集顯時代大概應該是從這個時候正式拉開序幕的 。
Intel在獨顯市場的失利從PC GPU的市場份額來看,現在市占率最高的并不是英偉達,而是Intel——從Jon Peddie Research今年一季度的數據來看 , Intel在PC GPU市場的份額達到了60%,相對的英偉達是21% , AMD為19%(這份數據也需要考慮到AMD的集顯) 。這當然主要歸功于Intel這么多年都在推自家的集顯或核顯產品 。畢竟大部分PC用戶并不需要高算力的獨立GPU 。
集成顯卡前塵往事 hd4000相當于什么顯卡

文章插圖
來源:Jon Peddie Research
現在我們知道,Intel前不久發布了自家的獨立顯卡產品,打算和英偉達、AMD一較高下 。不過這可不是Intel進駐GPU或獨立顯卡的開端 。這家公司在其發展歷程中,始終與圖形計算處理器、加速卡有著千絲萬縷的聯系 。
早在上世紀80年代,Intel看到NEC、日立等公司的獨立圖形控制器產品生意挺紅火,也打算進駐這一市場 。1986年Intel發布82786圖形協處理器(并且在此之前就和NEC有過圖形技術授權合作) 。后來持續有多家公司(AIB顯卡廠商)基于這顆芯片推出了板卡產品 。不過其實Intel和同期的競爭對手比起來是沒有技術優勢的 。
1998年 , 相對更知名的i740獨顯問世——這是一顆主頻220MHz、2-8MB VRAM顯存的獨立顯卡,支持DirectX 5.0和OpenGL 1.1 。Intel其實很清楚其顯存容量相比同期競爭對手過小的問題 。Intel的想法是充分利用彼時AGP接口的一大特性:板卡可以去用主內存 。i740上的小顯存只用作frame buffer幀緩沖,而所有的圖形紋理都放在系統主內存里 。這樣一來i740的成本也就比較低了 。
不過這么做的弊端也很明顯:內存讀取速度緩慢 , 成為性能的巨大瓶頸;而且還和CPU爭搶帶寬資源 。加上Intel糟糕的驅動 , i740算是相當失敗的產品 。即便Intel后續要求主板廠商捆綁銷售 , 也未能挽回其頹勢 。
i740產品開發同期,還是有些行業八卦可以聊的 。1995年,大名鼎鼎的洛克希德馬?。↙ockheed Martin)開設了一個新的部門叫Real3D(據說是因為模擬器圖形技術比較花錢,洛克希德馬丁決定回點血) 。Real3D的首個客戶就是世嘉 。憑借世嘉在街機市場的巨大成功,Real3D的圖形加速器產品出貨量相當之大 。
集成顯卡前塵往事 hd4000相當于什么顯卡

文章插圖
同期Intel正準備在這一領域一展拳腳 。所以協同當時的另一家公司(Chips and Technologies),一起和Real3D展開合作 。這就是后來i740誕生的背景 。與此同時Intel也購入了Real3D的部分股權 。
如前所述 , i740失敗了 。Intel就把Real3D從洛克希德馬丁那里買了下來 。之后有一段Real3D遺產的八卦故事 , 包括ATI搶了一部分人、3dfx和Real3D打專利官司、Intel把Real3D的全部IP都賣給了3dfx(后來自然成為了英偉達的一部分),后續又有ATI參與的專利官司等...
然后Intel就退出了獨立顯卡市場,畢竟i740銷量不怎么樣,還鬧出一大堆的破事 。在此之后 , Intel主攻方向就變成了集顯...若說Intel在獨顯市場的嘗試 , 后續還有個Larrabee項目——但產品以胎死腹中告終 , 這些將來我們可以在單獨探討Intel的GPU歷史話題中再做分享 。
據說i740的失敗,以及Real3D的一系列變故,給Intel造成了不小的打擊 。當時Intel內部甚至傳出不會再涉足獨顯的傳言 。不過2007年Larrabee項目、2012年的Xeon Phi,以及現如今的Arc獨顯,都說明Intel和GPU藕斷絲連的關系始終在持續 。跑題了,我們繼續回到集顯這個話題;起碼在i740以后,Intel的圖形計算主戰場都轉向了集顯與核顯 。只不過這些應該也是集顯得以發展的必要條件 。
Intel集顯上半場發展簡史1999年的i810芯片組,及其中的i752集顯 , 可以說是i740的迭代——可見技術仍然是有延續性的 。受限于篇幅 , 我們不打算細致介紹Intel自1999年發布首顆集顯以后都經過了怎樣的迭代路徑 。不過其中仍有一些標志性事件值得單獨拿出來談一談 。
2001年有幾個重要事件 。第一是矽統針對其集顯產品加入了T&L(Transform, Clipping, and Lighting)支持——這是圖形計算領域的一項重要特性 , 包括3D場景的2D化、只保留場景中可見的部分、基于光照信息轉化場景中各個面的色彩信息 。從這個時候開始,“集成顯卡”稱謂才真正變得名正言順;至少它在功能上完整了不少 。
第二件事情是英偉達針對AMD處理器平臺,推出了nForce 220集顯,當然也是集成到主板芯片組里面的 。不久后英偉達就和在技術轉向后的Intel發生矛盾 , 兩家公司打起了曠日持久的官司 。英偉達后來于2012年退出了集顯市?。?致彼時該市場只剩下AMD、Intel和威盛 。
第三件事則是2001年,Intel建立Extreme Graphics集顯家族——這個系列的集顯名稱沿用到了2004年 。初代Extreme Graphics集成在i830芯片組內部,配套的處理器是奔騰III-M 。二代Extreme Graphics出現了筆記本平臺版,配套奔騰M處理器 。這時期的集顯基本就是亮機卡 , 頂多可以玩一些老游戲 。其實即便是2004年的GMA 900集顯(i915芯片組),內部都還沒有頂點著色器(vertex shader),需要依靠CPU來做這部分工作;且主內存帶寬低 , 性能自然不需要太多指望 。
從2002年開始,ATI也開始造集顯,初代IGP 320(ATI A3) 。如果以Intel的集顯產品型號為依據,則PC市場的集顯后續經歷了GMA系列(2004年起)、HD Graphics系列(2010年起)、Iris系列(銳炬,2013年起) 。從2010年的HD Graphics開始,集顯開始有了“核顯”基因 。
集成顯卡前塵往事 hd4000相當于什么顯卡

文章插圖
從集顯走向“核顯”早在2006年AMD收購ATI之際,AMD就期望要造所謂“真正的集成GPU”,就是將CPU和GPU放到同一顆芯片,甚至同一片die上(雖然感覺這在移動領域似乎一點也不新鮮) 。但以當時的技術來看 , AMD和ATI不同的fab廠、不同的設計工具,還有企業文化方面的差異,都讓這樣的工作充滿挑戰 。
2010年 , Intel率先把32nm工藝的CPU die,和45nm工藝的GPU die放到了同一個封裝內,CPU和GPU算是正式會師了 , 這對于降低延遲還是有相當價值的 。而且HD Graphics在性能上相比更老的GMA有了不小的提升:23個EU(執行單元),最高900MHz 43.2GFLOPS算力 , 能夠以最高40fps速率解碼H.264 1080p視頻 。
當時Intel已經開始宣稱核顯要面向休閑和主流PC游戲 。似乎對于這顆Westmere架構處理器,很多人才承認它作為iGPU的名副其實;這才算是“integrated”集成 。
2011年,Sandy Bridge架構處理器(2代酷睿)問世,隨之而來的是第二代HD Graphics核顯 。而且這次的核顯更進了一步,GPU和CPU真正放到了同一顆die上 。AMD也是在這一年將APU理念付諸實踐 。從架構來看 , Sandy Bridge處理器上的GPU已經可以和CPU共享L3 cache , 我們在此前的UMA解讀文章里,詳細介紹過這種架構 。
翌年HD Graphics 4000核顯伴隨Ivy Bridge處理器(3代酷睿)出現的時候,有關Intel核顯性能的宣傳就全面開啟了——當時的不少媒體口徑都在說“堪比獨顯”(感覺和現在上演的是同一個劇本) 。不過即便HD 4000性能的確大幅攀升,還能以低畫質暢玩《英雄聯盟》,但也僅限于此了 。即便這在當時也稱得上驚艷了,集顯的風是從這個時候全面吹起來的 。
集成顯卡前塵往事 hd4000相當于什么顯卡

文章插圖
左邊那片小die就是BroadwelleDRAM
在Xe核顯(11代酷睿)之前,近代Intel核顯發展相對激進的應該是Broadwell(5代酷睿,2014年)——這一代的Iris Pro銳炬核顯基于GT3e架構,片上特別配了128MB的集成eDRAM , 核顯規格稱得上豪華 。據說其性能達到了GeForce GT 730的水平——雖然現在聽起來不算什么 。
值得一提的是,除了API方面的支持迭代、架構變化、規模增大,歷代核顯也在多媒體支持上有顯著提升,包括各類格式的編解碼硬件加速——這好像也是當代集顯乃至獨顯內卷的重要組成部分 。誰讓蘋果在這方面那么愛堆料呢 。
集顯發展史上的其他故事Intel集顯發展史上有一款十分有趣的處理器,代號Kaby Lake-G(8代酷睿,2018年) 。這顆芯片的有趣之處在于,同時集成在一個封裝內的核顯,乃是AMD的Radeon RX Vega M 。Intel官方推出了一款搭載AMD核顯的Intel處理器,聽起來有沒有很新奇?
從Kaby Lake-G的外形來看,這代芯片總共有3片die,一片是Intel CPU,一片是AMD GPU,還有一片是4GB HBM2顯存 , 有沒有感覺十分高級?這款處理器同時也是Intel比較早期的2.5D高級封裝(EMIB)試水產品 。從堆料來看,核顯性能應該是同一代酷睿核顯的2.5倍 。
集成顯卡前塵往事 hd4000相當于什么顯卡

文章插圖
采用AMD核顯的Intel處理器Kaby Lake-G
從當年的實測性能來看,Kaby Lake-G圖形算力應該和筆記本GeForce GTX 1050差不多,有些測試還超過了1050——現在的大部分核顯都還做不到這樣的程度,應該算是核顯方面彼時最有誠意之作了吧;只是這樣的合作在歷史上都是不可多得的 。
不過集顯的發展故事也不僅限于PC設備 。隨便舉幾個例子,2004年高通發布MSM6150/6550,其中就有ATI的Imageon“集顯”(也就是后來的Adreno GPU);2005年德州儀器的OMAP2420“集顯”是來自Imagination的PowerVR GPU,應用于諾基亞N95手機;擴展開去,現在的手機AP SoC都應該說是集成了“顯卡”的芯片 。
游戲主機、掌機市場的核顯就更為常見了:比如任天堂的Switch游戲機基于英偉達的Tegra處理器;2013年,PS4和Xbox One X都采用AMD的APU;那么實際在更多市場都有類似的應用,比如奧迪2008年就把英偉達的Tegra芯片加到了汽車的信息娛樂系統中 。
這方面的基因造就了現在蘋果Mac所用的M系列芯片都是“核顯”,且核顯性能按照蘋果的說法是媲美GeForce RTX 3090這種民用市場的獨顯最高配的,當屬“集顯”或“核顯”的究極形態了吧 。不過蘋果封閉生態的特殊性,以及其盈利方式與傳統芯片公司的差異決定了他可以這么做;但其他芯片公司大概率是無法發展這種程度的“核顯”的 。
【集成顯卡前塵往事 hd4000相當于什么顯卡】
AMD的APU理念 , 與蘋果的篇章續寫我們沒有以AMD處理器為線索,來寫這段集顯發展史可能是不對的 。AMD收購ATI以后,就在努力打造APU芯片——也就是將CPU和GPU放到同一顆die上,并構建UMA統一內存架構為基礎的HSA聯盟 。這段歷史我們 , 也挺有意思 。
2011年AMD推出的首款APU代號Llano , 結合了4顆K10 CPU,以及Radeon HD 6000系列GPU,放在同一顆die上 。這顆芯片基于GlobalFoundries的32nm工藝 。
當時AMD的理念是期望GPU日常能夠頻繁參與到通用計算工作中來,隨時把有高度并行需求的密集型數值計算任務交給GPU去做,讓CPU和GPU真正作為同一顆芯片來用 。只不過AMD的號召力不足以支撐起這樣的生態,除了在游戲主機領域得到普及,PC平臺的APU生態是事實上失敗的 。
不過APU客觀上促成了集顯性能的內卷 。所以AMD都是基于強核顯性能這一理念來推APU芯片的,Intel也對應地在每一代做核顯性能加強 。所以我們才能在這兩年看到PC處理器核顯性能的持續飛躍 。
集成顯卡前塵往事 hd4000相當于什么顯卡

文章插圖
今年的RDNA 2核顯勉強都能玩3A游戲了;12CU規格的Radeon 680M,算力單元規模相當于Radeon RX 6400(雖然存儲系統還是差遠了) 。雖說和歷史上出現過的一些核顯怪胎不同,但還是讓英偉達的入門級獨顯首次感到了白色恐怖 。
另外比較有趣的是,AMD雖然未能在APU with HSA的理念上真正有所斬獲,但蘋果續寫了這個故事 。蘋果在M1芯片發布之際就在宣傳UMA統一內存架構——這不是什么新東西;只不過以蘋果的半封閉生態,及蘋果的生態號召力,蘋果GPU參與更多通用計算工作加速顯得更為尋常 。
而且蘋果芯片發家于手機AP SoC,基因里有著天然的“核顯”屬性,GPU就是和CPU放在同一片SoC芯片上的 。這么算來 , M1 Max/Ultra也都屬于“核顯”范疇,以其規模堆砌程度 , 應當還沒有核心芯片可與之在絕對性能上相提并論 。或許蘋果的M1 Ultra正是AMD當年APU理念締造之初的終極目標,包括統一內存架構,以及接近高端獨顯顯存帶寬的內存帶寬(800GB/s)水平 。雖說蘋果的GPU究竟能干嘛,那又是另一個話題了 。
責編:Momoz