數(shù)字金融
網(wǎng)絡(luò)營銷推廣
電商服務(wù)
AI(人工智能)芯片龍頭英偉達(dá)CEO黃仁勛在英偉達(dá)GPU技術(shù)大會(huì)(GTC)上打開了話匣子。
當(dāng)?shù)貢r(shí)間3月19日,在座無虛席的英偉達(dá)GTC大會(huì)主題演講結(jié)束后的第二天,黃仁勛參加全球媒體采訪,回答了來自二十幾家媒體的采訪問題。
這些問題豐富多樣,從英偉達(dá)的公司發(fā)展前景,到AI、云計(jì)算、機(jī)器人乃至量子計(jì)算機(jī)的未來,再到國際形勢和全球供應(yīng)鏈情況,各種問題都被投向了最近因其名聲與熱度而獲得“科技界泰勒·斯威夫特”稱號(hào)的黃仁勛。
在采訪中,黃仁勛深入淺出地介紹了公司旗下幾項(xiàng)核心技術(shù)的原理,并再三強(qiáng)調(diào),英偉達(dá)并不只賣芯片,而是瞄準(zhǔn)了潛力巨大的數(shù)據(jù)中心市場,希望能做到“無處不在”;由于供應(yīng)鏈的龐大和產(chǎn)品的復(fù)雜程度,英偉達(dá)的芯片由來自全球各地的零部件組成,也在努力增強(qiáng)供應(yīng)鏈的韌性;另外,AI的重大貢獻(xiàn)之一在于彌合技術(shù)鴻溝,能夠讓任何人都像和人交談一樣指揮軟件。
黃仁勛面對(duì)記者講話和接受媒體采訪的全文如下,由澎湃新聞?dòng)浾叻g和整理:
黃仁勛:歡迎來到GTC。來自世界各地的媒體,很高興見到你們所有人。
我(在開幕演講上)談到了五個(gè)主題。首先,我們的行業(yè)正在同時(shí)經(jīng)歷兩場轉(zhuǎn)型。第一場轉(zhuǎn)型是關(guān)于計(jì)算機(jī)的制造方式,以及計(jì)算機(jī)從通用計(jì)算轉(zhuǎn)向加速計(jì)算的構(gòu)建方式。第二個(gè)轉(zhuǎn)型是它能做什么。也就是說,第一場是加速計(jì)算,第二場是它能做的事情,我們稱之為生成式AI。由于生成式AI,出現(xiàn)了一種新型的工具,這種新工具就是AI生成器。有些人稱之為數(shù)據(jù)中心,但如你所知,數(shù)據(jù)中心被很多人使用。它能夠存儲(chǔ)大量文件,并運(yùn)行許多應(yīng)用程序。你可以用它做很多不同的事情。但在生成式AI的情況下,它只做一件事。
它(生成式AI)為一個(gè)人,或公司,處理一件事,并生產(chǎn)AI,即生產(chǎn)令牌(token)。作為一種革命性的AI,當(dāng)你與ChatGPT互動(dòng)時(shí),它正在生成代幣,生成浮點(diǎn)數(shù)(floating point numbers),而這些浮點(diǎn)數(shù)能變成文字、圖像或聲音。蛋白質(zhì)、化學(xué)物質(zhì)、計(jì)算機(jī)動(dòng)畫和機(jī)器人,它們對(duì)機(jī)器來說與說話沒有區(qū)別。如果計(jì)算機(jī)可以說話,為什么不能使機(jī)器動(dòng)起來呢?因此,這些能力,這些代幣生成器是一個(gè)全新的類別,一個(gè)新的行業(yè)。這就是為什么我們說正在發(fā)生一場工業(yè)革命,因?yàn)樗切碌摹_@個(gè)新行業(yè)創(chuàng)造了這些(服務(wù)器)房間、這些建筑,我稱它們?yōu)锳I工廠,因?yàn)檫@是最合理的。
在上一次工業(yè)革命中,流入工廠的原材料是水。出來的是一種看不見的東西,稱為電。現(xiàn)在,我們有了這種流入工廠的原材料,也就是數(shù)據(jù),而從中產(chǎn)生的是數(shù)據(jù)令牌(data tokens)。這種令牌同樣是看不見的,它可以被分發(fā)到全世界,非常有價(jià)值。在過去,數(shù)據(jù)中心被算入你公司的成本,被視為運(yùn)營費(fèi)用,進(jìn)入資本支出,你認(rèn)為它是一項(xiàng)成本。然而,工廠是能夠賺錢的。因此,這個(gè)新世界擁有新的生成式AI、新的工廠,也就是AI工廠,是一個(gè)新的工業(yè)革命。大家能理解嗎?好的,這就是正在發(fā)生的第一件事。
這場轉(zhuǎn)型是英偉達(dá)引領(lǐng)的加速計(jì)算,然后是第二個(gè),生成式AI。在這個(gè)新世界里,軟件極其復(fù)雜。ChatGTP的實(shí)現(xiàn)絕非易事,它是有史以來最偉大的科學(xué)突破之一,這款軟件非常龐大,并且還在不斷擴(kuò)大,原因是如今你想讓它學(xué)習(xí)的東西太多了。它從文字和圖片中學(xué)習(xí),它還將從視頻中學(xué)習(xí)。它將學(xué)習(xí)強(qiáng)化學(xué)習(xí),學(xué)習(xí)合成數(shù)據(jù)生成。它將通過相互對(duì)話進(jìn)行強(qiáng)化學(xué)習(xí),就像AlphaGo那樣,通過相互辯論來學(xué)習(xí)。它將以許多不同的方式進(jìn)行學(xué)習(xí)。因此,這些模型將隨著時(shí)間變得越來越復(fù)雜。
我們?yōu)檫@個(gè)未來創(chuàng)造了全新一代的計(jì)算工具,這個(gè)未來模型擁有萬億參數(shù)。我們稱之為Blackwell。Blackwell在幾個(gè)方面是革命性的。首先,它的設(shè)計(jì)非常高效能和節(jié)能。我在演講中展示了一個(gè)例子,訓(xùn)練相同規(guī)格的1.8萬億參數(shù)GPT將在90天內(nèi)完成,不需要15兆瓦,而是僅需4兆瓦——你節(jié)省了11兆瓦。因此,我們極大地降低了工作的能耗。能效是工作量除以輸入,而工作量是對(duì)模型的訓(xùn)練模型。在90天內(nèi),輸入量為4兆瓦,節(jié)省了大量能源,當(dāng)然也節(jié)省了大量金錢。這是第一個(gè)突破。
第二個(gè)突破是在于生成,人們首次開始考慮AI不僅僅用于推理。例如,這是一張貓的圖片,顯示了對(duì)貓的預(yù)測推理。而在推理之外,雖然依然屬于推理范疇,但有一個(gè)深刻的不同,那就是生成的出現(xiàn)。它在推理,但同時(shí)也在生成,不僅是識(shí)別,而是生成,不僅是理解,而且是生成AI。Blackwell被設(shè)計(jì)為一臺(tái)生成型計(jì)算機(jī),這是數(shù)據(jù)中心首次以這種方式理解我們的GPU。
現(xiàn)在,如果你是一個(gè)游戲玩家,你一直認(rèn)為英偉達(dá)的GPU是一種生成型計(jì)算機(jī)。不是嗎?因?yàn)槟憧吹降乃袌D像都是由英偉達(dá)的GPU生成的,但在未來,從圖像、視頻、文本到蛋白質(zhì)、化學(xué)物質(zhì)、運(yùn)動(dòng)控制——它們都將被生成,并且都將由GPU生成。這實(shí)際上挺有趣的,幾乎是《回到未來》。我們的GPU從生成處理器和計(jì)算機(jī)圖形生成,變成了AI學(xué)習(xí)處理器、AI推理處理器,現(xiàn)在又回到了開始的AI生成處理器。在未來,我們幾乎所有的計(jì)算體驗(yàn)都將主要是生成的。今天不是這樣,這就是為什么這個(gè)機(jī)會(huì)如此巨大的原因。
當(dāng)你在做計(jì)算時(shí)問問自己,當(dāng)你在手機(jī)上操作時(shí),那個(gè)文件,那些信息都是預(yù)先錄制的。有人提前寫下它,有人提前拍下照片,有人提前錄制視頻,一切都是預(yù)先錄制的。在未來,它將由那種預(yù)錄內(nèi)容增強(qiáng),但為你生成獨(dú)特的方式,這就是為什么每個(gè)人的計(jì)算體驗(yàn)都將非常不同的原因。我們不再使用搜索。搜索將通過生成進(jìn)行增強(qiáng)。我們稱之為RAG,即檢索增強(qiáng)生成。因此,在未來,我們幾乎所有的體驗(yàn)都將是生成的,而這種生成引擎需要一種特殊類型的處理器,那就是Blackwell。我們用全新的transformer引擎創(chuàng)造了Blackwell,一個(gè)第二代transformer,以及一個(gè)非常大的NVlink,這樣我們就可以非常快速地生成大量信息,并同時(shí)并行多個(gè)GPU。所以這就是Blackwell。
第三件事是,在這個(gè)新世界中,我們能夠編寫的軟件是不同的,它非常復(fù)雜,但大公司、企業(yè)如何像使用Windows那樣使用這些軟件呢?它以二進(jìn)制形式存在。你下載它,安裝它。在SAP的案例中,你的IT部門為你安裝它。一些應(yīng)用程序在云上,但如果你想創(chuàng)建自己的應(yīng)用程序,而你需要內(nèi)置這種稱為AI的不可思議技術(shù)。你該怎么做呢?因此,必須有人找出一種方法,將這種非常復(fù)雜的軟件與所有的高性能計(jì)算技術(shù)、所有的GPU技術(shù)、所有的Tensor RTLM和分布式計(jì)算一起,打包進(jìn)一個(gè)容器中,使人們易于使用,同時(shí)也易于下載和使用,意味著你可以直接與它交互。
真正酷的是,在未來,軟件就是AI,你與軟件的交互方式就是直接對(duì)話。因此,AI軟件即將到來。它將非常易于使用。API非常易于使用,非常自然,你可以將許多這樣的AI連接在一起。我們稱它們?yōu)镹IMs,我們稱它們?yōu)镹IM微服務(wù),我們將幫助公司將它們連接在一起。你可以直接使用,可以定制它,我們可以教你如何定制它,你可以將它連接起來。我們可以教你如何將它與許多其他應(yīng)用程序連接起來。因此,我們討論了NIM,討論了這項(xiàng)服務(wù)。我們將幫助客戶定制他們自己的NIM的方式,我們稱之為AI工坊(AI foundry)。
我們擁有AI技術(shù),我們擁有執(zhí)行它所需的工具,當(dāng)然還有公司的基礎(chǔ)設(shè)施,這三樣?xùn)|西——技術(shù)、專業(yè)知識(shí)和基礎(chǔ)設(shè)施,基本上就是一個(gè)工坊的特點(diǎn)。因此,我們可以幫助每個(gè)公司構(gòu)建他們的定制AI。現(xiàn)在,誰會(huì)想要定制AI呢?那些擁有平臺(tái)的公司。因此,SAP、ServiceNow、ANSYS、Cadence、和NetApp等都想要定制AI。因此,我們可以與他們合作,幫助他們構(gòu)建他們的定制AI,我們可以像工坊一樣為他們制造這些AI,他們可以自己將其推向市場。這就給出了一個(gè)例子,說明我們將如何利用這項(xiàng)AI技術(shù),并將其帶給世界。
我談到的最后一件事是AI的下一個(gè)浪潮,需要AI理解物理世界。當(dāng)然,你們已經(jīng)看到了包括OpenAI的Sora在內(nèi)的一些具有革命性的AI。當(dāng)Sora在生成視頻時(shí),它實(shí)際上是有意義的。汽車在路上,它會(huì)轉(zhuǎn)彎,人在街上行走有反光。顯然,AI懂得物理學(xué),對(duì)吧?它懂得物理定律。因此,想象一下如果我們將其推向極限,那么AI實(shí)際上可以在物理世界中行動(dòng),這就是機(jī)器人學(xué)。
00:59
Sora生成的樣片(00:59)
因此,下一代技術(shù)需要新的計(jì)算機(jī)來在機(jī)器人中運(yùn)行。我們稱之為Omniverse新工具,讓機(jī)器人可以在數(shù)字孿生中學(xué)習(xí)。當(dāng)然,我們還需要發(fā)明一些新的AI模型,新的基礎(chǔ)模型。因此,整個(gè)堆棧,也就是我們進(jìn)入市場的方式,正如你們所知,我們是一個(gè)技術(shù)平臺(tái),而不是一個(gè)工具公司。我們有開發(fā)者,Omniverse是我們的數(shù)字孿生,通過API或SDK,我們與開發(fā)者相連。
這次我們宣布了很多偉大的開發(fā)者。3D Excite將連接到Omniverse API,增強(qiáng)逼真的渲染和基于物理的渲染。西門子、Cadence、Blackwell、Hexagon等都已連接到Omniverse APIs,他們可以使用這些Omniverse APIs創(chuàng)建數(shù)字孿生,并成為我們的超級(jí)合作伙伴。我對(duì)Omniverse在連接這些工具方面的成功感到非常高興。這些工具本質(zhì)上被Omniverse增強(qiáng),我對(duì)此感到非常高興。
所以這就是我們討論的五件事。Blackwell既是一個(gè)芯片的名稱,也是一個(gè)計(jì)算系統(tǒng)的名稱。這是HGX平臺(tái),從Ampere A100到H100、H200、B100以及B200版本,這個(gè)版本真的很棒,與Hopper完全適配。因此,你可以拿掉一個(gè)Hopper,換上一個(gè)Blackwell。這種生產(chǎn)過渡將讓客戶增長變得更加容易,因?yàn)榛A(chǔ)設(shè)施已經(jīng)存在。我們還有一個(gè)新的架構(gòu),采用液冷技術(shù),允許我們創(chuàng)建非常大的NVLink區(qū)域,在一個(gè)NVLink域中創(chuàng)建8個(gè)GPU。我們希望有更大的GPU。也就是說,一個(gè)GPU, 8個(gè)Hopper裸晶(die)。在Blackwell的情況下,就是16個(gè)裸晶,每個(gè)硅片裸晶帶來顯著突破。所以,無論如何,那就是Blackwell。
但是,如果我們想要?jiǎng)?chuàng)建更大的,我們可以一直實(shí)現(xiàn)下去。我們可以將多個(gè)版本的Blackwell和Grace CPU堆疊在一起,它們通過NVlink開關(guān)連接在一起,NVLink開關(guān)就在這里,這是世界上性能最高的開關(guān),我們堆疊了9個(gè)這樣的開關(guān),能連接36個(gè)芯片,76個(gè)GPU。好的,我可以接受提問了。
記者:想問一下,你們計(jì)劃將多少新的網(wǎng)絡(luò)技術(shù)賣給中國,以及,我們有任何專為中國市場設(shè)計(jì)的SKU(商品庫存)嗎?這些SKU可能集成了一些其他技術(shù),除了計(jì)算裸晶,由于計(jì)算密度你無法將其送去售賣,但你們還在開發(fā)哪些集成了其他先進(jìn)技術(shù)的新SKU,除了我們昨天看到的那些?
黃仁勛:我剛剛才宣布了這個(gè)SKU。不,我們今天所說的就已經(jīng)是全部了。當(dāng)然,我們賣給中國的任何產(chǎn)品都必須遵守出口管制規(guī)定,那是首要任務(wù)。所以我們會(huì)考慮這個(gè),我們正專注于這個(gè)。對(duì)于中國,我們有L20和H20芯片,我們正在盡我們所能地為中國市場優(yōu)化它們,并服務(wù)于那里的客戶。
記者:你在主題演講中提到,英偉達(dá)是一個(gè)與許多企業(yè)合作的AI工坊,我認(rèn)為這非常重要。你能分享更多關(guān)于你們的整體策略和長期目標(biāo)嗎?
黃仁勛:AI工坊的目標(biāo)是構(gòu)建軟件AI,不是將軟件作為一個(gè)工具,但請(qǐng)記住英偉達(dá)始終是一家軟件公司。我們很久以前創(chuàng)建的最重要的軟件之一叫做Optics,后來它變成了RTX。另一個(gè)非常重要的是叫做cuDNN,cuDNN是AI庫。我們有所有這些不同的庫。未來的庫是一個(gè)微服務(wù),因?yàn)槲磥淼膸觳粌H會(huì)用數(shù)學(xué)描述,還會(huì)用AI描述。所以這些庫,我們過去叫它們cuBLAS,還有一大堆“cu”,但在未來,它們都是NIMs。這些NIMs是超級(jí)復(fù)雜的軟件,你所需要做的就是來我們的AI網(wǎng)站,你可以直接在那里使用它,或者下載它到另一個(gè)云平臺(tái),或在自己的計(jì)算機(jī)上運(yùn)行。如果它足夠小,你可以在你的PC上運(yùn)行,運(yùn)行你的工作站,運(yùn)行你的數(shù)據(jù)中心。我們將使這些NIMs的性能非常高效。所以,這是使用英偉達(dá)庫的一種新方式,當(dāng)你作為一個(gè)企業(yè)運(yùn)行這些庫時(shí),我們有一個(gè)你需要許可的操作系統(tǒng),這個(gè)操作系統(tǒng)的費(fèi)用是每GPU每年4500美元。你可以在其上運(yùn)行盡可能多的模型,只要你喜歡。
記者:今天早上你提到一顆Blackwell芯片的價(jià)格在三萬到四萬美元之間,你沒有具體說明是哪一個(gè),所以你能提供具體的定價(jià)嗎?你在演講中提到的2500億美元TAM(潛在市場規(guī)模)的市場具體是什么,英偉達(dá)在其中占多大比例?
黃仁勛:我很感謝你的問題。好的,首先,我試圖給出我們產(chǎn)品定價(jià)的感覺。我并不打算給出一個(gè)具體報(bào)價(jià)。原因是,我們顯然不是單純賣芯片的,并且Blackwell作為一個(gè)或多個(gè)系統(tǒng)的定價(jià)是非常不同的。而且,你不能只使用Blackwell,Blackwell系統(tǒng)包括了NVlink,就在這里。因此,這次的定價(jià)差別是完全不同的,我們將為它們每一個(gè)提供定價(jià)。每個(gè)的定價(jià)將如往常一樣基于TCO(總運(yùn)營成本)而定。
英偉達(dá)不僅僅制造芯片,英偉達(dá)構(gòu)建數(shù)據(jù)中心,你們可以看到我在最后一個(gè)幻燈片中展示的,顯然不只是一個(gè)芯片,我們構(gòu)建了整個(gè)東西和所有軟件,我們啟動(dòng)它,讓它工作,調(diào)優(yōu)它,使其高效,完成構(gòu)建整個(gè)數(shù)據(jù)中心所需的所有工作。我們實(shí)際上建造了屬于我們自己的這一切,對(duì)吧?我們正在建造我們自己的幾個(gè)(數(shù)據(jù)中心),來使其盡可能高效。然后這是瘋狂的部分,我們將它們分解成像這樣的小部分。所以我們拿一整個(gè)數(shù)據(jù)中心,讓你決定你想買哪些部分。因此,我們讓你來決定想如何購買。也許你的網(wǎng)絡(luò)不同,你的存儲(chǔ)不同,你的控制平面不同。至少你的管理模塊會(huì)有所不同。所以,我們與你合作,我們會(huì)分解一切,弄清楚如何將其整合到你的系統(tǒng)中,然后我們有整個(gè)團(tuán)隊(duì)的人來幫助你做到這一點(diǎn)。這并不是人們過去購買芯片的方式。這實(shí)際上是在設(shè)計(jì)數(shù)據(jù)中心,并將我們的數(shù)據(jù)中心整合到其他人的數(shù)據(jù)中心中。我們的商業(yè)模式反映了這一點(diǎn)。
那么,英偉達(dá)的機(jī)會(huì)是什么?英偉達(dá)的機(jī)會(huì)不是GPU的機(jī)會(huì),因?yàn)槟侵皇且粋€(gè)芯片的機(jī)會(huì)。有很多人制造了GPU,GPU市場與我們正在追求的機(jī)會(huì)非常不同。我們正在追求的是數(shù)據(jù)中心市場,全球數(shù)據(jù)中心的市值約為每年2000億到2500億美元,而那2500億美元正在迅速轉(zhuǎn)向加速計(jì)算和生成式AI。因此,那就是我們的機(jī)會(huì),顯然,由于AI已被證明相當(dāng)成功,這個(gè)機(jī)會(huì)將會(huì)持續(xù)增長。所以,我認(rèn)為我們的機(jī)會(huì)是那2500億美元中的一個(gè)百分比。
我還想澄清一下,我引用的數(shù)字,那2500億美元大約是去年的數(shù)字,我認(rèn)為它每年會(huì)增長25%或20%左右。所以這就是為什么我會(huì)說,英偉達(dá)的機(jī)會(huì)可能在一萬億到兩萬億美元之間,具體取決于時(shí)間框架,但對(duì)該區(qū)間的估算是合理的。
記者:薩姆·奧特曼(OpenAI的CEO)一直在與整個(gè)芯片行業(yè)的人交談,討論擴(kuò)大AI芯片領(lǐng)域的范圍和規(guī)模。他是否與你談?wù)撨^這個(gè)話題?不管他是否談過,你如何看待他的意圖,以及這對(duì)你和你的公司有何影響?
黃仁勛:除了知道他認(rèn)為生成式AI將是一個(gè)非常大的市場機(jī)會(huì)之外,我不了解他的意圖。我也同意他的觀點(diǎn)。讓我們回到基本原則。今天計(jì)算機(jī)生成像素的方式是通過檢索,然后解壓它,并將其顯示在你的屏幕上。整個(gè)過程,人們以為需要很少的能量,但實(shí)際上正好相反。原因在于每一次提示,每次你觸摸手機(jī),它都必須迅速前往某個(gè)地方的數(shù)據(jù)中心,收集所有的數(shù)據(jù)片段,讓CPU去獲取所有的片段,并以一種從推薦系統(tǒng)的角度講得通的方式組合它們,然后發(fā)送回你這里。如果你每次問我一個(gè)問題,我都得去我的辦公室尋找答案,那將消耗比我直接回答更多的能量。所以,我與你的工作方式大體上是生成式AI,我是生成式的而不是基于檢索的。
因此,在未來,越來越多的計(jì)算將是生成式的而不是基于檢索的,但這種生成必須是智能的,必須與上下文相關(guān),等等。我們相信,我知道他也相信這一點(diǎn),幾乎每個(gè)人電腦上的每個(gè)像素,每次你與計(jì)算機(jī)互動(dòng)時(shí),都將由生成式芯片生成。而今天的生成式芯片來自英偉達(dá)。我們希望隨著Blackwell和未來世代的發(fā)展,我們能夠在這一領(lǐng)域繼續(xù)做出很多貢獻(xiàn)。但如果有一天,每個(gè)人的電腦、每個(gè)人的計(jì)算體驗(yàn)都是生成式的,我也不會(huì)感到驚訝。所以這是一個(gè)巨大的機(jī)會(huì),我會(huì)同意這一點(diǎn)。
記者:請(qǐng)問你對(duì)未來的愿景是什么呢?我們有一個(gè)工坊,一個(gè)基礎(chǔ)模型,在我們的生活中會(huì)如何發(fā)展?
黃仁勛:是的,問題是我們?nèi)绾螕碛凶约旱膫€(gè)人LLM(大語言模型)?起初,我們認(rèn)為可能需要進(jìn)行微調(diào),在持續(xù)使用中我們不斷進(jìn)行微調(diào),但如你所知,微調(diào)相當(dāng)耗時(shí)。然后,我們發(fā)現(xiàn)了提示調(diào)整和提示工程,然后我們發(fā)現(xiàn)了上下文、記憶、大上下文窗口,然后我們發(fā)現(xiàn)了工作記憶等等。我認(rèn)為答案是,未來將是所有這些的結(jié)合。你可以通過調(diào)整權(quán)重的一個(gè)層次來進(jìn)行微調(diào),使用LAURA訓(xùn)練方法。你不必微調(diào)所有東西,你只需凍結(jié)它,除了一個(gè)或幾個(gè)層次。然后,你可以進(jìn)行低成本的微調(diào),你可以進(jìn)行提示工程,你可以處理上下文,你可以存儲(chǔ)記憶,所有這些加起來就成了你自己特別的LLM,而這個(gè)LLM可以在某個(gè)云服務(wù)中,也可以是你自己的計(jì)算機(jī)。
記者:我想知道您對(duì)像Groq這樣的AI芯片初創(chuàng)公司有什么評(píng)論,他們在您的主題演講后發(fā)了一條推文說,“我們?nèi)匀桓臁薄?/p>
黃仁勛:聽起來很氣人。我對(duì)此并不是很了解,無法做出聰明的評(píng)論。我確實(shí)認(rèn)為令牌生成是一個(gè)非常困難的問題,如果你想為每個(gè)模型生成令牌,每個(gè)模型都需要它自己的特殊分區(qū)方式,因?yàn)閠ransformer并不是所有模型的統(tǒng)稱。它基于transformer技術(shù),每個(gè)人的transformer在意圖層這一點(diǎn)上是相關(guān)的,但它們都是相當(dāng)不同的。其中一些不是前饋網(wǎng)絡(luò),使用這種叫做混合專家系統(tǒng)(mixture of experts)的東西,從一個(gè)專家到兩個(gè)專家,還有一些是四個(gè)專家,它們?nèi)绾畏峙涔ぷ饕约叭绾温酚尚畔ⅲ瑥囊粋€(gè)專家送到另一個(gè)專家,都是不同的。
因此,每一個(gè)模型都需要非常特殊的優(yōu)化。如果計(jì)算機(jī)太脆弱,就是說它被設(shè)計(jì)來做一些非常具體的事情,并且需要非常具體的輸入,它就是一個(gè)可配置的計(jì)算機(jī),而不是一個(gè)可編程的計(jì)算機(jī)。這沒什么問題,有適合它的地方。但它不允許你從軟件創(chuàng)新的速度中受益。CPU的奇跡之所以不能被低估的原因。CPU之所以一直是CPU,并且這么多年來一直克服了PC主板上的這些需要配置的東西,有一個(gè)非常簡單的原因,因?yàn)镃PU是可編程的。軟件工程師的天才可以通過CPU實(shí)現(xiàn)。如果你把它固定在芯片中,那么你就切斷了軟件工程師的才華。
英偉達(dá)找到的方法是同時(shí)受益于兩者:一種非常專門的計(jì)算形式,平行計(jì)算(parallel computing),基于大規(guī)模線程流基礎(chǔ)的計(jì)算模型,對(duì)延遲的容忍,還有一些關(guān)于英偉達(dá)處理器的獨(dú)特屬性,使其變得非常高效,而在另一方面,它也是可編程的。如果你們注意到的話,一直以來只有一個(gè)架構(gòu)一直存在,經(jīng)過所有其他的那些網(wǎng)絡(luò)、resnets(深度殘差網(wǎng)絡(luò))、NNs(神經(jīng)網(wǎng)絡(luò))、強(qiáng)化模型,最終是transformer。有許多類型的transformer,現(xiàn)在出現(xiàn)了transformer與狀態(tài)空間之間的融合,以及人們處理上下文和記憶的方式,這些架構(gòu)都在發(fā)生瘋狂的變化。
所以,我們能讓一個(gè)模型工作好是很重要的。這是一個(gè)重要的觀察。有人做到這一點(diǎn)真的很棒,但我認(rèn)為, AI最終不是一個(gè)芯片問題,它是一個(gè)軟件問題,芯片的存在是為了促進(jìn)軟件的發(fā)展。我們的工作是促進(jìn)下一個(gè)ChatGPT的發(fā)明,假如說是Llama 70B,我會(huì)非常、非常驚訝。
記者:從關(guān)于軟件的回答接著說。你昨天宣布的一大部分是關(guān)于軟件和NIMs的。增長的機(jī)會(huì)在哪里?從你昨天所做的宣布中,英偉達(dá)最大的增長機(jī)會(huì)在哪里?我有種感覺是這些微服務(wù)將會(huì)是你們的下一個(gè)大事件。關(guān)于軟件的第二部分問題,你在幾次采訪中說過,因?yàn)槲磥砜梢酝ㄟ^說話來實(shí)現(xiàn),所以沒人需要再編碼了。你在建議人們不應(yīng)該學(xué)習(xí)那些技能嗎?
黃仁勛:關(guān)于提問的第二部分,首先,我認(rèn)為人們應(yīng)該學(xué)習(xí)各種技能。拉小提琴看起來真的很難,還有雜耍,以及數(shù)學(xué)、代數(shù)、微積分、微分方程。我認(rèn)為人們應(yīng)該盡可能地學(xué)習(xí)許多技能,不是說編程對(duì)你成為一個(gè)成功的人不再是必要的。曾經(jīng)有一段時(shí)間,世界上有許多偉大的人都在倡導(dǎo)每個(gè)人都必須學(xué)會(huì)編程,不然你會(huì)變得沒用。我認(rèn)為這是錯(cuò)誤的。不是個(gè)人的工作去學(xué)習(xí)C++,不需要C++就能派上用場是計(jì)算機(jī)的工作。
這就是我想說的。而我覺得被忽略的一點(diǎn)是,我相信AI已經(jīng)為彌合技術(shù)鴻溝作出了最大的貢獻(xiàn)。你不必成為C++程序員才能成功。現(xiàn)在你只需要成為一個(gè)能夠提出提示的工程師,而誰不能成為一個(gè)能夠給出提示的工程師呢?當(dāng)我妻子和我交談時(shí),她就像是在給我給出提示一樣,而且效果非常好。我認(rèn)為我們都需要學(xué)會(huì)如何給AI提示,但這與人們學(xué)習(xí)如何指導(dǎo)隊(duì)友并沒有什么不同。取決于你想要做的工作,你所尋求的結(jié)果的質(zhì)量,是在尋求更多的想象力還是你想要更加具體的結(jié)果,你都會(huì)以不同的方式來提示一個(gè)人。
在未來,你會(huì)以同樣的方式與AI交互。你會(huì)根據(jù)你想要獲得的答案讓它做出不同的反應(yīng)。也許,你想要在一開始得到令人驚訝的答案,然后逐漸讓它變得更加具體?多術(shù)語提示?因此,與計(jì)算機(jī)一起工作的方式,每個(gè)人都知道怎么做,我相信這是AI所做的第一件偉大的事情,它消除了技術(shù)鴻溝。看看YouTube上所有人創(chuàng)建AI的視頻,他們根本不用寫任何程序。所以我想這就是我的觀點(diǎn),但是如果有人想要學(xué)習(xí)如何編程,請(qǐng)務(wù)必這樣做,因?yàn)槲覀冋谡衅赋绦騿T。
對(duì)于第一個(gè)問題,我們最近的機(jī)會(huì),是即將建設(shè)的兩種類型的數(shù)據(jù)中心。其中一個(gè)是將通用計(jì)算現(xiàn)代化為加速計(jì)算的數(shù)據(jù)中心。第二個(gè)是這些AI生成的數(shù)據(jù)中心,提示生成數(shù)據(jù)中心。這是我們最近的一個(gè)非常非常大的機(jī)會(huì)。在我們做這個(gè)的同時(shí),我們希望幫助客戶制造AI。有AI的發(fā)明。比如說,LAMA2真是太棒了。Mistral也很棒。還有很多其他的,對(duì)吧?GR非常出色。有很多很多的AI正在被創(chuàng)建,但這些AI對(duì)公司來說很難使用。有算法,它們以原始形式存在,很難運(yùn)行。因此,我們要去創(chuàng)建一些合作伙伴,然后拿取其中最受歡迎的開源模型,并將它們轉(zhuǎn)化為生產(chǎn)質(zhì)量、可用的模型。
但是這些可用的模型,這些預(yù)訓(xùn)練模型本身并不完全有用。你仍然需要對(duì)它們進(jìn)行調(diào)整、微調(diào)、限制條件,使它們能夠訪問專有信息等等。因此,對(duì)于公司來說,要能夠使用AI,我們?nèi)匀恍枰獓@它提供一整套服務(wù),我們稱之為NeMo。一旦我們完成了這些,這個(gè)軟件你可以在任何地方運(yùn)行。所以實(shí)際上,我們不僅僅要發(fā)明AI,而且要制造AI,如果你愿意的話。通過制造這些AI和AI軟件,每個(gè)人都可以使用它。在企業(yè)中,我們的軟件業(yè)務(wù)每年的運(yùn)營額約為十億美元。我認(rèn)為制造AI可能會(huì)成為一個(gè)相當(dāng)大的業(yè)務(wù)。
記者:你提到了技術(shù)鴻溝,我懷疑現(xiàn)在它實(shí)際上正在擴(kuò)大,因?yàn)楹芏喾浅绦騿T,可能是醫(yī)生、律師、經(jīng)理、服務(wù)提供者之類的人,并不完全了解這些機(jī)器正在推出什么,這將對(duì)他們自己的業(yè)務(wù)在非常近的未來中什么樣的顛覆。我想知道,你能給那些相當(dāng)確定自己知道如何工作、并且將在未來幾年甚至更長時(shí)間內(nèi)持續(xù)下去的人什么樣的建議,或許更具體地對(duì)我的以色列觀眾說幾句話。
黃仁勛:首先,我在以色列有3300名員工。我在加沙和西岸有近百名員工。我們在加沙有承包商,我們的心和你們所有人在一起。首要任務(wù),當(dāng)然,是保持安全,我們作為一家公司會(huì)提供一切可能的支持,我們都盡力而為。因此,任何代表公司的人,請(qǐng)這樣做。
對(duì)于你問的第一件事,我觀察到,在GTC上,有醫(yī)療保健公司、藥物發(fā)現(xiàn)公司、金融服務(wù)公司、制造公司、工業(yè)公司、消費(fèi)公司、廣告公司、汽車公司、運(yùn)輸公司和物流公司等等。我相當(dāng)確定,他們之所以來這里都是因?yàn)锳I。因此,你應(yīng)該觀察到的第一件事是,對(duì)于大多數(shù)不在計(jì)算機(jī)行業(yè)的行業(yè)來說,計(jì)算技術(shù)是第二位的,他們的行業(yè)領(lǐng)域是首位的。但因?yàn)锳I使計(jì)算機(jī)如此易于使用,我們實(shí)際上已經(jīng)為他們關(guān)閉了技術(shù)鴻溝。因此,如果你是一名醫(yī)療服務(wù)提供者,你使用AI和計(jì)算技術(shù)影響自己行業(yè)的機(jī)會(huì)比以往任何時(shí)候都大。
一個(gè)例子是,AI初創(chuàng)公司的數(shù)量急劇增長,它們在哪里增長?在醫(yī)療保健等領(lǐng)域,而不僅僅是計(jì)算機(jī)行業(yè)。因此,這非常明確地表明,所有行業(yè)本身都認(rèn)識(shí)到AI的不可思議能力,并且他們有能力利用它。所以我認(rèn)為這絕對(duì)正在發(fā)生。
記者:你談到了大量使用生成式AI和模擬來大規(guī)模訓(xùn)練機(jī)器人,但有很多事情我們無法模擬,尤其是當(dāng)我們開始要求機(jī)器人在非結(jié)構(gòu)化環(huán)境中執(zhí)行更多任務(wù)時(shí)。你認(rèn)為在模擬中訓(xùn)練機(jī)器人的限制是什么,當(dāng)我們開始碰到這些限制時(shí),我們該怎么辦?
黃仁勛:有幾種不同的方式來思考這個(gè)問題。第一種方式,將你的問題放在一個(gè)大型語言模型的背景下來考慮;記住,大型語言模型是在一個(gè)完全不受約束的世界中運(yùn)作。這是一個(gè)無結(jié)構(gòu)的世界,這是其中一個(gè)問題。但想一想,它從大量文本中學(xué)習(xí)。因此,大語言模型,這些基礎(chǔ)模型泛化的能力正是其魔法秘訣。泛化,然后取得上下文,通過幾次迭代。或許在你的提示中,你告訴它你在廚房,你正準(zhǔn)備做一個(gè)煎蛋卷,你指定了問題,你指定了上下文。這些是你只能使用的工具,你沒有黃油。你坐在這里,所有東西都在冰箱里。你描述的上下文就像你在與大語言模型交互時(shí)所做的一樣,這個(gè)機(jī)器人應(yīng)該能夠足夠地泛化,如果應(yīng)用一些你已經(jīng)見過的ChatGPT的秘訣。
這就是我所說的,機(jī)器人領(lǐng)域的ChatGPT時(shí)刻可能近在咫尺。還有很多偉大的科學(xué)問題需要解決,但你可以看到它的外延,并且這個(gè)機(jī)器人可以生成令牌。對(duì)軟件來說,這有意義嗎?它不知道區(qū)別。它只是一個(gè)令牌。所以你必須對(duì)這個(gè)進(jìn)行標(biāo)記化。它的編號(hào)是多少?計(jì)算機(jī)科學(xué)家會(huì)弄明白的。一旦他們將所有這些手勢標(biāo)記化,他們就會(huì)像你標(biāo)記化單詞一樣將其泛化、上下文化。最后一部分是使其具體化。具體化的部分是強(qiáng)化學(xué)習(xí),在ChatGPT中是人類反饋,你會(huì)給它很多例子,問題與回答。在哲學(xué)、化學(xué)、數(shù)學(xué)中的適當(dāng)回答,以及非常精心制作的、人類合適的問題與回答。其中一些被描述在頁面中,有成千上萬,更多的例子已經(jīng)呈現(xiàn)給了成為ChatGPT的大型語言模型。他們所做的工作真的很辛苦。
來個(gè)人類的示例。讓我向你展示如何制作咖啡,這是一個(gè)非常清晰表達(dá)的例子,然后機(jī)器人會(huì)說,哦,我明白了。讓我泛化一下。你的意思是如果我把這個(gè)稍微移動(dòng)到這里,那仍然是同一個(gè)活動(dòng),制作咖啡。所以我使用的是完全相同的類比。你能看到這兩條相似的路徑嗎?因此,事實(shí)上你在ChatGPT中所看到的,現(xiàn)在經(jīng)過我這樣的解釋,你幾乎可以看到它。我們看不到它,唯一的原因是,不知何故,我們無法在大腦中將文字和機(jī)器人的動(dòng)作分離開。那是唯一的原因,唯一的障礙。如果我告訴你對(duì)于計(jì)算機(jī)來說,它們都只是數(shù)字;它不知道差異。然后你就會(huì)說,哇,那很有趣。這是可行的。
記者:關(guān)于幻覺問題,我想知道你是如何看待它,特別是在像醫(yī)療保健這樣的任務(wù)關(guān)鍵型事務(wù)中,你必須做到百分百的正確。那是可以解決的嗎?你是怎么看的?
黃仁勛:是的,我非常感謝這個(gè)問題。幻覺是非常可解決的,不是靠它自己,但它很容易被解決的。如果你說每一個(gè)答案,你首先必須查找答案。所以,這被稱為檢索增強(qiáng)生成。現(xiàn)在,檢索生成仍然有一些弱點(diǎn),但不管怎樣,基本概念是有意義的。所以,不能編造一個(gè)答案,如果你進(jìn)行網(wǎng)絡(luò)查詢,它應(yīng)該先搜索,然后從搜索中,AI讀取答案。不要編造它。只需從網(wǎng)絡(luò)上讀取答案,然后從你讀到的內(nèi)容中,優(yōu)先考慮你認(rèn)為最能回答我的問題、最準(zhǔn)確、最真實(shí)的那些。也許它對(duì)某個(gè)網(wǎng)站了解一些,也許它只是在描述中知道有些不對(duì),就要拒絕這個(gè)回答,并找到最有意義的答案,然后將其描述給你。
實(shí)際上,如果答案對(duì)你真的很重要,這個(gè)AI不能回答你不真實(shí)的東西。它首先進(jìn)行研究,確定哪一個(gè)答案是最好的,然后總結(jié)給你。它要進(jìn)行研究。所以現(xiàn)在,假設(shè)你沒有聊天機(jī)器人,這實(shí)際上是一個(gè)為你做總結(jié)的研究助理。根據(jù)信息的關(guān)鍵性,我可能會(huì)堅(jiān)持要求你在回答我之前總是先進(jìn)行研究。這并不是什么大問題。例如,如果我只是想知道,我知道這些答案是常識(shí),只是我不確定具體是什么。例如,熱茶的溫度是多少?我不太確定。如果不確定的話,你可以先查一下。
記者:我想知道,在構(gòu)建像Blackwell這樣的平臺(tái)時(shí),你們是如何估算計(jì)算需求的,或者說,只是以盡可能快的速度增加計(jì)算能力到無限。如果是后者,你們是如何從功耗和可持續(xù)性的角度考慮這個(gè)問題的。
黃仁勛:答案非常簡單。我們必須弄清楚我們的物理極限在哪里,并盡可能地推進(jìn)到這些物理極限,同時(shí)超越它們。那么,我們?nèi)绾纬轿锢順O限呢?超越物理極限的方式是使事物更加能源效率高。所以我們做的第一件事是使事物更加能源效率高。實(shí)際上,我昨天展示的例子是,訓(xùn)練GPT-4大約需要90天。使用Hopper,將需要8000個(gè)GPU花90天來訓(xùn)練GPT-4,使用Blackwell只需要2000個(gè)Blackwell,4兆瓦,比訓(xùn)練GPT-4少11兆瓦,時(shí)間相同。因此,我們制造了Blackwell,有更高的能源效率,我們就可以推動(dòng)極限。能源效率和成本效率是首要任務(wù)。我還展示了,其可以為大語言模型生成令牌的速度提高30倍。換句話說,我們使其速度提高了30倍,這意味著我們在這樣做時(shí)節(jié)省了很多能源,產(chǎn)生相同令牌需要的能源減少了30倍。能源效率和成本效率實(shí)際上是我們所做一切的核心,這實(shí)際上是首要的。
記者:你提到了很多行業(yè)都有可能經(jīng)歷ChatGPT式的時(shí)刻,顯然,你正在努力使許多行業(yè)能夠?qū)崿F(xiàn)這一點(diǎn)。你能挑出一個(gè)你認(rèn)為首先會(huì)發(fā)生大突破、真正讓你興奮的行業(yè)嗎?
黃仁勛:有很多例子,其中一些因?yàn)榧夹g(shù)原因讓我興奮。有些是因?yàn)槭状谓佑|的原因讓我興奮,還有一些是因?yàn)橛绊懙脑颉:玫模屛医o你一些例子。
我對(duì)Sora非常興奮。我認(rèn)為OpenAI與Sora所做的工作是非凡的。從自動(dòng)駕駛汽車公司W(wǎng)ayve,去年曾看到了相同的能力。你看到我們將近兩年前做過的一些示例,關(guān)于如何從文字生成視頻,為了生成合理的視頻,模型必須對(duì)物理有一種感性理解,當(dāng)你放下一個(gè)杯子時(shí),它位于桌子上面,而不是桌子中間。因此,行走的人在地面上,他們的腳不在地下。所以,這具有對(duì)物理的感性理解。它不遵循物理定律,但對(duì)物理有感性理解。它理解世界的模型。
其次,我認(rèn)為我們與Earth 2 CorrDiff所做的工作具有巨大影響。為了在三公里的規(guī)模上預(yù)測天氣,需要一臺(tái)比目前用于天氣預(yù)測的超級(jí)計(jì)算機(jī)大25000倍的超級(jí)計(jì)算機(jī)。因此,三公里的規(guī)模允許我們預(yù)測極端天氣對(duì)當(dāng)?shù)厣鐓^(qū)的影響。我們所做的另一個(gè)好處是,我們使它的能源效率提高了3000倍,通過這樣做,并且速度提高了一千倍,我們可以預(yù)測極端天氣的一大堆不同的飛行路徑,因?yàn)樘鞖馐腔煦绲摹K裕阆氡M可能多地對(duì)它進(jìn)行抽樣。我們可以進(jìn)行10000次抽樣,而不是一次。因此,我們得到正確答案或最有可能的答案的能力大大提高了。因此,極端天氣預(yù)測,局部、區(qū)域預(yù)測,我認(rèn)為這是非常有影響力的工作。
我還認(rèn)為,在生成可能的、可藥用的分子,具有特定靶蛋白質(zhì)方面的工作非常理想,基本上是發(fā)現(xiàn)小分子藥物。我們可以將其放入像AlphaGo那樣的強(qiáng)化學(xué)習(xí)循環(huán)中,坐在那里生成各種分子,并將其附著到蛋白質(zhì)上,并使用AI模型來做到這一點(diǎn),這樣我們就不必在超級(jí)計(jì)算機(jī)中做這些。我們可以探索巨大的空間。那是非常有影響力的東西。一些早期指標(biāo)非常令人興奮的領(lǐng)域,例如我們剛才關(guān)于機(jī)器人的討論。通過在通用機(jī)器人學(xué)中的潛在影響,使它們不那么脆弱,可以變得更有用。因此,正在發(fā)生的這些事情非常令人興奮。
記者:希望你能深入探討一下你對(duì)藥物發(fā)現(xiàn)和蛋白質(zhì)的愿景,比如結(jié)構(gòu)預(yù)測,以及最終涉及分子設(shè)計(jì)的內(nèi)容。另外,這些努力對(duì)你的其他項(xiàng)目有什么影響,比如量子計(jì)算?你是否需要在量子方面做更多的工作來幫助支持其他項(xiàng)目,比如藥物發(fā)現(xiàn)方面的工作?
黃仁勛:我來從后往前回答。你知道,我們可能是世界上最大的量子計(jì)算公司,而我們并不制造量子計(jì)算機(jī)。我們之所以這樣做,是因?yàn)槲覀兿嘈帕孔佑?jì)算。我們認(rèn)為沒有必要再建造另一個(gè)量子計(jì)算機(jī)。而量子計(jì)算不僅是量子計(jì)算機(jī)。當(dāng)它發(fā)生時(shí),量子計(jì)算機(jī)很可能會(huì)是一種加速器,就像視頻加速器一樣。它用于非常特定的某些事情。量子計(jì)算不會(huì)用于所有計(jì)算。它是一個(gè)非常特定的領(lǐng)域,并且將與經(jīng)典計(jì)算機(jī)連接。因此,我們創(chuàng)建了CUDA-Q,這是CUDA的編程模型,但用于量子,經(jīng)典量子CUDA架構(gòu)。其次,我們創(chuàng)建了CUDA Quantum,另一個(gè)“CU”,允許我們模擬量子計(jì)算機(jī)。
今天,我們可以模擬一個(gè)量子計(jì)算機(jī),其速度比34、36量子比特的量子計(jì)算機(jī)還要快。我們可以用它來模擬量子電路,以便算法專家可以開始研究量子計(jì)算機(jī)。我們可以使用它進(jìn)行后量子密碼學(xué),為量子到來時(shí)世界做準(zhǔn)備,到那時(shí)所有的數(shù)據(jù)已經(jīng)被編碼并適當(dāng)?shù)剡M(jìn)行了密碼編碼。因此,我們可以為所有這些作出貢獻(xiàn)。我們與世界上絕大多數(shù)量子計(jì)算機(jī)公司、研究人員、量子計(jì)算機(jī)制造商等合作。因此,我們相信,在它對(duì)數(shù)字生物學(xué)方面的科學(xué)突破作出貢獻(xiàn)之前,還需要相當(dāng)長的時(shí)間。
實(shí)際上,整個(gè)對(duì)NIM的認(rèn)識(shí)都是從我們對(duì)數(shù)字生物學(xué)和BioNEMO所做的工作中獲得的,BioNEMO幾乎就是我們的第一個(gè)NIM。原因是這些模型非常驚人,但它們太難使用了。你怎么能使用它們呢?因此,我們開始考慮以一種非常特殊的方式打包它們,以便所有研究人員都可以使用。BioNeMo正在被廣泛使用。我為此感到非常驕傲。你發(fā)送一個(gè)化學(xué)蛋白質(zhì)對(duì),它會(huì)告訴你結(jié)合能量是否足夠低。你發(fā)送一個(gè)化學(xué)物,你說,給我一堆像這個(gè)一樣的例子,探索那個(gè)藥物化的空間,它就會(huì)創(chuàng)造出一大堆。我的意思是,那真的很酷。
記者:對(duì)于美國和中國之間的緊張關(guān)系,你認(rèn)為這將如何影響英偉達(dá)的生產(chǎn)和銷售?就是說,如果在你制造它們的地方、或在你可以銷售它們的地方出現(xiàn)問題,那是你無法控制的障礙。那么,你認(rèn)為這將如何影響英偉達(dá)的前進(jìn)路徑?
黃仁勛:是的,我們必須立即做兩件事。其中之一是確保我們理解政策,并確保我們遵守它們。然后第二,盡我們所能,加強(qiáng)供應(yīng)鏈的韌性。正如你所知,我們不僅僅是制造一個(gè)芯片。我將這個(gè)Blackwell作為例子,其中有超過35000個(gè)部件,8個(gè)部件來自TSMC(臺(tái)積電),其他35000個(gè)部件則不是。當(dāng)我們將這個(gè)東西配置成像那樣的DGX時(shí),這個(gè)配置有60萬個(gè)部件。這些部件來自世界各地,其中許多是在中國制造的。這就是事實(shí)。這對(duì)汽車行業(yè)來說是事實(shí),對(duì)國防工業(yè)也是如此。因此,世界的供應(yīng)鏈相當(dāng)復(fù)雜。我確實(shí)非常相信,各國的目標(biāo)并不是對(duì)抗性的。他們有一些公平性問題需要解決,但我認(rèn)為末日?qǐng)鼍安惶赡馨l(fā)生,我們也不指望它發(fā)生。但當(dāng)然,我希望那不會(huì)發(fā)生。我們能做的事情與韌性相關(guān),然后是合規(guī)性,讓其他人做好他們的工作。
記者:你能談?wù)動(dòng)ミ_(dá)與臺(tái)積電的關(guān)系嗎?在過去幾年中,隨著芯片和封裝復(fù)雜性不斷增加,這種關(guān)系是如何發(fā)展的,特別是考慮到Blackwell及其雙芯設(shè)計(jì),他們?nèi)绾螏椭銓?shí)現(xiàn)了這一設(shè)計(jì)?
黃仁勛:我們與臺(tái)積電的合作關(guān)系可能是我們所有合作伙伴關(guān)系中最密切的一個(gè),這是可以理解的。我們所做的事情非常非常困難,而他們做得非常非常好。我們從他們那邊得到compute D,CPUD,GPU芯片,COAs基板,以及來自Micron、SK Hynix和三星的內(nèi)存,這些都在中國臺(tái)灣組裝。所以,供應(yīng)鏈并不簡單,需要大公司的協(xié)調(diào),他們代表我們完成這項(xiàng)工作。這些大公司一起工作,他們意識(shí)到未來會(huì)需要更多COOs類型的互動(dòng)。因此,我們解決了所有問題。公司間的協(xié)作實(shí)際上非常非常好。組裝完成后,第三家公司需要來測試,然后第四家公司將其集成到一個(gè)大系統(tǒng)中。
為了構(gòu)建像這樣的超級(jí)計(jì)算機(jī),你需要一個(gè)超級(jí)計(jì)算機(jī)來測試它,為了讓其進(jìn)入數(shù)據(jù)中心。想象制造車間就是一個(gè)巨大的數(shù)據(jù)中心,因此,整個(gè)供應(yīng)鏈上下游的復(fù)雜性非常高,我們不是單獨(dú)構(gòu)建這個(gè)芯片。這是一個(gè)奇跡。當(dāng)人們問我,你們制造什么?你們制造GPU,我感覺他們想象的是我們像制造SOCs那樣制造這些芯片。但每當(dāng)有人說GPU,我看到的是這個(gè),是這樣的機(jī)架,是電纜和交換機(jī),這是我心目中的GPU和一大堆軟件。所以臺(tái)積電是其中非常關(guān)鍵的一部分。
記者:英偉達(dá)正轉(zhuǎn)向云業(yè)務(wù),而其他云提供商正在制造芯片。你對(duì)這一趨勢有何看法?首先,大型科技公司制造芯片的事實(shí),會(huì)對(duì)你們的長期定價(jià)策略產(chǎn)生影響嗎?你的云策略是什么?特別是考慮到中國市場,你們有計(jì)劃在中國推出DGX Cloud嗎?如果沒有,你們會(huì)提供什么解決方案?
黃仁勛:首先,我們構(gòu)建了HGX。我們將其出售給戴爾,然后戴爾將其放入計(jì)算機(jī)中然后出售。我們之所以這樣做,然后我們創(chuàng)建在戴爾計(jì)算機(jī)上運(yùn)行的軟件,并且我們創(chuàng)造市場需求來拉動(dòng)戴爾計(jì)算機(jī)的銷售,因?yàn)榇鳡柌蝗缥覀兞私庥ミ_(dá)的技術(shù)。因此,我們必須幫助戴爾創(chuàng)造需求。我們必須幫助戴爾創(chuàng)建這些系統(tǒng)并為其開發(fā)軟件。我們必須對(duì)云服務(wù)做同樣的事情。我們與云服務(wù)提供商合作,將NVIDIA云集成到他們的云中。我們不是一家云計(jì)算公司。我們的云稱為DGX Cloud,但實(shí)際上我們在他們的云中。
我們的目標(biāo)與我剛才提到的與戴爾相同。我們的目標(biāo)是將客戶帶到他們的云中,就像將客戶帶到戴爾的這臺(tái)機(jī)器上。所以,不是HGX到戴爾,而是稱為DGX Cloud到CSPs到Azure。這是同一個(gè)理念。因此,我們開發(fā)軟件、培養(yǎng)開發(fā)者,并為使用我們架構(gòu)的CSPs創(chuàng)造需求。這與任何人的芯片無關(guān),而是與NVIDIA作為一個(gè)計(jì)算平臺(tái)公司的角色有關(guān)。一個(gè)計(jì)算平臺(tái)公司必須培養(yǎng)自己的開發(fā)者。這就是GTC存在的原因,一個(gè)開發(fā)者大會(huì)。如果我們是X86公司,為什么需要一個(gè)開發(fā)者大會(huì)?世界上每個(gè)人都在使用X86。開發(fā)者大會(huì)有什么用?因?yàn)槲覀兊募軜?gòu)仍在被采用,其使用是復(fù)雜的。我們必須為它舉辦開發(fā)者大會(huì)。因此,DRAM不需要開發(fā)者大會(huì),以太網(wǎng)不需要開發(fā)者大會(huì),但像我們這樣的計(jì)算平臺(tái)需要開發(fā)者大會(huì),因?yàn)槲覀冃枰_發(fā)者。英偉達(dá)無處不在。我們在每個(gè)云中,每個(gè)數(shù)據(jù)中心等等。
記者:你曾說,通用人工智能(AGI)將在五年內(nèi)到來,而Blackwell如此強(qiáng)大,你是否仍然堅(jiān)持這個(gè)時(shí)間表,或者您認(rèn)為它會(huì)加快?如果加快了,你是否有任何顧慮?我之所以這樣問,是因?yàn)槟@然是現(xiàn)代的達(dá)芬奇,但也可以成為現(xiàn)代的奧本海默。
黃仁勛:奧本海默制造了一顆炸彈,我們沒有那樣做。首先,定義AGI。我現(xiàn)在說這個(gè),相信每個(gè)人都在努力去定義它。我希望你能具體定義一個(gè)AGI,以便我們每個(gè)人都知道我們何時(shí)到達(dá)了。比如,定義什么是圣克拉拉?它的地理空間位置非常具體,你們都知道如何到達(dá)那里。定義新年,我們所有人都知道新年何時(shí)到來,甚至基于我們的時(shí)區(qū),我們知道已經(jīng)到達(dá)了。但AGI有點(diǎn)不同,如果我們將AGI定義為非常具體的東西,意味著一大系列的測試,數(shù)學(xué)測試、閱讀測試、閱讀理解測試、邏輯測試、醫(yī)學(xué)考試、法律考試、經(jīng)濟(jì)學(xué)測試等等,你說的任何測試——一堆測試。如果我拿一堆測試,并且我說AGI的定義是當(dāng)這套測試軟件程序做得很好時(shí),意思是比80%中的大多數(shù)人都要好,或者幾乎比所有人都要好。你認(rèn)為計(jì)算機(jī)五年內(nèi)能做到嗎?答案可能是肯定的。
因此,每次我回答這個(gè)問題,我都會(huì)具體說明AGI,但到了媒體報(bào)道中,沒人具體說明。所以這就取決于你的目標(biāo)是什么。我的目標(biāo)是與你溝通,你的目標(biāo)是弄清楚你想要講什么故事。因此,我相信,正如我所定義的AGI,可能在五年內(nèi)實(shí)現(xiàn)。對(duì)于通用人工智能這三個(gè)詞,我不知道我們是否達(dá)成一致。這就是為什么我們有那么多不同的詞來描述彼此的智能。
記者:我喜歡你說電腦游戲是OG(原創(chuàng))生成器的觀點(diǎn)。基于這一點(diǎn),你去年有一個(gè)非常有先見之明的引用,即未來,每一個(gè)像素都將被生成,而不是渲染。你認(rèn)為我們距離這個(gè)每個(gè)像素都在實(shí)時(shí)幀率下生成的世界還有多遠(yuǎn),以及在這個(gè)新范式中,你對(duì)游戲和非游戲體驗(yàn)有什么愿景?
黃仁勛:我認(rèn)為在技術(shù)領(lǐng)域,變革曲線不會(huì)超過十年。一旦它變得可行,變得更好,當(dāng)然,ChatGPT不僅可行,在大多數(shù)情況下它更好。我認(rèn)為這距離現(xiàn)在不到10年。10年后,你就處于那個(gè)S曲線的另一端。從現(xiàn)在起5年,你可能正處在中間,一切都在實(shí)時(shí)變化。每個(gè)人都會(huì)說,看,這就發(fā)生了。所以你只需要決定。我們是不是已經(jīng)進(jìn)入那10年的前兩年了,可能已經(jīng)進(jìn)入前兩年了。因此,我會(huì)說在接下來的5到10年的某處之間,比如說八年,這幾乎是肯定的。
記者:日經(jīng)指數(shù)在你們最近的財(cái)報(bào)發(fā)布后創(chuàng)下了歷史新高,因此可以肯定地說,日本市場上有很多目光都在關(guān)注英偉達(dá)。你還在12月與岸田首相會(huì)面,討論了在日本擴(kuò)展AI能力。你能否與我們分享,在擴(kuò)展日本的AI能力方面有何進(jìn)展?或者分享你對(duì)日本市場、對(duì)NVIDIA產(chǎn)品和業(yè)務(wù)的一般展望。
黃仁勛:我認(rèn)為日本高度認(rèn)識(shí)到提高生產(chǎn)力非常重要。我們都知道,當(dāng)一家公司變得更有生產(chǎn)力時(shí),收益會(huì)提高。當(dāng)收益提高時(shí),我們會(huì)雇傭更多的人。當(dāng)由許多公司組成的經(jīng)濟(jì)變得更有生產(chǎn)力時(shí),經(jīng)濟(jì)會(huì)增長,雇傭更多的人,生活質(zhì)量會(huì)更高。日本,像許多國家和公司一樣,需要提高生產(chǎn)力。AI是我們所知提高國家生產(chǎn)力的最佳方式。我認(rèn)為日本理解這一點(diǎn)。日本也理解,日本的數(shù)據(jù)、語言和文化非常特定,沒有理由允許其他第三方收集那些數(shù)據(jù)來創(chuàng)建AI,然后重新輸入到日本,再讓日本市場為其付費(fèi),這是沒有意義的。你應(yīng)該自己建立它。因此,出于主權(quán)AI、國家生產(chǎn)力、企業(yè)生產(chǎn)力等原因,我認(rèn)為AI將在日本非常重要。我發(fā)現(xiàn)日本的活力令人振奮,有著驚人的能量,我所有的業(yè)務(wù)伙伴都對(duì)這個(gè)機(jī)會(huì)感到非常興奮,我也為你們感到興奮。
記者:英偉達(dá)是否計(jì)劃進(jìn)一步擴(kuò)大在以色列的業(yè)務(wù)規(guī)模,開設(shè)更多的中心,并收購更多的公司?英偉達(dá)在以色列的未來將會(huì)是怎樣的?
黃仁勛:以色列是英偉達(dá)按人均計(jì)算,員工最多的國家之一。以色列是英偉達(dá)最大的總部所在地,已經(jīng)有3300人,也是我們一些最有才華工程師的家園。我們最重要的投資之一,NVSwitch來自以色列。我跟你們談到的這個(gè)東西,是Blackwell的心臟和靈魂,也來自以色列。因此,我們將繼續(xù)在以色列進(jìn)行大量投資。那個(gè)地區(qū)對(duì)我來說非常重要。我們在西岸也在招聘。我們支持我們所有在西岸的巴勒斯坦員工,并照顧他們及其家人。不會(huì)有員工失去我們的支持,我們不會(huì)離開西岸,那個(gè)地區(qū)對(duì)我們非常重要。員工需要知道公司支持他們。為了讓他們做出偉大的工作,你需要知道自己的基礎(chǔ)是牢固的。英偉達(dá)是一家堅(jiān)強(qiáng)的公司。我們的基礎(chǔ)是堅(jiān)強(qiáng)的,我們對(duì)那里的員工的支持是明確無誤的。因此,他們可以知道這一點(diǎn)。他們應(yīng)該知道。
記者:印度政府最近承諾通過公私合作伙伴關(guān)系購買10000個(gè)GPU。英偉達(dá)是這個(gè)計(jì)劃的一部分嗎?同時(shí),印度的AI計(jì)算能力目前不到世界的2%。你怎么看待近期內(nèi)這個(gè)情況的發(fā)展?
黃仁勛:首先,如果印度正在為AI購買GPU,我想就這個(gè)問題分享我的想法。我認(rèn)為英偉達(dá)制造的AI GPU非常優(yōu)秀,當(dāng)你回去的時(shí)候,如果你能傳播這個(gè)信息,那說明我們在這方面做得非常好。其次,我們對(duì)此非常感興趣,如果有人想購買一些GPU,我們會(huì)很高興,會(huì)開放業(yè)務(wù)。所以,希望大家傳播這個(gè)消息,英偉達(dá)開放了業(yè)務(wù)。
我認(rèn)為AI是一個(gè)巨大的機(jī)會(huì)。實(shí)際上,當(dāng)我去印度時(shí),我通常有機(jī)會(huì)見到印度總理莫迪,那真是非常非凡的經(jīng)歷。他對(duì)我說:“Jensen,印度不應(yīng)該出口面粉來進(jìn)口面包。”非常有道理。為什么要出口原材料來進(jìn)口增值產(chǎn)品?為什么要出口印度的數(shù)據(jù),這樣你就可以進(jìn)口AI,對(duì)它進(jìn)行精煉并增加其價(jià)值?
第二,印度擁有世界上最多的IT專業(yè)人員。毫無疑問,他們正在為AI重新培訓(xùn)。當(dāng)我與印度的領(lǐng)導(dǎo)者們會(huì)面時(shí),他們非常清楚這是重新培訓(xùn)自己的最大機(jī)會(huì)之一。他們將不再僅僅是公司后臺(tái)的IT,而是成為公司前臺(tái)的IT,在那里創(chuàng)造價(jià)值。AI被用于工程、市場、銷售、財(cái)務(wù)、商業(yè)運(yùn)營和市場策略。所有這些都是前臺(tái),而不是后臺(tái)。印度正尋求進(jìn)入IT的前臺(tái),那里有最大的市場機(jī)會(huì),我認(rèn)為你們絕對(duì)會(huì)做到,我為你們感到很興奮。
記者:想問一下關(guān)于臺(tái)積電,我們知道,臺(tái)積電總能確保供應(yīng),但許多公司仍想要更多。你認(rèn)為三星或者SK海力士怎么樣?除了HBM(高帶寬內(nèi)存)外?
黃仁勛:這就好像是問我一個(gè)關(guān)于臺(tái)積電的問題,然后說,除了他們的代工業(yè)務(wù)外,你覺得臺(tái)積電怎么樣?(就像問)你喜歡與NVIDIA合作嗎,除了GPU以外?你知道HBM內(nèi)存非常復(fù)雜,增值非常高。我們在HBM上花了很多錢。我們正在對(duì)三星的HBM進(jìn)行認(rèn)證。還沒有,但是還沒有。但我們會(huì)的。
記者:你們有讓三星制造芯片嗎?你對(duì)這種關(guān)系怎么看?
黃仁勛:三星是非常好的合作伙伴。韓國,如你所知,生產(chǎn)了世界上最大數(shù)量的先進(jìn)內(nèi)存。HBM非常復(fù)雜。不要把HBM想象成DDR 5。完全不是那回事。它就是一個(gè)技術(shù)奇跡,這就是為什么它的速度如此之快。HBM內(nèi)存就像邏輯一樣運(yùn)行,不僅僅是DRAM,并且變得越來越復(fù)雜。那些制造商是如此謙遜,以至于你誤解了。HBM是一個(gè)技術(shù)奇跡。現(xiàn)在,令人驚奇的是,由于生成式AI,在所有數(shù)據(jù)中心,過去的DDR內(nèi)存都將成為未來的HBM內(nèi)存。三星和SK海力士的升級(jí)周期是難以置信的。只要英偉達(dá)開始增長,他們就會(huì)與我們一同增長,我們將在世界數(shù)據(jù)中心替換的內(nèi)存量是巨大的。
為什么這么好?因?yàn)镠BM內(nèi)存的能源效率要好得多。這就是我們?nèi)绾问故澜绺沙掷m(xù),以便我們可以使用更先進(jìn)的內(nèi)存,它更快但功耗非常低。這非常復(fù)雜。是的。我非常重視我們與SK海力士和三星的合作伙伴關(guān)系。他們非常出色。
我們與臺(tái)積電的關(guān)系沒有過于密切。不,我們應(yīng)該更親密,但我們應(yīng)該與所有合作伙伴都保持親密。我們與三星的關(guān)系非常深入。我們未來將要構(gòu)建的每輛車都基于三星,我們對(duì)自動(dòng)駕駛汽車行業(yè)的承諾非常高。因此,我們對(duì)合作伙伴的信任必須是非常長期的。三星是一家非凡的公司,也許你住在三星所在的同一個(gè)城市,你忘記了他們有多么了不起。但從我所在的位置來看,三星是一家非凡的公司,SK海力士也是非凡的。這就是他們能成為自己領(lǐng)域的世界領(lǐng)導(dǎo)者的原因。