ChatGPT的火,已經(jīng)從AI圈燒到了全球。
自2022年11月推出后,這款強(qiáng)大的聊天機(jī)器人僅用60天月活過億,被《財(cái)富》認(rèn)為是劃時(shí)代的產(chǎn)品,引微軟、谷歌等巨頭紛紛下場(chǎng)。更重要的是,以ChatGPT為代表的AIGC(Artificial Intelligence Generated Content,生成式AI),正在人工智能領(lǐng)域掀起AI商業(yè)化的新一輪浪潮,打開了諸多行業(yè)變革的想象天窗。如果要問誰是當(dāng)下離 AI 技術(shù)革命最近的人,ChatGPT之父、OpenAI CEO 山姆·阿爾特曼(Sam Altman)一定位列其中。
2017 年,還在擔(dān)任硅谷知名創(chuàng)業(yè)孵化器 Y Combinator總裁的他,和伊隆·馬斯克、彼得?蒂爾、雷德?霍夫曼等人一起投資了 10 億美元,共同成為 Open AI 的創(chuàng)始人。又過了兩年,他將工作重心轉(zhuǎn)移到了 AI,擔(dān)任 OpenAI 的 CEO 直到今天。在去年秋天,山姆·阿爾特曼與 Open AI 創(chuàng)始人之一、領(lǐng)英聯(lián)合創(chuàng)始人雷德?霍夫曼(Reid Hoffman)展開了一場(chǎng)精彩對(duì)話。其中,山姆·阿爾特曼分享了他對(duì)于未來AI發(fā)展的預(yù)測(cè):AI 大模型技術(shù),將成為繼移動(dòng)互聯(lián)網(wǎng)之后,未來最大的技術(shù)平臺(tái);而以聊天機(jī)器人為界面,加上圖像、音樂、文本等多模態(tài)模型的發(fā)展,將誕生大型企業(yè)。
他是如何判斷AI未來商業(yè)化發(fā)展的?大型AI企業(yè)將誕生于哪些領(lǐng)域?AI將取代人類的工作,還是更好地幫助人類工作?
▍最是一年春好處AI大模型——未來最大的技術(shù)平臺(tái)Q:很多AI大模型都通過API(application programming interface,應(yīng)用接口)開放使用,它真正的商業(yè)機(jī)會(huì)是什么?A:現(xiàn)在,語言模型已經(jīng)可以很好地應(yīng)用到文案寫作和教育服務(wù)領(lǐng)域。我相信未來幾年內(nèi),語言模型會(huì)更加強(qiáng)大,將能與Google這一價(jià)值萬億美元的搜索產(chǎn)品一較高下。語言模型的應(yīng)用將會(huì)改變我們的日常生活。
以前,人們太早嘲笑許多趨勢(shì),比如聊天機(jī)器人,其實(shí)它很有價(jià)值,只是當(dāng)時(shí)的技術(shù)還不能滿足需求?,F(xiàn)在的聊天機(jī)器人更加成熟,幾乎可以達(dá)到人類水平。聊天機(jī)器人可以用于醫(yī)療服務(wù)行業(yè),提供咨詢和教育服務(wù),這方面將能催生出大型企業(yè)。我相信,不久之后會(huì)出現(xiàn)多模態(tài)模型,這將開辟新的事物?,F(xiàn)在,人們可以直接用自然語言命令計(jì)算機(jī)為你完成你想做的工作。例如DALL-E圖像生成工具和Copilot編程工具,都是用戶向它們輸入自然語言描述,然后工具自動(dòng)生成用戶想要的東西,用戶還可以不斷迭代修改自己的描述,直至工具給出滿意的輸出。類似的AI應(yīng)用方式會(huì)成為大趨勢(shì),可以孕育出許多大型企業(yè)。強(qiáng)大的AI模型可以成為孵化各種AI應(yīng)用的平臺(tái),就像智能手機(jī)的出現(xiàn)催生出眾多APP一樣,它們的共同點(diǎn)都是可以制造無數(shù)的商業(yè)機(jī)會(huì)。
Q:作為大型語言模型 API 的服務(wù)提供商,關(guān)鍵是什么?如何創(chuàng)建一個(gè)持久的差異化業(yè)務(wù)?A:將來應(yīng)該會(huì)出現(xiàn)幾個(gè)大型的基礎(chǔ)模型,開發(fā)人員都將基于這些基礎(chǔ)模型研發(fā)AI應(yīng)用。但目前的情況依然是某一家公司開發(fā)出一個(gè)大型語言模型,然后開放API供他人使用。我認(rèn)為,將來在基礎(chǔ)模型和具體AI應(yīng)用研發(fā)之間會(huì)有一個(gè)中間層:出現(xiàn)一批專門負(fù)責(zé)調(diào)整大型模型以適應(yīng)具體AI應(yīng)用需求的初創(chuàng)企業(yè)。能做好這一點(diǎn)的初創(chuàng)公司將會(huì)非常成功,但這取決于它們能在「數(shù)據(jù)飛輪」上走多遠(yuǎn)。
數(shù)據(jù)飛輪:使用更多數(shù)據(jù)可以訓(xùn)練出更好的模型,吸引更多用戶,從而產(chǎn)生更多用戶數(shù)據(jù)用于訓(xùn)練,形成良性循環(huán)。我對(duì)初創(chuàng)企業(yè)訓(xùn)練模型的能力持懷疑態(tài)度,將來承擔(dān)模型訓(xùn)練角色的應(yīng)該不會(huì)是初創(chuàng)公司,但這些企業(yè)可以在上述的中間層角色中發(fā)揮巨大價(jià)值。我認(rèn)為中間那一層會(huì)創(chuàng)造很多價(jià)值。Q:一個(gè)大型語言模型初創(chuàng)企業(yè),如何區(qū)別于另一個(gè)大型語言模型初創(chuàng)企業(yè)呢?從某種意義而言,創(chuàng)業(yè)公司會(huì)訓(xùn)練自己的模型,只不過不是從頭開始。他們將采用基礎(chǔ)模型,這些模型已經(jīng)經(jīng)過大量的計(jì)算和數(shù)據(jù)訓(xùn)練,然后在這些模型之上進(jìn)行訓(xùn)練,為每個(gè)垂類創(chuàng)建模型。
他們所做的 1% 的訓(xùn)練,對(duì)于應(yīng)用來說至關(guān)重要。我認(rèn)為,這些創(chuàng)業(yè)公司將會(huì)非常成功,并且與眾不同??赡馨ㄒ欢螘r(shí)間內(nèi)存在的 prompt engineering(提示工程)或基礎(chǔ)核心模型(core base model)。注:提示工程是指將任務(wù)的描述、或者提問放在輸入中,讓 AI 模型輸出理想結(jié)果的調(diào)試過程;ChatGPT 走紅之后,提示工程師這一崗位也被人所關(guān)注。Q:五年內(nèi),大多數(shù)用戶與基礎(chǔ)模型交互的方式是什么?prompt engineering 將是許多組織的內(nèi)部職能嗎?A:我不認(rèn)為五年后我們還做 prompt engineering,這將被整合進(jìn)所有地方。無論用文本還是語音,取決于上下文,只需要語言接口,讓計(jì)算機(jī)做你想做的任何事情。將來的AI系統(tǒng)不會(huì)因?yàn)樵鲅a(bǔ)了某個(gè)特定詞就會(huì)產(chǎn)生截然不同的輸出,而是可以較好地理解自然語言,用戶只需以文本和語音形式輸入指令,即可讓計(jì)算機(jī)完成圖像生成、資料研究、心理咨詢等復(fù)雜任務(wù)。總的來說,用戶只需使用自然語言就可以與計(jì)算機(jī)交互,當(dāng)然,如果藝術(shù)家能想出更有創(chuàng)造性的描述,也自然就可以生成更好的圖像。Q:當(dāng)有一個(gè)偉大的視覺思考者,他們可以從 DALL-E 中獲取更多,因?yàn)樗麄冎廊绾胃钊胨伎?,知道如何在測(cè)試中迭代循環(huán)。你認(rèn)為這是大部分這類事的普遍真理嗎?A:百分百確定。重要的是思想的質(zhì)量,和對(duì)你想要的東西的理解。所以藝術(shù)家仍然會(huì)在圖像生成方面做得最好,不是因?yàn)樗麄冊(cè)趫D像最后加上了這個(gè)神奇單詞,而是因?yàn)樗麄兡苡梦覜]有的創(chuàng)造性的眼光來表達(dá)。Q:最令你驚訝的是什么?如果沒有意識(shí)到事情已經(jīng)發(fā)展到這一步,你認(rèn)為會(huì)有什么樣的驚喜呢?A:人們現(xiàn)在所犯的最大的系統(tǒng)性錯(cuò)誤,就是他們會(huì)說,「好吧,我也許持懷疑態(tài)度,但是這種語言模型真的會(huì)起作用,當(dāng)然,圖像和視頻也會(huì)起作用。但它不會(huì)為人類產(chǎn)生新知。它只會(huì)做其他人已經(jīng)做過的事情。這還是讓智力的邊際成本非常低,不能治愈癌癥。它不會(huì)增加人類科學(xué)知識(shí)的總和?!?我認(rèn)為這將被證明是錯(cuò)誤的,讓目前該領(lǐng)域的專家最感到驚訝的地方。
▍當(dāng) AI 科學(xué)家可以自我迭代Q:無論是建立在 API 之上,還是科學(xué)家使用 API,有哪些地方的科學(xué)會(huì)加速,以及如何加速?A:現(xiàn)在科學(xué)界對(duì)AI的應(yīng)用分為兩種。一種是將AI工具直接用于科學(xué)目的,如AlphaFold(用于蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)),它們可以創(chuàng)造巨大價(jià)值,相信未來會(huì)出現(xiàn)無數(shù)這樣的工具。另一種是將AI工具用于提升科研工作效率,如幫科學(xué)家和工程師找到新研究方向、寫代碼等。Copilot編程工具就是一個(gè)例子。但AI工具的能力遠(yuǎn)不止于此。上述兩種AI應(yīng)用將會(huì)大大推動(dòng)科技前進(jìn)。此外,目前科學(xué)界也在探索對(duì)AI的第三種應(yīng)用方式——讓AI成為可以「自我改進(jìn)」的科學(xué)家。這件事情既有好處也有風(fēng)險(xiǎn)。
好的一面是,可以利用AI將人類的工作內(nèi)容自動(dòng)化,教會(huì)AI做任何人類可以做的事情:探索新科學(xué)、提出理論解釋、驗(yàn)證、思考等,或許還可借此解決困擾人類已久的「AI對(duì)齊問題(Alignment Problem)」(即如何讓AI系統(tǒng)的目標(biāo)符合人類的價(jià)值觀)。風(fēng)險(xiǎn)在于,有人擔(dān)心懂得「自我改進(jìn)」的AI有可能會(huì)像科幻小說描寫的那樣,擅自改動(dòng)代碼或修改優(yōu)化算法。我深信,真正有利于促進(jìn)人類和經(jīng)濟(jì)的前行的,是一個(gè)能夠推動(dòng)科學(xué)進(jìn)步的社會(huì)架構(gòu)。我們能從這樣的社會(huì)架構(gòu)中獲益很多。A:建立一個(gè)非常強(qiáng)大的系統(tǒng),如果它不按我們的意愿行事,或者它的目標(biāo)與我們的沖突,就會(huì)變得非常糟糕。因此,對(duì)齊問題是:我們?nèi)绾谓⒆鲎罘先祟惱媸虑榈?AGI(Artificial General Intelligence 通用人工智能)?如何確保人類能夠決定人類的未來?我們?nèi)绾伪苊庖馔夂凸室庹`用,前者是沒有預(yù)料到的錯(cuò)誤,后者是一個(gè)壞人使用 AGI 造成巨大傷害;內(nèi)在而言的對(duì)齊問題是,如果這個(gè)東西變成一個(gè)生物,視我們?yōu)橥{怎么辦?我們對(duì)如何在小范圍內(nèi)解決對(duì)齊問題有一些想法,已經(jīng)能夠使 OpenAI 最大的模型(表現(xiàn)得)比想象的要好。我們對(duì)下一步做什么有些想法,但不能誠實(shí)地看著任何人的眼睛說,看到了 100 年后將如何解決這個(gè)問題。但是,一旦人工智能足夠好,我們可以問它,「嘿,你能幫助我們做對(duì)齊研究嗎?」這將是工具箱里的一個(gè)新工具。
Q:我們之前的一次談話是,能不能告訴 agent(注:AI 中的一個(gè)概念,通常指環(huán)境中的智能主體),「不要種族歧視」?A:當(dāng)然。一旦模型變得足夠聰明,真正理解了種族主義是什么樣子,以及它有多復(fù)雜,你就可以說,「不要成為種族主義者。」
Q:「AGI」這個(gè)術(shù)語已經(jīng)被廣泛使用。有時(shí)困惑來自于人們對(duì) AGI 有不同定義。你如何定義 AGI,怎樣知道我們什么時(shí)候?qū)崿F(xiàn)它?A:我理解的AGI相當(dāng)于一個(gè)可以共事的普通人,任何遠(yuǎn)程同事可以通過電腦幫你完成的工作,AGI也可以做,包括讓AGI學(xué)習(xí)醫(yī)療知識(shí)和寫代碼等等。AGI的重點(diǎn)不在于掌握某一種難得的技能,而是擁有學(xué)習(xí)的元能力,然后只要人類需要,它就可以往任何技能方向發(fā)展并精通。另一個(gè)概念是「超級(jí)智能」(Super Intelligence),它指的是比全人類加起來還要聰明的智能。Q:如何看待像 GPT-3 這樣的基礎(chǔ)技術(shù),對(duì)生命科學(xué)研究進(jìn)度的具體影響?生命科學(xué)研究中速率限制的因素是什么?我們無法超越這個(gè)限制,因?yàn)樽匀环▌t就是這樣?A:我目前的可用模型還不夠好,不足以對(duì)生命科學(xué)領(lǐng)域產(chǎn)生重大影響——不少生命科學(xué)家了解這些模型之后都說,它們只能在部分情況下發(fā)揮些許作用。