數(shù)字金融
網(wǎng)絡(luò)營(yíng)銷推廣
電商服務(wù)
來(lái)源:中國(guó)新聞周刊
2023年,AI大模型無(wú)疑是國(guó)內(nèi)外科技領(lǐng)域最受關(guān)注的話題之一。ChatGPT大火,人們似乎看到通用人工智能的曙光。科技巨頭、創(chuàng)業(yè)者乃至各個(gè)行業(yè)紛紛推出自研大模型。據(jù)北京市科委等統(tǒng)計(jì),截至2023年10月,國(guó)內(nèi)大模型廠商及高校院所共計(jì)254家,上演“百模大戰(zhàn)”。
大模型熱潮中,小冰公司CEO李笛是一個(gè)特別的存在。小冰公司的前身是微軟(亞洲)互聯(lián)網(wǎng)工程院人工智能小冰團(tuán)隊(duì),公司曾發(fā)布過(guò)AI聊天機(jī)器人“小冰”。因此,當(dāng)ChatGPT爆火時(shí),小冰很容易被當(dāng)作對(duì)比的對(duì)象。去年,在接受《中國(guó)新聞周刊》在內(nèi)的媒體采訪時(shí),李笛都提到,他承認(rèn)大模型的進(jìn)步,但并非大模型的“門(mén)徒”。他認(rèn)為模型不用一味求大,更愿意談技術(shù)如何商業(yè)化應(yīng)用。
當(dāng)時(shí),李笛被看作是個(gè)“異類”。用他的話講,大模型最熱的時(shí)候,行業(yè)里不用“信仰”這個(gè)詞就落伍了。到了2024年,經(jīng)歷了卷百億甚至千億參數(shù)的軍備競(jìng)賽后,國(guó)內(nèi)大模型廠商逐漸務(wù)實(shí),落地應(yīng)用成為2024年行業(yè)關(guān)注的焦點(diǎn)。
日前,《中國(guó)新聞周刊》專訪小冰公司CEO李笛,他談起過(guò)去一年對(duì)大模型熱的感悟。現(xiàn)在的他語(yǔ)氣輕松,李笛坦言,2023年,他曾面臨極大壓力,甚至曾動(dòng)搖不卷大模型的想法。
創(chuàng)新和保守天然對(duì)立,科技行業(yè)的人非常害怕被認(rèn)為是保守的。但另一面,李笛從2013年加入小冰團(tuán)隊(duì),見(jiàn)證了人工智能領(lǐng)域發(fā)展的幾次浪潮,很多公司在風(fēng)口中迷失。和李笛的專訪,并不只是在探討大模型,而是一個(gè)人面對(duì)巨大誘惑和時(shí)代焦慮時(shí),如何堅(jiān)持自己,做一個(gè)長(zhǎng)期主義者。
以下是李笛的自述。
“你不用‘信仰’這個(gè)詞就落伍了”
我們是國(guó)內(nèi)較早接觸GPT大模型的一批人。2020年,小冰從微軟獨(dú)立出來(lái)前,我是微軟Bing搜索引擎亞洲區(qū)總經(jīng)理,微軟將ChatGPT放在搜索引擎中,推出New Bing,我們都較早地看過(guò)了。當(dāng)我們的興奮勁已經(jīng)過(guò)去時(shí),國(guó)內(nèi)才開(kāi)始興奮。
因此,我們也更早意識(shí)到,大模型有一些問(wèn)題。比如,目前從技術(shù)上判斷,要實(shí)現(xiàn)人工智能能力更大程度的飛躍,需要在GPT-4的基礎(chǔ)上,把參數(shù)規(guī)模再提升三個(gè)數(shù)量級(jí),但人們?cè)诙唐趦?nèi)無(wú)法解決算力的挑戰(zhàn)。此外,一味追求參數(shù)規(guī)模越來(lái)越大,并不會(huì)有新能力涌現(xiàn)。最近,行業(yè)里也有一些公司開(kāi)始推出小模型。去年2月,我還判斷過(guò),如何商業(yè)落地是大模型的核心問(wèn)題。過(guò)了近一年,業(yè)內(nèi)越來(lái)越多開(kāi)始討論大模型該如何應(yīng)用。
去年,我觀察到,國(guó)內(nèi)很多企業(yè)開(kāi)始圍繞大模型進(jìn)行軍備競(jìng)賽,背后主要有三種考量。第一種是,GPT-4推出后,大模型沒(méi)有新能力的涌現(xiàn),像是卡在了紅綠燈路口,但很多人還要沖刺,因?yàn)樗麄兿胭€當(dāng)自己沖到紅綠燈路口時(shí),紅燈變綠,自己取得突破,領(lǐng)先行業(yè)。這一判斷確實(shí)存在一定概率,但大部分情況下,技術(shù)創(chuàng)新迭代并非一飛沖天,而是發(fā)展一波后被卡住,一段時(shí)間后再迎來(lái)一波創(chuàng)新。這才是科技史的常態(tài)。
其次,國(guó)內(nèi)現(xiàn)在有200多家大模型公司,其中很多并非傳統(tǒng)意義的人工智能公司,而是各個(gè)垂直領(lǐng)域的企業(yè),比如能源企業(yè)等。他們相信在掌握大模型技術(shù)后,能有機(jī)會(huì)打破該領(lǐng)域原有的競(jìng)爭(zhēng)格局。這是因?yàn)榇竽P偷幕咎卣魇谴罅Τ銎孥E,準(zhǔn)入門(mén)檻低,可以很快看到一個(gè)結(jié)果,給了不同行業(yè)的人一個(gè)幻想。但深入后人們會(huì)發(fā)現(xiàn),結(jié)果不如想象中那么美好。
最后一種是,他們只是把大模型當(dāng)作一個(gè)概念,來(lái)獲得一個(gè)新的賣(mài)點(diǎn),就像是當(dāng)年的元宇宙。
我們觀察到了這些現(xiàn)象,所以,我不愿意說(shuō)“信仰大模型”,大模型只是我們眾多技術(shù)迭代的一部分。去年年初,你說(shuō)大模型的技術(shù)好,還是比較客觀的,但后來(lái)逐漸演變成,如果你不用“信仰”這個(gè)詞就落伍了。我記得當(dāng)時(shí)參加行業(yè)會(huì)議,在我前后演講的人講到大模型,都會(huì)提到“工業(yè)革命”。當(dāng)一個(gè)行業(yè)只有用這么夸張的表達(dá)才能證明不保守時(shí),就一定是個(gè)非常大的泡沫。我不想神化大模型,它是個(gè)有用的工具,解決了很多過(guò)去的問(wèn)題,但它不是靈丹妙藥。
我現(xiàn)在說(shuō)的時(shí)候放松多了,因?yàn)樾袠I(yè)現(xiàn)在開(kāi)始有了這樣的共識(shí)。在人工智能領(lǐng)域,一直沒(méi)有產(chǎn)生真正成功的面向企業(yè)和消費(fèi)者的產(chǎn)品。2020年前,小冰還在微軟時(shí),不太受外界影響。但2020年,小冰從微軟分拆為獨(dú)立公司運(yùn)營(yíng),作為創(chuàng)業(yè)公司,我們還沒(méi)有能力決定自己的生存時(shí),如果跟行業(yè)主流有很大不同,會(huì)有很多人不認(rèn)同你。去年2月,就有投資人問(wèn)我,你是不是反對(duì)大模型?有投資人甚至跟我說(shuō),小冰也要做超大規(guī)模的、超大參數(shù)的大模型,我也差點(diǎn)沒(méi)扛住。
外界對(duì)我們的誤解是,我們不做大模型。我們很早就在關(guān)注,而且一直深入其中。但我們不拼大參數(shù),更關(guān)注的是中等參數(shù)規(guī)模和小參數(shù)規(guī)模大模型的可用性。很早Google就發(fā)過(guò)論文稱,650億參數(shù)以下的模型,沒(méi)有產(chǎn)生明顯的思維鏈能力。我們當(dāng)時(shí)不這么認(rèn)為,現(xiàn)在回頭看,我們賭對(duì)了,參數(shù)在幾百億,甚至幾十億的大模型,也有這個(gè)能力。
今年1月,我們剛剛宣布獲得“小冰大模型”的國(guó)內(nèi)備案,并發(fā)布Rinna大模型等多款產(chǎn)品。早在去年,我們的日本團(tuán)隊(duì)推出Rinna大模型。小冰大模型最大尺寸是 14B,即140億參數(shù),最小的是3.6B的模型。3.6B的模型在國(guó)外專業(yè)榜單中下載量和質(zhì)量評(píng)分都高于參數(shù)650億的Meta大模型,就是因?yàn)槲覀冊(cè)陬A(yù)訓(xùn)練數(shù)據(jù)上下了功夫。
“被看作‘AI舊世代’,也是一種榮幸”
和其他行業(yè)相比,科技行業(yè)有一個(gè)突出現(xiàn)象:科技行業(yè)的人非常害怕被認(rèn)為是保守的。在公開(kāi)場(chǎng)合,當(dāng)我們對(duì)一個(gè)新技術(shù)、特別是像大模型這么亮眼的新技術(shù)發(fā)表評(píng)論時(shí),哪怕只是客觀評(píng)價(jià)說(shuō)“大模型是好的,但它不是全部,它沒(méi)有把過(guò)去很多東西顛覆掉”,就已經(jīng)算是保守了。
我們?cè)?013年組建小冰團(tuán)隊(duì),十年中,我們送走一波又一波風(fēng)口追逐者,比如之前做智能語(yǔ)音助手、智能音箱等各種人工智能產(chǎn)品的創(chuàng)業(yè)者。從玩家角度,這一次國(guó)內(nèi)大模型的熱潮,活躍的多是近兩年成立人工智能企業(yè),因?yàn)楹芏喙径荚谶^(guò)去一波波風(fēng)口中迷失了。面對(duì)這種短期的熱潮,我們看似保守,但我們是目前為止存活越長(zhǎng)的人工智能企業(yè)之一。從這一角度來(lái)看,我們被一些聲音質(zhì)疑為“AI舊世代”,也是一種“榮幸”。但另一面,我們也承受了不少壓力。
我們?cè)谖④洉r(shí),還算是在象牙塔,獨(dú)立出來(lái)后才發(fā)現(xiàn),在科技行業(yè)想要堅(jiān)持做一件事情,是非常奢侈的。因?yàn)橹袊?guó)的科技公司,本質(zhì)上是由一級(jí)市場(chǎng)、二級(jí)市場(chǎng)“擊鼓傳花”來(lái)完成企業(yè)的基本輸血。很多公司及其投資人會(huì)把上市定義為最主要的目標(biāo)。如果公司不追風(fēng)口,就不能拿到下一筆融資,上一筆融資的投資人就沒(méi)辦法獲得更高的企業(yè)估值,也就沒(méi)有辦法跟LP(有限合伙人)交代。這也是人之常情,但這使得很多創(chuàng)業(yè)公司的戰(zhàn)略不得不走樣了。
前段時(shí)間,有消息稱,一個(gè)剛畢業(yè)的自然語(yǔ)言處理專業(yè)的博士生,年薪就有300萬(wàn)元,這是不合理的,也會(huì)影響博士生的自我職業(yè)認(rèn)知。創(chuàng)業(yè)公司愿意給出這么高的薪酬,并不是因?yàn)樗麄兘o公司創(chuàng)造了價(jià)值,而是當(dāng)公司去拉投資時(shí),用以回復(fù)投資人關(guān)注的指標(biāo),比如公司有多少博士,或者有多少?gòu)腛pen AI出來(lái)的人。有些博士生在創(chuàng)業(yè)公司待了三個(gè)月,又被另一家公司以更高的薪酬挖走。博士生肯定是開(kāi)心的,但他們?cè)趧?chuàng)業(yè)公司間不斷流轉(zhuǎn)時(shí),除了薪酬提升,沒(méi)有機(jī)會(huì)真正做有意義的研究。
你很難說(shuō)這是投資人的問(wèn)題,因?yàn)橥顿Y人要對(duì)LP負(fù)責(zé)。也很難說(shuō)是LP的問(wèn)題,因?yàn)樗麄兲湾X(qián)就是為了獲得回報(bào)。這似乎是一個(gè)沒(méi)有人錯(cuò)的事情,也是中國(guó)科技領(lǐng)域很難誕生原始創(chuàng)新的原因之一。
我們?nèi)ツ暌苍媾R很大的壓力。投資界在經(jīng)歷2022年巨大的失落情緒后迎來(lái)人工智能的浪潮,投資人看到了春天。去年在人工智能行業(yè)里,固然有對(duì)大模型抱有熱情的人,他們往往是科研工作者。除此之外,更多科技公司表現(xiàn)出的是一種焦慮。就像應(yīng)試教育下的心態(tài),不能輸在起跑線上,盡管不知道它是什么,但總覺(jué)得錯(cuò)過(guò)一定會(huì)后悔。這種焦慮在行業(yè)內(nèi)傳遞,但創(chuàng)新很難在焦慮中產(chǎn)生。
我個(gè)人也特別希望出現(xiàn)一個(gè)大模型,和小冰的對(duì)話框連接后,所有對(duì)話的問(wèn)題都能解決,這是我做夢(mèng)都會(huì)笑醒的事情。但這很難實(shí)現(xiàn),背后還需要很多服務(wù)。這就像是一個(gè)個(gè)人電腦,不是說(shuō)有一個(gè)CPU就得到了一切,還要有主板,CPU本身也是一個(gè)超級(jí)大規(guī)模的集成電路,需要各種模塊組合。
人工智能領(lǐng)域從來(lái)不缺很酷的東西。當(dāng)年,微軟利用人臉識(shí)別技術(shù)做了個(gè)應(yīng)用叫“How Old”,上傳一張照片,就能識(shí)別年齡,一時(shí)間風(fēng)靡。前一陣,機(jī)器人跳“科目三”也很酷。但真正缺的、值得我們重視的是商業(yè)模式的探索,這意味著并不只是賺錢(qián),而是究竟如何讓人們真正認(rèn)同人工智能的價(jià)值,并為之買(mǎi)單。
我有一個(gè)印象深刻的體會(huì),產(chǎn)品價(jià)值和技術(shù)不一定是息息相關(guān)的。比如有的機(jī)器人會(huì)跳舞,但人們玩膩了,就會(huì)把它忘掉。但你發(fā)現(xiàn),很多女生從小買(mǎi)的布娃娃,毫無(wú)科技含量,但她們對(duì)它傾注了巨大的情感,有人甚至在長(zhǎng)大后會(huì)花1萬(wàn)塊錢(qián)去修復(fù)兒時(shí)的“伙伴”。技術(shù)在其中不一定需要扮演什么角色。
今天,大家用大模型進(jìn)行很多輪對(duì)話。很多人都認(rèn)為,大模型要更智能、更聰明,像愛(ài)因斯坦一樣。但生活中,我們不總是因?yàn)橐粋€(gè)人足夠聰明,才會(huì)和對(duì)方交朋友。有的人可能笨笨的,但很善良,你就不把對(duì)方當(dāng)朋友嗎?人不是這樣的。那為什么我們?cè)谧隹萍籍a(chǎn)品時(shí),就一定認(rèn)為更先進(jìn)的技術(shù)會(huì)更好?不一定,關(guān)鍵是如何把它用在更合適的地方。
前段時(shí)間,我在朋友圈看到,因?yàn)槲④浬暇€了免費(fèi)的大模型 Copilot移動(dòng)版,很多人就說(shuō)終于可以退訂ChatGPT Plus了,不用支付每個(gè)月20美元的會(huì)員費(fèi)。這其中還有一個(gè)很有錢(qián)的人,他都認(rèn)為20美元太貴。但你要想,有的學(xué)生在游戲里買(mǎi)“皮膚”都會(huì)花好幾百元。人不總是按照理性來(lái)衡量一些事情的。
2024年,我預(yù)測(cè)人工智能行業(yè)發(fā)展會(huì)退熱,現(xiàn)在的大模型同質(zhì)化嚴(yán)重,大家參數(shù)規(guī)模差不多,市面上用不了這么多大模型。而且用戶的付費(fèi)意愿又不是很容易建立。一些去年融到錢(qián)的企業(yè)也可能會(huì)引發(fā)新的內(nèi)卷,其實(shí)這些內(nèi)卷的行為已經(jīng)在發(fā)生了,只是在 2024 年可能會(huì)更明顯一些。
記者:楊智杰(yangzhijie@chinanews.com.cn)
編輯:杜瑋
運(yùn)營(yíng)編輯:馬曉軼
特別聲明:以上內(nèi)容僅代表作者本人的觀點(diǎn)或立場(chǎng),不代表新浪財(cái)經(jīng)頭條的觀點(diǎn)或立場(chǎng)。如因作品內(nèi)容、版權(quán)或其他問(wèn)題需要與新浪財(cái)經(jīng)頭條聯(lián)系的,請(qǐng)于上述內(nèi)容發(fā)布后的30天內(nèi)進(jìn)行。