見發生·知(zhī)未見
業界觀點

知(zhī)名計(jì)算(suàn)機專家吳軍:ChatGPT不算(suàn)新技術革命,帶不來(lái)什(shén)麽新機會(huì)

業界觀點

導讀

4月3日晚上(shàng),計(jì)算(suàn)機科學家、自(zì)然語言模型專家吳軍,就人工(gōng)智能(néng)和(hé)ChatGPT等當下(xià)熱議(yì)的話(huà)題作(zuò)了(le)一次直播分享。

吳軍,畢業于清華大(dà)學和(hé)約翰霍普金(jīn)斯大(dà)學,計(jì)算(suàn)機專業博士,前Google高(gāo)級資深研究員、原騰訊副總裁、矽谷風(fēng)險投資人。

爲何ChatGPT沒有出現(xiàn)在中國?吳軍表示,其“硬件成本就要差不多10億美(měi)元”,一般的科研機構做不成,更不用(yòng)說研究水(shuǐ)平的問題。

吳 軍 | 演講

ChatGPT的出現(xiàn),爲什(shén)麽會(huì)引起恐慌?

我知(zhī)道(dào),最近ChatGPT這(zhè)事(shì)兒在中國很(hěn)火,很(hěn)多人在讨論,但(dàn)很(hěn)有意思的是,其實這(zhè)件事(shì)在美(měi)國,已經沒有太多人去談論這(zhè)個話(huà)題了(le)。其實不光是ChatGPT,往前看(kàn)十年,當時(shí)很(hěn)多新技術出現(xiàn)的時(shí)候,我就發現(xiàn)在中國媒體上(shàng)讨論的熱度要遠遠高(gāo)于美(měi)國。雖然那個技術其實主要出現(xiàn)在美(měi)國,但(dàn)是中國人老(lǎo)百姓對(duì)此更關心。我認爲這(zhè)是一件好(hǎo)事(shì),但(dàn)也(yě)是一件壞事(shì)。

這(zhè)個“壞”在于,這(zhè)些(xiē)技術實際上(shàng)是被過度的炒作(zuò)了(le),在這(zhè)個過程中,有很(hěn)多渾水(shuǐ)摸魚的人從(cóng)中賺錢(qián)。就比如說區(qū)塊鏈,當時(shí)炒得那麽熱,但(dàn)如今這(zhè)個事(shì)已經很(hěn)少有人讨論了(le),對(duì)吧?這(zhè)是第一個。第二個就是元宇宙,目前美(měi)國隻有 Facebook一家還在堅持做。那到(dào)了(le)中國,很(hěn)多人就在讨論說,我們是不是将來(lái)會(huì)生活在一個完全虛拟的世界。最後,大(dà)概去年底到(dào)今年初,Facebook在這(zhè)個領域幾百億美(měi)元投下(xià)去,一個響也(yě)沒聽着,最後開(kāi)始了(le)大(dà)規模的裁員。到(dào)了(le)現(xiàn)在,被熱炒的一個話(huà)題就是ChatGPT,有的人興奮,有的人恐懼,還有我現(xiàn)在也(yě)看(kàn)到(dào)在中國還有很(hěn)多人在渾水(shuǐ)摸魚,試圖再割大(dà)家一次韭菜。

在講ChatGPT是什(shén)麽以前,我先給大(dà)家講一個曆史故事(shì),這(zhè)曆史故事(shì)你(nǐ)聽起來(lái)你(nǐ)就會(huì)發笑(xiào),但(dàn)是你(nǐ)回頭看(kàn),今天很(hěn)多人的表現(xiàn)也(yě)是如此。

1503年,哥(gē)倫布的兒子記下(xià)來(lái)的這(zhè)麽一件事(shì)兒,哥(gē)倫布往西航行,去往新大(dà)陸,結果航行到(dào)中途,到(dào)了(le)牙買加這(zhè)個地方,船(chuán)上(shàng)就沒吃的了(le)。于是,哥(gē)倫布和(hé)船(chuán)員隻能(néng)寄希望于當地人來(lái)提供飲食。但(dàn)是,提供了(le)幾天以後,船(chuán)員就跟當地人發生了(le)矛盾——有些(xiē)船(chuán)員偷了(le)當地人的東西,所以當地人就斷了(le)飲食的供應。

爲了(le)擺脫這(zhè)個困境,哥(gē)倫布想到(dào)了(le)一個妙招。哥(gē)倫布當時(shí)随身帶着一本萬年曆,在日曆上(shàng)标着說某年月日會(huì)出現(xiàn)日食、月食等等所有這(zhè)些(xiē)信息。哥(gē)倫布當時(shí)就把當地的部落首領找來(lái),說你(nǐ)們不給我提供食物,已經得罪了(le)上(shàng)帝,上(shàng)帝會(huì)發怒,月亮(liàng)就會(huì)變紅(hóng),然後上(shàng)帝就會(huì)把月亮(liàng)收走。

當然,我們現(xiàn)在基本上(shàng)都知(zhī)道(dào),在月全食發生的時(shí)候,也(yě)就是地球還沒有完全擋住月亮(liàng)的時(shí)候,月亮(liàng)确實是紅(hóng)的,就是我們所謂的“血月”。但(dàn)是,當時(shí)的牙買加人并不知(zhī)道(dào)。結果,到(dào)了(le)晚上(shàng),牙買加人就發現(xiàn),月亮(liàng)果然變紅(hóng)了(le),然後慢慢地就一點點消失了(le)。當地人就陷入了(le)恐慌,大(dà)家紛紛說,上(shàng)帝要懲罰他(tā)們了(le)。

這(zhè)個部落首領慌忙去求哥(gē)倫布,承諾答(dá)應哥(gē)倫布的所有條件。哥(gē)倫布就說,好(hǎo),我去帳篷裏向上(shàng)帝禱告,讓他(tā)不懲罰你(nǐ)們,但(dàn)是我需要一點時(shí)間,然後哥(gē)倫布就走進了(le)帳篷。其實,進了(le)帳篷之後,哥(gē)倫布就是拿着一個沙漏,在看(kàn)那個計(jì)時(shí)。

今天咱們有天文(wén)學知(zhī)識,肯定知(zhī)道(dào)月全食的時(shí)間,也(yě)就會(huì)維持大(dà)概48分鐘(zhōng),到(dào)時(shí)候月亮(liàng)就會(huì)重新出現(xiàn)。但(dàn)是,這(zhè)些(xiē)牙買加人不知(zhī)道(dào)。他(tā)們看(kàn)到(dào)的就是,哥(gē)倫布從(cóng)帳篷裏出來(lái),月亮(liàng)也(yě)就出來(lái)了(le)。然後哥(gē)倫布說,這(zhè)是上(shàng)帝已經聽了(le)我的勸解,答(dá)應寬恕你(nǐ)們,但(dàn)是你(nǐ)們必須要給我們好(hǎo)好(hǎo)地提供食物。所以,當地人千恩萬謝(xiè),給他(tā)們不斷提供食物。

這(zhè)個故事(shì)說明(míng)什(shén)麽呢(ne)?月全食這(zhè)件事(shì),它的發生背後自(zì)有其原因,但(dàn)是在人們不知(zhī)道(dào)這(zhè)個原因的時(shí)候,往往隻能(néng)把這(zhè)個自(zì)然現(xiàn)象歸結爲一個神的作(zuò)用(yòng)。而這(zhè)個神,本身又是人創造出來(lái)的。也(yě)就是說,人自(zì)己創造一個神以後,然後趴在神的腳下(xià),成爲了(le)他(tā)的奴仆。

這(zhè)就是我爲什(shén)麽要給大(dà)家開(kāi)《世界文(wén)明(míng)史》的課程。

其實這(zhè)個文(wén)明(míng)的發展過程,就是人類不斷認識自(zì)然規律的過程。我們一點點的進步,爲的就是讓現(xiàn)在的我們不再像當地的土著人那樣,盲目地相信一個人向上(shàng)帝禱告真的可以阻止月亮(liàng)消失。我們現(xiàn)在知(zhī)道(dào),在日食月食的背後,實際上(shàng)是開(kāi)普勒行星的三定律在起作(zuò)用(yòng),然後在開(kāi)普勒行星三定律背後是牛頓的萬有引力定律。人類搞清楚這(zhè)個原因以後,對(duì)自(zì)然就不再僅僅是畏懼了(le),我們可以利用(yòng)自(zì)然規律做很(hěn)多很(hěn)多事(shì)情。

ChatGPT的技術基礎是什(shén)麽?

從(cóng)曆史回到(dào)現(xiàn)在,其實ChatGPT的情況也(yě)差不多,背後是一個叫做語言模型的一個數學模型在發揮作(zuò)用(yòng)。換句話(huà)說,ChatGPT的背後是一個數學模型。在今天,這(zhè)項技術顯得很(hěn)強大(dà)的原因主要是三個:

第一,它用(yòng)到(dào)的計(jì)算(suàn)量很(hěn)大(dà);

第二,它的數據量很(hěn)大(dà);

第三,今天訓練語言模型的方法比以前要好(hǎo)很(hěn)多。

那麽,語言模型是什(shén)麽呢(ne)?或者說它是一個什(shén)麽時(shí)代的産物?

它是1972 年,由我的導師賈裏尼克(Fred Jelinek)帶領團隊研發的一項技術。具體地講,是他(tā)當時(shí)在IBM帶着人來(lái)完成的一項技術,是用(yòng)來(lái)衡量一句話(huà)或者一個語言現(xiàn)象有多麽的可能(néng)産生。那它有什(shén)麽用(yòng)?它最初的用(yòng)處是做的語音(yīn)識别,後來(lái)是做機器翻譯,再後來(lái)是做計(jì)算(suàn)機問答(dá),也(yě)就是我們今天熟悉的回答(dá)問題。

當時(shí)它就可以做摘要,比如舉一個例子,有一篇一萬字的文(wén)章,那麽你(nǐ)怎麽摘要出十句話(huà)能(néng)概括這(zhè)一篇文(wén)章的内容,這(zhè)對(duì)于做這(zhè)個自(zì)然語言處理(lǐ)的人來(lái)講,就是一個數學問題。也(yě)就是說,你(nǐ)的條件是什(shén)麽?條件是這(zhè)一萬個字,然後你(nǐ)想得到(dào)的結果是什(shén)麽?結果可能(néng)就是十句話(huà),一百個字。然後這(zhè)裏頭有很(hěn)多種組合,你(nǐ)可以随便挑幾個句子,也(yě)可以把有的句子拆成兩段,把後面那些(xiē)不太重要的修飾或者形容的部分去掉。然後,你(nǐ)也(yě)可以把兩個句子合成一個句子,那麽你(nǐ)在合成一段文(wén)本的時(shí)候,這(zhè)個計(jì)算(suàn)機就會(huì)計(jì)算(suàn)一個概率,哪些(xiē)句子合成在一起的概率比較大(dà),它會(huì)按照概率幫你(nǐ)合成。

而我們今天看(kàn)到(dào)的ChatGPT,就是這(zhè)個大(dà)的語言模型,它就是會(huì)挑一個概率最大(dà)的、最有可能(néng)發生的這(zhè)樣一個文(wén)本來(lái)給你(nǐ)看(kàn)。所以總體來(lái)講,ChatGPT生成結果的過程,是一個用(yòng)大(dà)量的計(jì)算(suàn)資源來(lái)計(jì)算(suàn)的過程。它需要非常龐大(dà)的數據量來(lái)支撐,有很(hěn)多很(hěn)多的GPU(電腦(nǎo)處理(lǐ)器)。沒有這(zhè)些(xiē)東西的話(huà),ChatGPT是做不起來(lái)的。

而且今天這(zhè)個ChatGPT,其實不光是技術,還有很(hěn)多人工(gōng)在背後。他(tā)們還雇了(le)一家公司,專門(mén)負責審核ChatGPT産生的結果。比如說,ChatGPT産生了(le)一百篇摘要,都挺好(hǎo),我已經分辨不出來(lái)了(le),那麽這(zhè)些(xiē)人就負責幫我分辨一下(xià),到(dào)底哪一篇更像是準确的摘要。

那實際上(shàng),你(nǐ)可以看(kàn)到(dào),ChatGPT背後就是一個語言模型,而這(zhè)一語言模型的技術是1972年就已經有了(le)的。到(dào)現(xiàn)在,經過了(le)五十年,現(xiàn)在行業内其實大(dà)家并不覺得它是一個什(shén)麽了(le)不得的東西。在此以前,這(zhè)個語言模型其實已經做了(le)很(hěn)多的事(shì)情。

提到(dào)“語言模型”(language model)這(zhè)個詞,最初是由我的導師賈裏尼克提出來(lái)的。他(tā)大(dà)概在1993年的時(shí)候到(dào)了(le)約翰霍普金(jīn)斯大(dà)學,我是1996年到(dào)這(zhè)個大(dà)學,然後成爲他(tā)學生。那麽這(zhè)個詞的中文(wén),也(yě)就是你(nǐ)看(kàn)到(dào)的“語言模型”這(zhè)四個字,則是我在20世紀90年代的時(shí)候發表論文(wén)時(shí)候創造出來(lái)的。那時(shí),隻有我們這(zhè)些(xiē)圈内的人知(zhī)道(dào)它能(néng)做很(hěn)多事(shì),但(dàn)是你(nǐ)不會(huì)想到(dào)說,哎,這(zhè)個事(shì)後來(lái)會(huì)被熱炒。

你(nǐ)可以這(zhè)樣理(lǐ)解,“語言模型”之于ChatGPT,就相當于開(kāi)普勒的這(zhè)個行星三定律之于月食。

“語言模型”誕生之初是什(shén)麽情況?

那麽在發明(míng)的當時(shí),語言模型是一個什(shén)麽情況?

其實,在20世紀90年代的時(shí)候,用(yòng)簡單統計(jì)方法得到(dào)的模型很(hěn)不準确。這(zhè)就相當于,我打個比方,你(nǐ)觀察行星,但(dàn)用(yòng)的是托勒密的地心說來(lái)預測,是很(hěn)不準确的。所以,那時(shí)候我們開(kāi)始引入了(le)語法、主題、語義的很(hěn)多信息。然後,這(zhè)個語言模型就變得很(hěn)複雜(zá)了(le)。複雜(zá)之後就又帶來(lái)了(le)一個很(hěn)大(dà)的問題。

什(shén)麽問題?

比如,我當時(shí)做過一個很(hěn)複雜(zá)的語言模型,這(zhè)個語言模型當時(shí)有多少參數?600萬個參數,就是說,這(zhè)個語言模型大(dà)小(xiǎo)基本上(shàng)按這(zhè)個參數來(lái)定。我那時(shí)候做的已經是那個時(shí)代能(néng)做的最大(dà)、最複雜(zá)的語言模型了(le)。我當時(shí)用(yòng)的還不是PC機,而是20台超級服務器,然後大(dà)概算(suàn)了(le)三個月才訓練出這(zhè)樣一個語言模型。所以你(nǐ)看(kàn),它的計(jì)算(suàn)量是非常大(dà)的。那麽,第一版ChatGPT,它用(yòng)的語言模型參數是多少呢(ne)?大(dà)概是 2000 億個參數,大(dà)家可以看(kàn)到(dào)這(zhè)些(xiē)年的變化。

所以,今天很(hěn)多人問,ChatGPT在美(měi)國出現(xiàn)了(le),中國研究機構什(shén)麽時(shí)候能(néng)做ChatGPT?其實,中國的大(dà)部分研究機構是做不了(le)的,不是說研究水(shuǐ)平的問題,而是因爲ChatGPT太耗資源。今天的ChatGPT,可能(néng)光硬件的成本就要差不多10億美(měi)元,這(zhè)還沒算(suàn)電錢(qián),所以成本和(hé)耗資是非常巨大(dà)的。所以,如果開(kāi)完玩(wán)笑(xiào),問ChatGPT的最大(dà)貢獻是什(shén)麽,我倒覺得它對(duì)全球變暖是有很(hěn)大(dà)貢獻的。

所以,我想說的是,ChatGPT這(zhè)件事(shì),它的原理(lǐ)很(hěn)簡單,但(dàn)是在工(gōng)程上(shàng)要想做到(dào),其實是蠻困難的一件事(shì)。

計(jì)算(suàn)機擅長回答(dá)什(shén)麽問題?

到(dào)了(le)大(dà)概2010年前後,也(yě)就是13年前,語言模型能(néng)做到(dào)什(shén)麽程度?我給大(dà)家看(kàn)兩個例子。這(zhè)兩個例子都是我在2014年離開(kāi)Google以前做的。當時(shí)我負責的是Google的自(zì)動問答(dá)系統,就是讓計(jì)算(suàn)機回答(dá)問題。不過因爲這(zhè)個産品是英文(wén)的,所以在中文(wén)世界基本上(shàng)沒有太露臉。

我給你(nǐ)看(kàn)一下(xià)谷歌回答(dá)的一個問題——爲什(shén)麽天是藍色的,why is the sky blue?

它的回答(dá)是這(zhè)樣的:太陽光透過大(dà)氣層到(dào)達地球時(shí)會(huì)發生折射,空(kōng)氣中的氣體會(huì)讓不同顔色的光散射到(dào)各個地方,藍光波長短,比其他(tā)顔色折射率高(gāo),所以看(kàn)上(shàng)去天是藍色的。

這(zhè)是當時(shí)計(jì)算(suàn)機産生的一個答(dá)案。公平地講,這(zhè)個答(dá)案比我自(zì)己寫一段答(dá)案寫得要更好(hǎo),因爲要解釋這(zhè)現(xiàn)象,你(nǐ)要知(zhī)道(dào)不少物理(lǐ)學知(zhī)識,而且這(zhè)個句子看(kàn)上(shàng)去也(yě)挺合情合理(lǐ)的。而今天人們使用(yòng)ChatGPT的一個目的,就是讓他(tā)回答(dá)問題。

這(zhè)裏面,我給大(dà)家做個拆分。

其實,我們問計(jì)算(suàn)機的問題可以分爲兩類,第一類叫做簡單問題,第二類叫做複雜(zá)問題。簡單問題就是關于事(shì)實的問題,比如某某明(míng)星是哪兒人,哪一年生的。這(zhè)都是一些(xiē)容易的問題,因爲它是事(shì)實,有明(míng)确答(dá)案。

第二類是複雜(zá)問題,這(zhè)也(yě)是大(dà)家覺得 ChatGPT 非常驚豔的地方。它能(néng)整合信息,回答(dá)天爲什(shén)麽是藍色的,好(hǎo)像它自(zì)己有邏輯一樣。再有一個,就是問過程的問題,比如說我怎麽烤蛋糕,你(nǐ)能(néng)不把一步步寫下(xià)來(lái)?今天我們問ChatGPT怎麽烤蛋糕,它可以把這(zhè)個過程給你(nǐ)寫得很(hěn)詳細,多少杯水(shuǐ),加多少個雞蛋,加多少面粉等等,它都可以告訴你(nǐ)。然後你(nǐ)根據它提供的答(dá)案,就真能(néng)烤出蛋糕,而且烤得可能(néng)還挺不錯。

這(zhè)是大(dà)家覺得很(hěn)了(le)不得的地方。但(dàn)是你(nǐ)要知(zhī)道(dào),這(zhè)件事(shì),在2014年其實計(jì)算(suàn)機已經做到(dào)了(le),而且做得很(hěn)好(hǎo)。所以,這(zhè)項技術本身并沒有太多神秘的地方。

計(jì)算(suàn)機和(hé)人,誰更擅長寫作(zuò)?

現(xiàn)在,大(dà)家熱議(yì)ChatGPT,還有一個原因就是覺得它能(néng)寫作(zuò)。比如說寫一個工(gōng)作(zuò)簡報(bào),這(zhè)是今天美(měi)國人用(yòng)ChatGPT用(yòng)得最多的地方。我這(zhè)周幹了(le)1234567,這(zhè)七件事(shì),哎,你(nǐ)看(kàn)我就不用(yòng)自(zì)己費勁地寫了(le),我讓ChatGPT生成一個,然後再編輯一下(xià)子就可以了(le)。

但(dàn)是,計(jì)算(suàn)機寫作(zuò)這(zhè)件事(shì),其實你(nǐ)說難也(yě)難,說容易也(yě)容易,我可以給你(nǐ)舉個例子。

在2014年我離開(kāi)Google之後,當時(shí)不太做編程了(le),不過那時(shí)候我還有一些(xiē)計(jì)算(suàn)資源,所以我自(zì)己在空(kōng)閑時(shí)間會(huì)寫一些(xiē)程序,做着玩(wán)。當時(shí)呢(ne),我就讓計(jì)算(suàn)機寫了(le)兩首詩,大(dà)家可以讀一下(xià)這(zhè)兩首詩。

第一首詩是個五言詩,這(zhè)是用(yòng)我的話(huà)說,叫做李白(bái)風(fēng)格的一首詩,大(dà)家可以讀一下(xià)。這(zhè)首詩就是計(jì)算(suàn)機自(zì)己寫的。實際上(shàng),你(nǐ)如果讀一讀,這(zhè)個詩裏還真有一些(xiē)李白(bái)的這(zhè)個特點。

那第二首詩,我也(yě)把圖片放(fàng)在下(xià)面了(le),你(nǐ)可以看(kàn)一下(xià)。

先說一下(xià),因爲古詩都有平仄一說,但(dàn)是我們現(xiàn)在的讀音(yīn)和(hé)當時(shí)的讀音(yīn)不一樣,所以我們也(yě)沒去管這(zhè)個平仄到(dào)底合不合古,但(dàn)是這(zhè)個我們單從(cóng)它的内容意境來(lái)講,你(nǐ)讀的會(huì)覺得很(hěn)順暢。

好(hǎo),那麽話(huà)說回來(lái)。第一首詩怎麽做的?

其實再簡單不過了(le),你(nǐ)就把李白(bái)的詩放(fàng)到(dào)計(jì)算(suàn)機裏。李白(bái)詩一共1000 多首,也(yě)就一萬來(lái)句話(huà),這(zhè)個對(duì)計(jì)算(suàn)機來(lái)講太簡單了(le)。它寫的時(shí)候,就是把句子分拆開(kāi)來(lái),拆成兩個字、三個字一組,比如“空(kōng)愁”這(zhè)是一組,“憶長安”這(zhè)三個字一組。然後它就去拼剛才我講的語言模型,算(suàn)概率,哪個概率最大(dà);拆完了(le)以後,我就跟他(tā)提一個要求,說要寫一首憶長安的詩,它就排列組合,生成出這(zhè)個《憶長安》,實際上(shàng)就是這(zhè)麽拼湊出來(lái)的。第二首詩稍微複雜(zá)一點。

但(dàn)你(nǐ)知(zhī)道(dào)這(zhè)兩個程序我寫了(le)多長時(shí)間?兩天。這(zhè)說明(míng)什(shén)麽呢(ne)?說明(míng)你(nǐ)讓計(jì)算(suàn)機寫出一些(xiē)還挺像樣的東西,其實不是一件很(hěn)困難的事(shì)情,它沒有你(nǐ)想得這(zhè)麽神秘,或者說計(jì)算(suàn)機寫作(zuò)本身沒有這(zhè)你(nǐ)想得這(zhè)麽神秘。

那爲什(shén)麽這(zhè)兩首詩看(kàn)起來(lái)特别好(hǎo)?因爲這(zhè)是唐詩,唐詩的格式是固定的。同樣的道(dào)理(lǐ),爲什(shén)麽用(yòng)ChatGPT寫周報(bào)寫得好(hǎo)?因爲周報(bào)的格式基本上(shàng)是拉清單,那也(yě)是個固定的格式。包括,如果你(nǐ)讀《華爾街日報(bào)》中文(wén)版,這(zhè)裏頭我跟你(nǐ)講,90%的内容都是計(jì)算(suàn)機寫的,隻是你(nǐ)不知(zhī)道(dào)。寫完了(le)以後人當然要給它一個主題,然後給它寫的第一段話(huà)寫個引子,然後給一個總結,起個标題,這(zhè)是人要做的。

爲什(shén)麽寫财經文(wén)章比較好(hǎo)?因爲它有好(hǎo)多的事(shì)實在裏頭,格式也(yě)是固定的,所以這(zhè)件事(shì)它做起來(lái)就很(hěn)好(hǎo)。

我花(huā)這(zhè)麽長時(shí)間來(lái)講ChatGPT的背景,實際上(shàng)就是想說它并不神秘,不是一個什(shén)麽很(hěn)高(gāo)深的機器在背後。一方面,ChatGPT依靠的是一個數學模型,而這(zhè)個數學模型1972年就有了(le),隻是今天它的計(jì)算(suàn)能(néng)力非常強,靠蠻力計(jì)算(suàn)。

那麽,ChatGPT訓練一次要耗多少電?大(dà)概可能(néng)是3000輛特斯拉的電動汽車,每輛跑到(dào)20萬英裏,把它跑死,這(zhè)麽大(dà)的耗電量,才夠訓練一次,這(zhè)個非常花(huā)錢(qián)的一件事(shì)。

ChatGPT對(duì)我們到(dào)底有什(shén)麽影響?

那麽接下(xià)來(lái)講講,ChatGPT對(duì)人有什(shén)麽影響。

這(zhè)就要回到(dào)曆史上(shàng)來(lái)看(kàn)了(le),每一次技術革命,其實它對(duì)人都會(huì)有一些(xiē)影響。不過,ChatGPT它不算(suàn)是一項新的技術革命,因爲這(zhè)我剛才講了(le),這(zhè)個過程很(hěn)長,從(cóng)20世紀70年代到(dào)90年代,我們做了(le)很(hěn)多事(shì),90 年代到(dào)現(xiàn)在又有很(hěn)多人做了(le)很(hěn)多事(shì)。這(zhè)裏頭最大(dà)進步其實不是這(zhè)個語言模型本身,實際上(shàng)是後來(lái)2000年左右産生的深度學習,使得訓練語言模型能(néng)比以前準确了(le),不是簡單的做統計(jì)。

今天訓練語言模型早已經不是簡單做統計(jì)了(le),這(zhè)才是ChatGPT能(néng)産生比較好(hǎo)的結果的一個原因。

至于說ChatGPT對(duì)人能(néng)産生什(shén)麽樣影響,這(zhè)個問題我先不直接回答(dá)你(nǐ),我先問你(nǐ),剛才給大(dà)家看(kàn)這(zhè)兩首唐詩,你(nǐ)有沒有發現(xiàn)一個什(shén)麽特點?對(duì)了(le),這(zhè)兩首詩寫得不錯,但(dàn)是你(nǐ)原來(lái)對(duì)唐朝了(le)解,不會(huì)因爲多了(le)這(zhè)兩首詩會(huì)有更新的了(le)解。因爲,ChatGPT它某種程度上(shàng)有點像鹦鹉學舌,你(nǐ)先要說一段話(huà),它才能(néng)跟着學。它說出來(lái)的聲音(yīn)可能(néng)很(hěn)好(hǎo)聽,但(dàn)是它并不提供更多的信息。

今天互聯網上(shàng)90%的内容都屬于這(zhè)一類——不提供更多的新信息,也(yě)不是原創内容,也(yě)不是自(zì)己的感悟,無非是東抄抄,西湊湊。目前,抖音(yīn)、快(kuài)手這(zhè)類短視(shì)頻,我覺得99%的内容都屬于這(zhè)一類,沒有營養,你(nǐ)讀完以後可能(néng)覺得挺有意思,但(dàn)實際上(shàng)你(nǐ)在上(shàng)面讀了(le)再多,其實對(duì)你(nǐ)沒有任何幫助。

如果說ChatGPT真的威脅到(dào)了(le)誰,我覺得威脅到(dào)的就是這(zhè)一類人的工(gōng)作(zuò),就是說這(zhè)個抖音(yīn)上(shàng)頭那個做短視(shì)頻的,或者發布一些(xiē)内容的,ChatGPT會(huì)做得比他(tā)們好(hǎo)很(hěn)多。你(nǐ)就想這(zhè)樣一件事(shì)兒,假設說,有一群人天天把那唐詩三百首裏頭的句子翻來(lái)覆去的捯饬,也(yě)能(néng)捯饬出一些(xiē)詩,那麽ChatGPT捯饬起來(lái)肯定比人快(kuài)得多,所以這(zhè)項技術會(huì)對(duì)這(zhè)一批人會(huì)有影響。

那麽,什(shén)麽人不會(huì)受到(dào)影響?就是内容創造的人不會(huì)受影響。

爲什(shén)麽我會(huì)這(zhè)麽講?還記得剛才我說的“爲什(shén)麽是天是藍色的”這(zhè)個問題嗎?Google爲什(shén)麽能(néng)回答(dá)這(zhè)個問題?

因爲在Google進行回答(dá)的時(shí)候,它大(dà)概把當時(shí)英語幾乎所有的像樣的句子都做了(le)分析,大(dà)概有1000 億句英語句子。那麽實際上(shàng)你(nǐ)會(huì)發現(xiàn),在一些(xiē)大(dà)學的網站(zhàn)上(shàng)和(hé)NASA的網站(zhàn)上(shàng),它就有這(zhè)個答(dá)案,隻是我們把它拼拼湊湊,删删減減,就把它挑出來(lái)了(le)。但(dàn)是最早的物理(lǐ)學家做這(zhè)項研究,把這(zhè)個道(dào)理(lǐ)搞清楚,這(zhè)個工(gōng)作(zuò)是有意義的,也(yě)是ChatCPT取代不了(le)的。

所以,ChatGPT的工(gōng)作(zuò)相當于什(shén)麽呢(ne)?舉例子,托勒密創造出這(zhè)個模型以後,那麽每過一段時(shí)間,他(tā)們歐洲就會(huì)編一個大(dà)概幾十年的一個日曆,然後上(shàng)面标上(shàng)哪天有日食,哪天行星會(huì)怎麽運動等等。那麽人們根據這(zhè)些(xiē)規律,印好(hǎo)多本這(zhè)個書,這(zhè)個ChatGPT就相當于有好(hǎo)多本書,你(nǐ)拿着以後一看(kàn),說,喔,某年月日會(huì)發生月食,答(dá)案就會(huì)很(hěn)清楚。但(dàn)是,背後真正有意義的工(gōng)作(zuò)不是印這(zhè)個書,而做托勒密的那個研究。

所以我認爲,從(cóng)曆史上(shàng)看(kàn)ChatGPT其實不算(suàn)是一次技術革命,它影響到(dào)的都是那個比較懶的人,懶得動腦(nǎo)筋,創造新東西的人。真正探索人類知(zhī)識奧秘的人,是不會(huì)被取代的。

ChatGPT對(duì)我們到(dào)底有什(shén)麽影響?

很(hěn)多人問說,ChatGPT有什(shén)麽新機會(huì)?坦率來(lái)講,你(nǐ)沒機會(huì),因爲太耗資源了(le),你(nǐ)耗不起。那麽什(shén)麽人能(néng)夠受益?那就是賣資源的這(zhè)些(xiē)人。

我可以打個比方,就是說在這(zhè)個加州淘金(jīn)熱的時(shí)候,很(hěn)多人蜂擁而至,去淘金(jīn),單我們到(dào)今天爲止還不知(zhī)道(dào)哪一個淘金(jīn)者真的掙得着錢(qián),沒一個人把名字留下(xià)來(lái)。但(dàn)是最後誰掙着錢(qián)了(le)?是賣水(shuǐ)的人和(hé)賣牛仔褲的人。ChatGPT也(yě)是一樣的道(dào)理(lǐ)。大(dà)家跟着一起去淘金(jīn),其實你(nǐ)是掙不着錢(qián)的,但(dàn)是在過程中,你(nǐ)還不斷地要買水(shuǐ)喝,買牛仔褲穿,最後就是這(zhè)兩撥人掙到(dào)錢(qián)了(le)。李維斯Levi's,就是那時(shí)候産生的這(zhè)麽一個公司,它就是做牛仔褲的。

那麽最後你(nǐ)可能(néng)是給幾家大(dà)的做雲計(jì)算(suàn)的公司在交錢(qián),這(zhè)可能(néng)是一個結果。

好(hǎo)了(le),講完了(le)這(zhè)個ChatGPT的曆史,我給你(nǐ)做一個簡單的總結。

第一,不要恐懼。

今天是很(hěn)多人恐懼ChatGPT,就如同不要像當年哥(gē)倫布遇到(dào)的牙買加土著人恐懼月食,一樣的道(dào)理(lǐ)。

第二,不要勉強去找所謂的機會(huì),該怎麽工(gōng)作(zuò)就是怎麽工(gōng)作(zuò)。

我看(kàn)有同學問我,說蘋果爲什(shén)麽這(zhè)個不做ChatGPT,我說這(zhè)就對(duì)了(le)!這(zhè)就是爲什(shén)麽蘋果是世界上(shàng)最有錢(qián)的公司,利潤最高(gāo),市值最多。目前,很(hěn)多所謂做這(zhè)種人工(gōng)智能(néng)的公司到(dào)現(xiàn)在都在虧錢(qián)。所以,這(zhè)也(yě)是爲什(shén)麽很(hěn)多同學有時(shí)候問很(hěn)多太不着調的問題的時(shí)候,我就開(kāi)玩(wán)笑(xiào)地問他(tā)說,你(nǐ)的房貸還清了(le)嗎?你(nǐ)要沒還清,你(nǐ)就好(hǎo)好(hǎo)回去工(gōng)作(zuò),把工(gōng)作(zuò)做好(hǎo),這(zhè)才是對(duì)大(dà)家最有意義的事(shì)情,從(cóng)曆史上(shàng)看(kàn)也(yě)是如此。

第三,你(nǐ)要識破這(zhè)些(xiē)所謂的陰謀家或者想割你(nǐ)韭菜的人的那些(xiē)把戲。

就是說,如果再來(lái)一個人假裝哥(gē)倫布說他(tā)是神的代表,然後他(tā)能(néng)祈禱上(shàng)天能(néng)讓這(zhè)月亮(liàng)出來(lái),你(nǐ)不要信。所以你(nǐ)需要了(le)解ChatGPT背後的一些(xiē)科學原理(lǐ)。最簡單的一些(xiē)原理(lǐ),像今天我講的這(zhè)些(xiē),你(nǐ)還是需要有所了(le)解。

網站(zhàn)建設開(kāi)發|APP設計(jì)開(kāi)發|小(xiǎo)程序建設開(kāi)發
下(xià)一篇:在互聯網公司帶頭抵抗加班的我,離職了(le)
上(shàng)一篇:百度起訴蘋果公司,文(wén)心一言“官方APP”暗藏騙局