為什么生成式AI應(yīng)用普及不如預(yù)期?
作者深入剖析了生成式AI的現(xiàn)狀、挑戰(zhàn)以及未來(lái)的發(fā)展方向。通過具體案例和技術(shù)分析,本文將引導(dǎo)讀者更全面地理解這一領(lǐng)域的復(fù)雜性和潛力。
這個(gè)話題其實(shí)我一直想寫,但是一直在猶豫要不要這么說。
猶豫的原因在于,一方面我認(rèn)為最近這1、2年眼界之內(nèi),最有突破性的技術(shù)創(chuàng)新的確是AI技術(shù),特別是以ChatGPT、Midjounery為代表的AI生成式技術(shù),由于科技創(chuàng)新帶來(lái)的新的發(fā)展或者說創(chuàng)業(yè)機(jī)會(huì),數(shù)來(lái)數(shù)去也就是這么一個(gè)大的方向,在這個(gè)趨于穩(wěn)定、存量?jī)r(jià)值競(jìng)爭(zhēng)的大環(huán)境之下,大家太渴望希望了,太需要新的蛋糕了。
但是另外一方面,作為一名12年互聯(lián)網(wǎng)行業(yè)經(jīng)驗(yàn)的老兵,且我過去1年時(shí)間也是實(shí)實(shí)在在地在大廠一線做AI產(chǎn)品,探索如何將AI技術(shù)應(yīng)用到具體的業(yè)務(wù)場(chǎng)景,產(chǎn)生增量效能,太知道AI能做什么不能做什么了。
最終還是Follow我的認(rèn)知,亮明觀點(diǎn),不再猶豫。
ChatGPT剛出來(lái)那會(huì)兒,簡(jiǎn)直就是震驚,王炸的效果。但快2年過去了,大家有看到哪些真正顛覆式創(chuàng)新的產(chǎn)品或應(yīng)用嗎?
問題還是在于這波AI創(chuàng)新的底層邏輯上。
這波的生成式AI創(chuàng)新,底層是一個(gè)概率模型
大家不需要了解太過于復(fù)雜的技術(shù)邏輯,只是需要知道底層是概率模型即可。舉個(gè)例子:
你問ChatGPT,中國(guó)歷史上秦朝之后是什么朝代,有可能嘗試100次,90次會(huì)得到結(jié)果漢朝,另外10次會(huì)得到結(jié)果楚、西楚或者別的什么其他的,為什么呢?
因?yàn)榇竽P驮谟?xùn)練的時(shí)候,需要學(xué)習(xí)語(yǔ)料,語(yǔ)料從哪里來(lái)?從各種圖書掃描數(shù)字版、網(wǎng)絡(luò)各種開放的內(nèi)容,也包括人和AI的聊天對(duì)話,AI大模型都會(huì)去學(xué)習(xí),只不過是有針對(duì)性地學(xué)習(xí),中間加一些排除垃圾數(shù)據(jù)干擾等邏輯。
但是,它本質(zhì)上還是個(gè)概率模型,只要是概率模型,就可能會(huì)出錯(cuò),這是這波AI大模型產(chǎn)品的第一個(gè)特點(diǎn)。
這個(gè)特點(diǎn)決定了很多領(lǐng)域是無(wú)法用的,比如心理咨詢、用藥咨詢、路線推薦,是不能出錯(cuò)的,出錯(cuò)之后可能會(huì)有非常嚴(yán)重的后果,有1%的錯(cuò)誤率都無(wú)法接受。
第二個(gè)特點(diǎn),是平庸
不知道大家有沒有注意到,文生文大模型產(chǎn)出的都是很平庸的內(nèi)容,機(jī)器的感覺特別強(qiáng)。這個(gè)的原因還是在于大模型是一個(gè)學(xué)習(xí)模型,到處去學(xué)東西,正是因?yàn)閷W(xué)習(xí)能力太強(qiáng),所以變成了一個(gè)全能型選手。好的也學(xué),壞的也學(xué)。俗語(yǔ)說近朱者赤近墨者黑,名師出高徒,如果跟著無(wú)數(shù)的老師學(xué)習(xí),那么到底哪個(gè)才是更專業(yè)的呢?大模型很難去識(shí)別區(qū)分出來(lái)。
所以就造成了,頂級(jí)學(xué)霸級(jí)別的學(xué)習(xí)力,最后學(xué)成了60、70分的水準(zhǔn),因?yàn)槲爷?們這個(gè)社會(huì)在某一方面的平均水位也就是60、70分的水位,比如寫作,你讓AI去模仿某個(gè)網(wǎng)絡(luò)大V,創(chuàng)作出一樣水準(zhǔn)的作品,不是很現(xiàn)實(shí)。因?yàn)锳I的訓(xùn)練學(xué)習(xí)需要非常多的數(shù)據(jù),很少的數(shù)據(jù)量是無(wú)法產(chǎn)生出足夠大的差異化的。
大家都喜歡AI能夠承擔(dān)專家的角色,實(shí)際上大模型AI只能是小學(xué)生或者普通人的水平,一個(gè)普通人的才能會(huì)很稀缺嗎?
第三個(gè)特點(diǎn),是昂貴
根據(jù)報(bào)道,OpenAI今年運(yùn)營(yíng)總成本可能將達(dá)85億美元。其中,推理和訓(xùn)練成本分別高達(dá)40億和30億美元。大型語(yǔ)言模型的單次訓(xùn)練成本少則200萬(wàn)美元,多則達(dá)到1200萬(wàn)美元,這還不包括模型的實(shí)際使用成本。雖然今年國(guó)產(chǎn)的大模型廠商的價(jià)格下調(diào)99%,應(yīng)用側(cè)的成本確實(shí)有顯著下降,但是AI技術(shù)迭代的總體成本還是非常非常高的。AI大模型更像是一個(gè)砸巨量資金看水花的模式。
這幾個(gè)特點(diǎn)決定了生成式AI技術(shù)無(wú)法大規(guī)?;蛘呱疃冗\(yùn)用。目前更多地還是當(dāng)一個(gè)輔助能力或者新的亮點(diǎn)特性作為加分項(xiàng)。
而對(duì)于未來(lái)生成式AI的發(fā)展方向,我認(rèn)為會(huì)是小模型+大規(guī)模專業(yè)的語(yǔ)料+行業(yè)化定向優(yōu)化。
大規(guī)模專業(yè)的語(yǔ)料可以解決概率和平庸的問題,就像如果你給大模型只找專家級(jí)的老師,除非它自己發(fā)散放飛自我(有這個(gè)可能),否則都還是在靠譜的范圍內(nèi),專家的平均水平肯定比普通人要高。這個(gè)概率優(yōu)化可能使得1%的犯錯(cuò)率降低到0.1%甚至更低,比如用藥咨詢這個(gè)領(lǐng)域,可以約束讓大模型不要發(fā)散,只根據(jù)給到的知識(shí)語(yǔ)料進(jìn)行回答,而知識(shí)語(yǔ)料都來(lái)自于醫(yī)學(xué)專家。
小模型可以控制訓(xùn)練成本,針對(duì)行業(yè)的知識(shí)等進(jìn)行定向優(yōu)化,不需要全知全能的小學(xué)生,而要某個(gè)領(lǐng)域頂尖的博士生。比如物理學(xué)方向的研究,是可以把很多常規(guī)的知識(shí)記憶這些交給AI,需要的時(shí)候詢問提取即可,讓研究員可以專注在AI無(wú)法完成的部分。
總的來(lái)說,生成式AI現(xiàn)階段處于一個(gè)比較尷尬或者說是實(shí)際表現(xiàn)和期望很不符的狀態(tài),這里面泡沫很大,短期內(nèi)大家可能很難看到某個(gè)AI應(yīng)用爆發(fā)式普及,但可能在水面之下,有一些細(xì)分領(lǐng)域的AI機(jī)會(huì)在生長(zhǎng)中,進(jìn)度可能是by年更新的。
直接to C的消費(fèi)級(jí)產(chǎn)品機(jī)會(huì)難度太大,完全從0去打造一款產(chǎn)品,除非是有很大的顛覆式創(chuàng)新,否則難以跟行業(yè)既有玩家去抗衡,而期望生成式AI帶來(lái)顛覆式創(chuàng)新,現(xiàn)階段不太現(xiàn)實(shí),AI改變了一些,但也沒有改變很多。
反而是to B的領(lǐng)域我認(rèn)為會(huì)更有可能跑出來(lái),to B的領(lǐng)域?qū)τ谌诵欠浅?粗氐模?把一些例如前面說的用藥指南、知識(shí)查詢這類的解放出來(lái)給AI去完成,有機(jī)會(huì)可以提高20%左右的人效。這樣的話,就會(huì)切得非常細(xì),很有可能最后是一些幾十人規(guī)模小公司跑出來(lái),能夠完成商業(yè)化閉環(huán),大廠要做這個(gè)事情的話人效太低了。
以上是我對(duì)現(xiàn)階段生成式AI的一些理解,分享給大家。
本文由 @李明Bright 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議