年初大模型剛剛熱鬧起來(lái),和智能家居領(lǐng)域一些朋友聊天時(shí),當(dāng)時(shí)大家聊得最多的是——大模型要如何在智能家居行業(yè)落地。
中國(guó)企業(yè)一個(gè)很重要的特性就是“務(wù)實(shí)”。
或許很多技術(shù)并不是由國(guó)內(nèi)企業(yè)或研究機(jī)構(gòu)最先研究出門(mén)道的,但要說(shuō)產(chǎn)業(yè)化速度,國(guó)內(nèi)企業(yè)毫不遜色。
那么,大模型究竟要怎么用到智能家居領(lǐng)域呢?
大家討論來(lái)討論去,最后發(fā)現(xiàn),大(語(yǔ)言)模型在智能家居、乃至整個(gè)C端的應(yīng)用,最契合的還是與智能語(yǔ)音交互結(jié)合。
畢竟,大模型(LLM)仍是自然語(yǔ)言處理(NLP)技術(shù)的一種。
而NLP是智能語(yǔ)音交互三大核心技術(shù)(ASR、NLP、TTL)中最重要的一環(huán),也是決定語(yǔ)音交互智能與否最重要的那項(xiàng)技術(shù)。
大模型在C端的“平民化”應(yīng)用,從強(qiáng)語(yǔ)音交互產(chǎn)品開(kāi)始。
這其中,亟需新技術(shù)補(bǔ)充彈藥的小度、天貓(精靈)們,終于等到了一波新機(jī)會(huì)。
01
智能音箱的盛世與衰落
論及消費(fèi)級(jí)強(qiáng)語(yǔ)音交互產(chǎn)品,最為人熟知的,就是智能音箱。
無(wú)論是國(guó)外的蘋(píng)果、谷歌、亞馬遜,還是國(guó)內(nèi)的百度、阿里、華為、小米,都曾將智能音箱作為一個(gè)核心產(chǎn)品來(lái)大手筆投入。
亞馬遜自不必說(shuō),作為智能音箱全球熱潮的始作俑者,亞馬遜研發(fā)語(yǔ)音交互技術(shù)的團(tuán)隊(duì)在2017年超5000人,在2018年更是達(dá)到了萬(wàn)人規(guī)模。
也正是由于亞馬遜這樣大手筆的投入,截至2019年1月,Alexa已經(jīng)有超過(guò)70000項(xiàng)技能,搭載亞馬遜Alexa的智能硬件已經(jīng)超過(guò)1億臺(tái)。
這樣的規(guī)模,引得不怎么涉足硬件領(lǐng)域的谷歌,也基于Google Asistant推出了智能音箱。
當(dāng)時(shí)還沒(méi)退休的亞馬遜創(chuàng)始人貝索斯甚至多次指出,要將Alexa打造成亞馬遜繼電商、Prime、AWS后的第四大支柱產(chǎn)業(yè)。
國(guó)內(nèi)智能語(yǔ)音技術(shù)熱潮更瘋狂,尤其是在智能音箱領(lǐng)域。早在2017年國(guó)內(nèi)智能音箱市場(chǎng)混戰(zhàn)時(shí),曾一度涌現(xiàn)出上百家智能音箱廠商,也造就了中國(guó)智能音箱“百箱大戰(zhàn)”的慘烈局面。
在智能音箱市場(chǎng)即將觸頂?shù)?019年,全球智能音箱銷(xiāo)量達(dá)到了1.47億,其中中國(guó)智能音箱市場(chǎng)出貨量5200萬(wàn)臺(tái)。
中國(guó)市場(chǎng)占去了全球三分之一的智能音箱出貨量。
從Strategy Analytics的2019年Q4全球統(tǒng)計(jì)數(shù)據(jù)來(lái)看,全球3、4、5位分別為阿里、百度、小米,僅排在亞馬遜、谷歌之后,而上榜前六的廠商,均為全球科技巨頭。
然而,智能語(yǔ)音技術(shù)并沒(méi)有想象得那么好做。
一邊是消費(fèi)者既享受著價(jià)格戰(zhàn)帶來(lái)的平民級(jí)AI產(chǎn)品,又因智能音箱不智能而苦不堪言;
另一邊是科技巨頭既要大手筆投入推動(dòng)技術(shù)研發(fā),又要兼顧安全風(fēng)險(xiǎn)。
亞馬遜就曾因在全球雇傭數(shù)千人團(tuán)隊(duì)為Alexa做數(shù)據(jù)標(biāo)注,引發(fā)了2019年全社會(huì)關(guān)注的智能音箱“監(jiān)聽(tīng)”事件。
智能音箱生意在走過(guò)第一個(gè)瘋漲的五年后,最終開(kāi)始轉(zhuǎn)頭向下,銷(xiāo)量一路下滑。
就最近兩年來(lái)看,即便當(dāng)初一年要辦多場(chǎng)智能音箱新品發(fā)布會(huì)的百度和阿里,現(xiàn)在也很少會(huì)花精力單獨(dú)為某款智能音箱出世舉辦大型發(fā)布會(huì)。
一則是頭部效應(yīng)已經(jīng)成形,二則是智能音箱已經(jīng)盛世不再。
行業(yè)從業(yè)者能夠明顯感受到的是,智能音箱賽道已經(jīng)不再性感、不再有趣。
直到大模型的出現(xiàn)。
02
舊瓶裝新酒
2022年年底,ChatGPT問(wèn)世,兩個(gè)月破億活躍用戶,刷新了最快用戶增長(zhǎng)紀(jì)錄,也引起了全球的關(guān)注。
紅杉沈南鵬是在ChatGPT發(fā)布前見(jiàn)到位于硅谷的OpenAI團(tuán)隊(duì),之后便開(kāi)始在AI領(lǐng)域下重注。
在ChatGPT發(fā)布前三個(gè)月,紅杉已經(jīng)在官網(wǎng)上發(fā)布了名為《Generative AI: A Creative New World》的文章,文章中預(yù)言,生成式AI將在未來(lái)進(jìn)入到每個(gè)人的工作、娛樂(lè)、生活中。
在ChatGPT正式問(wèn)世后,也就是2023年年初的兩個(gè)月里,無(wú)論是國(guó)內(nèi)媒體,還是AI領(lǐng)域的投資人、從業(yè)者,都開(kāi)始高度關(guān)注著大洋彼岸這款產(chǎn)品的問(wèn)世、成長(zhǎng)。
越來(lái)越多投資圈、科技圈大佬親自跑到硅谷,只為親身感受這波AI浪潮,探究背后究竟有無(wú)逆天機(jī)遇。
出門(mén)問(wèn)問(wèn)創(chuàng)始人李志飛,也是在2023年年初親身到硅谷考察后,決心要做大模型。
在上一個(gè)智能語(yǔ)音技術(shù)狂潮的智能音箱百箱大戰(zhàn)中,出門(mén)問(wèn)問(wèn)也曾做過(guò)智能音箱,而且是其中明星創(chuàng)業(yè)團(tuán)隊(duì)之一。
只不過(guò)后來(lái)在巨頭價(jià)格戰(zhàn)的擠壓下,出門(mén)問(wèn)問(wèn)和其他大多數(shù)創(chuàng)業(yè)團(tuán)隊(duì)一樣,在國(guó)內(nèi)將這塊業(yè)務(wù)早早轉(zhuǎn)向了B端市場(chǎng)。
之后,李志飛和他的出門(mén)問(wèn)問(wèn),依然一直留在智能語(yǔ)音技術(shù)這片熱土上。
大模型的出現(xiàn),讓李志飛們嗅到了機(jī)會(huì),只是,2023年的大模型還存在一個(gè)公認(rèn)的缺陷——“編瞎話”。
這一特性決定了大模型最先商業(yè)化落地的場(chǎng)景,會(huì)有這樣兩個(gè)特性:
第一,對(duì)自然語(yǔ)言處理技術(shù)有強(qiáng)需求;
第二,場(chǎng)景容錯(cuò)率要高。
這其實(shí)也是過(guò)去這些年人工智能技術(shù)商業(yè)化落地普遍存在的兩個(gè)需求。
語(yǔ)音助手在智能手機(jī)沒(méi)有得到廣泛應(yīng)用,卻催生了智能音箱這一“新物種”,正是因?yàn)楹笳邔?duì)自然語(yǔ)音處理技術(shù)有較強(qiáng)的需求;
產(chǎn)業(yè)性需求更高的AI質(zhì)檢,即便已有落地應(yīng)用,仍需要有人工做二次復(fù)判,而娛樂(lè)性更強(qiáng)的下棋機(jī)器人卻更容易直接落地,正是因?yàn)楹笳叩膱?chǎng)景容錯(cuò)率更高。
再看如今的大模型賽道。
雖然行業(yè)大模型潛力巨大,也通過(guò)具身智能帶火了人形機(jī)器人,然而,一位機(jī)器人領(lǐng)域資深從業(yè)者告訴鋅產(chǎn)業(yè),將大模型與機(jī)器人技術(shù)結(jié)合,現(xiàn)在仍處于探索階段。
“在解決大模型邊界問(wèn)題(什么時(shí)候開(kāi)始編瞎話)之前,沒(méi)人敢將搭載大模型的機(jī)器人批量應(yīng)用到工廠核心業(yè)務(wù)中?!?/span>
因而,當(dāng)ChatGPT問(wèn)世后,最先用到大模型的,同樣是是兼具上述兩個(gè)特性的搜索引擎。
微軟不惜130億美元投資OpenAI,盤(pán)活了微軟Bing搜索引擎,也讓搜索引擎市場(chǎng)有了新的變數(shù)。
與此同時(shí),智能音箱,成了具備上述兩個(gè)特性,也極度渴望新變數(shù)的另一類(lèi)消費(fèi)產(chǎn)品。
03
登船AIGC
2023年,經(jīng)歷了三年銷(xiāo)量下行后的智能音箱市場(chǎng),重新燃起了生機(jī)。
2023年2月9日,距離百度大模型——文心一言正式發(fā)布還要35天,然而,小度已經(jīng)等不及文心一言發(fā)布,在這一天正式官宣將融合文心一言能力打造面向智能設(shè)備場(chǎng)景的大模型——小度靈機(jī)。
彼時(shí),小度官方稱(chēng),小度靈機(jī)將會(huì)應(yīng)用到小度全系產(chǎn)品中。
之后我們看到,小度陸續(xù)對(duì)外公布了“小度靈機(jī)”的測(cè)試結(jié)果,并率先應(yīng)用到了5月發(fā)布的小度手機(jī)上,成了小度首款面向教育領(lǐng)域的智能手機(jī)最大的亮點(diǎn)。
今年7月在接受媒體采訪時(shí),小度科技CEO景鯤再次強(qiáng)調(diào),“我們會(huì)將大模型的能力逐步應(yīng)用到小度更多產(chǎn)品上,并會(huì)針對(duì)使用場(chǎng)景不斷調(diào)優(yōu)。 ”
不過(guò),景鯤也指出,“它短期內(nèi)不會(huì)有太大改變,3個(gè)月、6個(gè)月后,可能還是原來(lái)那些服務(wù)?!?/span>
阿里的語(yǔ)音交互系統(tǒng)接入大模型,同樣是在阿里大模型發(fā)布之前。
2023年4月11日,在這一年的阿里云峰會(huì)上,阿里正式對(duì)外發(fā)布大模型通義千問(wèn),當(dāng)時(shí)還是阿里CEO的張勇稱(chēng),未來(lái)阿里旗下所有產(chǎn)品將接入通義千問(wèn)。
實(shí)際上,在阿里通義千問(wèn)大模型發(fā)布之前,網(wǎng)上就已經(jīng)出現(xiàn)了接入大模型的天貓精靈的內(nèi)測(cè)視頻,官方當(dāng)時(shí)確認(rèn)了這一消息,并稱(chēng)這背后的是“個(gè)性化大模型?!?/span>
阿里大模型在天貓精靈智能音箱上對(duì)外的內(nèi)測(cè)招募是在通義千問(wèn)大模型發(fā)布之后,與此同時(shí),天貓精靈在今年4月對(duì)外發(fā)布了首款搭載大模型的消費(fèi)級(jí)產(chǎn)品——智能眼鏡。
相較于百度、阿里,小米大模型正式對(duì)外亮相要更晚一些。
2023年8月14日,在今年雷軍年度演講上,雷軍對(duì)外公布了小米大模型研發(fā)近況,并宣布小愛(ài)同學(xué)正式接入小米AI大模型。
隨后,接入大模型的小愛(ài)同學(xué)正式開(kāi)啟邀請(qǐng),當(dāng)時(shí)邀測(cè)的主要是多個(gè)型號(hào)的智能手機(jī),以及小米Sound智能音箱。
至此,國(guó)內(nèi)音箱三巨頭再次齊上陣,一并跨入了AIGC新戰(zhàn)場(chǎng)。
04
當(dāng)大模型,開(kāi)始“平民化”
2023年,“百模大戰(zhàn)”溢于紙面。
在經(jīng)歷了第一波通用大模型之戰(zhàn)后,如今更多團(tuán)隊(duì)尋找實(shí)際場(chǎng)景進(jìn)行大模型的應(yīng)用落地。
鮮為人知的是,大模型并不是什么新鮮事物,阿里通義、百度文心、華為盤(pán)古等現(xiàn)在市面上知名度較高的這些大模型,早幾年就已經(jīng)在各公司內(nèi)部立項(xiàng)推進(jìn),甚至嘗試進(jìn)入應(yīng)用場(chǎng)景。
例如,華為盤(pán)古大模型早在2021年就與中科院上海藥物研究所合作訓(xùn)練出了盤(pán)古藥物分子大模型,并用在了藥物研發(fā)上。
ChatGPT更多是讓大模型從幕后走到臺(tái)前,并成為人工智能幾條技術(shù)路線中出奇制勝的一條路線。
在進(jìn)入實(shí)際應(yīng)用側(cè)時(shí),大模型又一分為二,有了面向商業(yè)領(lǐng)域(To B)的行業(yè)大模型,以及面向消費(fèi)市場(chǎng)(To C)的大模型和AIGC。
就在上周,天貓精靈換上了一個(gè)新的主品牌——未來(lái)精靈,這一品牌的掌舵人彭超用一場(chǎng)線上發(fā)布會(huì)宣告了天貓精靈全面駛?cè)階IGC新時(shí)期。
迅速卷入這一戰(zhàn)場(chǎng)的不只有天貓精靈,甚至不只有BAT在內(nèi)的幾家大廠,國(guó)內(nèi)學(xué)術(shù)圈、產(chǎn)業(yè)圈眾多大佬都已經(jīng)跑步入場(chǎng)。
只不過(guò),如今已經(jīng)擁有億級(jí)市場(chǎng)保有量的智能音箱,必將又一次成為大模型的絕佳試驗(yàn)場(chǎng)。
而在智能音箱上的普及應(yīng)用,也將是大模型這一人工智能技術(shù)再一次直面數(shù)億挑剔的民眾。
更值得關(guān)注的或許是:
在經(jīng)歷過(guò)亞馬遜“監(jiān)聽(tīng)”事件全球熱議后,這一次,大佬們能多留些精力兼顧隱私安全問(wèn)題。