爆火的生成式AI,能讓智能音箱起死回生嗎?
生成式AI真的是“萬能靈藥”嗎?
智能音箱這類如今幾乎已經(jīng)被大量消費(fèi)者遺忘的產(chǎn)品,在此前經(jīng)歷了2017年、2018年的“瘋狂”之后,早已不再是大多數(shù)消費(fèi)者關(guān)注的對(duì)象。就在大家以為智能音箱會(huì)曇花一現(xiàn)時(shí),ChatGPT的橫空出世似乎讓智能音箱有了煥發(fā)第二春的可能,也給了這個(gè)在走下坡路的行業(yè)一個(gè)新的機(jī)遇。那么,智能音箱與如今爆紅的生成式AI能擦出火花嗎?
爆火的生成式AI,能讓智能音箱起死回生嗎?
三易生活·2023-06-12 11:14
關(guān)注
生成式AI真的是“萬能靈藥”嗎?
智能音箱這類如今幾乎已經(jīng)被大量消費(fèi)者遺忘的產(chǎn)品,在此前經(jīng)歷了2017年、2018年的“瘋狂”之后,早已不再是大多數(shù)消費(fèi)者關(guān)注的對(duì)象。就在大家以為智能音箱會(huì)曇花一現(xiàn)時(shí),ChatGPT的橫空出世似乎讓智能音箱有了煥發(fā)第二春的可能,也給了這個(gè)在走下坡路的行業(yè)一個(gè)新的機(jī)遇。那么,智能音箱與如今爆紅的生成式AI能擦出火花嗎?
生成式AI之于智能音箱行業(yè),或許就是久旱逢甘霖。根據(jù)相關(guān)市場(chǎng)調(diào)查數(shù)據(jù)顯示,2023年第一季度,受產(chǎn)品同質(zhì)化嚴(yán)重和消費(fèi)者需求下降等因素的疊加影響,國內(nèi)智能音箱在線上的監(jiān)測(cè)零售量為157萬臺(tái)、再次下跌40.6%,而在整個(gè)2022年,智能音箱國內(nèi)全渠道銷量為2631萬臺(tái)、同比下降了28%。
為什么曾經(jīng)被各大巨頭寄予厚望、甚至被視為可能是智能家庭入口的智能音箱,會(huì)在近年來滑入深淵呢?原因其實(shí)只有一個(gè),那就是智能音箱真的不夠智能。
在智能音箱這一概念火熱的2017年,業(yè)界曾有關(guān)于智能音箱的重心到底應(yīng)該在“智能”、還是“音質(zhì)”上的討論。最終,騰訊聽聽、蘋果HomePod等一系列注重音質(zhì)的產(chǎn)品,用它們的慘烈失敗證明智能音箱的賣點(diǎn)只有可能是智能化。
爆火的生成式AI,能讓智能音箱起死回生嗎?
三易生活·2023-06-12 11:14
關(guān)注
生成式AI真的是“萬能靈藥”嗎?
智能音箱這類如今幾乎已經(jīng)被大量消費(fèi)者遺忘的產(chǎn)品,在此前經(jīng)歷了2017年、2018年的“瘋狂”之后,早已不再是大多數(shù)消費(fèi)者關(guān)注的對(duì)象。就在大家以為智能音箱會(huì)曇花一現(xiàn)時(shí),ChatGPT的橫空出世似乎讓智能音箱有了煥發(fā)第二春的可能,也給了這個(gè)在走下坡路的行業(yè)一個(gè)新的機(jī)遇。那么,智能音箱與如今爆紅的生成式AI能擦出火花嗎?
生成式AI之于智能音箱行業(yè),或許就是久旱逢甘霖。根據(jù)相關(guān)市場(chǎng)調(diào)查數(shù)據(jù)顯示,2023年第一季度,受產(chǎn)品同質(zhì)化嚴(yán)重和消費(fèi)者需求下降等因素的疊加影響,國內(nèi)智能音箱在線上的監(jiān)測(cè)零售量為157萬臺(tái)、再次下跌40.6%,而在整個(gè)2022年,智能音箱國內(nèi)全渠道銷量為2631萬臺(tái)、同比下降了28%。
為什么曾經(jīng)被各大巨頭寄予厚望、甚至被視為可能是智能家庭入口的智能音箱,會(huì)在近年來滑入深淵呢?原因其實(shí)只有一個(gè),那就是智能音箱真的不夠智能。
在智能音箱這一概念火熱的2017年,業(yè)界曾有關(guān)于智能音箱的重心到底應(yīng)該在“智能”、還是“音質(zhì)”上的討論。最終,騰訊聽聽、蘋果HomePod等一系列注重音質(zhì)的產(chǎn)品,用它們的慘烈失敗證明智能音箱的賣點(diǎn)只有可能是智能化。
然而遺憾的是,絕大多數(shù)智能音箱的智能化程度只能用“捉襟見肘”來形容,而各大廠商對(duì)于ASR(語音識(shí)別)、NLP自然語義處理、遠(yuǎn)場(chǎng)拾音等人工智能和聲學(xué)技術(shù)的進(jìn)步,又實(shí)在有些過于樂觀。其實(shí)智能音箱從技術(shù)層面來說很簡單,它的工作模式就是收集用戶的聲音,然后將音頻發(fā)到服務(wù)器上、再計(jì)算并產(chǎn)出結(jié)果,最終將結(jié)果發(fā)送到智能音箱上變成具體的行為,比如打開某個(gè)應(yīng)用或是回復(fù)用戶的提問。
沒錯(cuò),智能音箱本身其實(shí)與人工智能并不沾邊,小愛同學(xué)、小度、天貓精靈的真身藏在了相應(yīng)的服務(wù)器端上。這一切也導(dǎo)致了決定智能音箱使用體驗(yàn)的關(guān)鍵是遠(yuǎn)場(chǎng)拾音技術(shù),也就是在復(fù)雜的聲學(xué)環(huán)境下準(zhǔn)確捕捉用戶語音指令的能力,畢竟總不能出現(xiàn)用戶說“講個(gè)笑話”,智能音箱聽成“放首歌”了吧。
智能音箱的解決方案,則是使用大規(guī)模麥克風(fēng)陣列來收集聲音,但其中卻有一個(gè)痛點(diǎn)一直得不到解決,那就是語音喚醒(keyword spotting)。大家在使用智能音箱時(shí),需要用到諸如“Hi,Siri”、“小愛同學(xué)”、“小度小度”這樣的喚醒詞,讓智能音箱知道你在和它說話,這也就意味著智能音箱缺乏主動(dòng)服務(wù)的能力。更為重要的是,由于技術(shù)的限制,智能音箱長期以來只能理解簡單的指令,比如“音量調(diào)大一點(diǎn)/調(diào)小一點(diǎn)”、“播放某某人的某某歌”等,再復(fù)雜一些的語句識(shí)別起來往往就很難。
而ChatGPT、文心一言這類生成式AI之于智能音箱的意義,就是前者可以幫助智能音箱理解更加復(fù)雜的語句,并提供更加自然的交流。相信使用過微軟Bing Chat、百度文心一言或ChatGPT的朋友應(yīng)該就知道,在與這類生成式AI對(duì)話時(shí),并不需要用諸如“Hi,ChatGPT”這樣的開場(chǎng)白,直接輸入內(nèi)容即可開始對(duì)話進(jìn)程。
爆火的生成式AI,能讓智能音箱起死回生嗎?
三易生活·2023-06-12 11:14
關(guān)注
生成式AI真的是“萬能靈藥”嗎?
智能音箱這類如今幾乎已經(jīng)被大量消費(fèi)者遺忘的產(chǎn)品,在此前經(jīng)歷了2017年、2018年的“瘋狂”之后,早已不再是大多數(shù)消費(fèi)者關(guān)注的對(duì)象。就在大家以為智能音箱會(huì)曇花一現(xiàn)時(shí),ChatGPT的橫空出世似乎讓智能音箱有了煥發(fā)第二春的可能,也給了這個(gè)在走下坡路的行業(yè)一個(gè)新的機(jī)遇。那么,智能音箱與如今爆紅的生成式AI能擦出火花嗎?
生成式AI之于智能音箱行業(yè),或許就是久旱逢甘霖。根據(jù)相關(guān)市場(chǎng)調(diào)查數(shù)據(jù)顯示,2023年第一季度,受產(chǎn)品同質(zhì)化嚴(yán)重和消費(fèi)者需求下降等因素的疊加影響,國內(nèi)智能音箱在線上的監(jiān)測(cè)零售量為157萬臺(tái)、再次下跌40.6%,而在整個(gè)2022年,智能音箱國內(nèi)全渠道銷量為2631萬臺(tái)、同比下降了28%。
為什么曾經(jīng)被各大巨頭寄予厚望、甚至被視為可能是智能家庭入口的智能音箱,會(huì)在近年來滑入深淵呢?原因其實(shí)只有一個(gè),那就是智能音箱真的不夠智能。
在智能音箱這一概念火熱的2017年,業(yè)界曾有關(guān)于智能音箱的重心到底應(yīng)該在“智能”、還是“音質(zhì)”上的討論。最終,騰訊聽聽、蘋果HomePod等一系列注重音質(zhì)的產(chǎn)品,用它們的慘烈失敗證明智能音箱的賣點(diǎn)只有可能是智能化。
然而遺憾的是,絕大多數(shù)智能音箱的智能化程度只能用“捉襟見肘”來形容,而各大廠商對(duì)于ASR(語音識(shí)別)、NLP自然語義處理、遠(yuǎn)場(chǎng)拾音等人工智能和聲學(xué)技術(shù)的進(jìn)步,又實(shí)在有些過于樂觀。其實(shí)智能音箱從技術(shù)層面來說很簡單,它的工作模式就是收集用戶的聲音,然后將音頻發(fā)到服務(wù)器上、再計(jì)算并產(chǎn)出結(jié)果,最終將結(jié)果發(fā)送到智能音箱上變成具體的行為,比如打開某個(gè)應(yīng)用或是回復(fù)用戶的提問。
沒錯(cuò),智能音箱本身其實(shí)與人工智能并不沾邊,小愛同學(xué)、小度、天貓精靈的真身藏在了相應(yīng)的服務(wù)器端上。這一切也導(dǎo)致了決定智能音箱使用體驗(yàn)的關(guān)鍵是遠(yuǎn)場(chǎng)拾音技術(shù),也就是在復(fù)雜的聲學(xué)環(huán)境下準(zhǔn)確捕捉用戶語音指令的能力,畢竟總不能出現(xiàn)用戶說“講個(gè)笑話”,智能音箱聽成“放首歌”了吧。
智能音箱的解決方案,則是使用大規(guī)模麥克風(fēng)陣列來收集聲音,但其中卻有一個(gè)痛點(diǎn)一直得不到解決,那就是語音喚醒(keyword spotting)。大家在使用智能音箱時(shí),需要用到諸如“Hi,Siri”、“小愛同學(xué)”、“小度小度”這樣的喚醒詞,讓智能音箱知道你在和它說話,這也就意味著智能音箱缺乏主動(dòng)服務(wù)的能力。更為重要的是,由于技術(shù)的限制,智能音箱長期以來只能理解簡單的指令,比如“音量調(diào)大一點(diǎn)/調(diào)小一點(diǎn)”、“播放某某人的某某歌”等,再復(fù)雜一些的語句識(shí)別起來往往就很難。
而ChatGPT、文心一言這類生成式AI之于智能音箱的意義,就是前者可以幫助智能音箱理解更加復(fù)雜的語句,并提供更加自然的交流。相信使用過微軟Bing Chat、百度文心一言或ChatGPT的朋友應(yīng)該就知道,在與這類生成式AI對(duì)話時(shí),并不需要用諸如“Hi,ChatGPT”這樣的開場(chǎng)白,直接輸入內(nèi)容即可開始對(duì)話進(jìn)程。
由于生成式AI是在基于大規(guī)模語言模型(LLM,Large Language Model)的基礎(chǔ)上,加入了人工標(biāo)注數(shù)據(jù)和從人類反饋中進(jìn)行強(qiáng)化學(xué)習(xí)技術(shù),再輔以知識(shí)圖譜技術(shù),即一種將知識(shí)寫成結(jié)構(gòu)化三元組(包含實(shí)體、概念和關(guān)系)的多關(guān)系圖,讓AI得以理解人類指令的含義,并最終從龐大的信息數(shù)據(jù)庫中選擇內(nèi)容進(jìn)行回答。
ChatGPT這類產(chǎn)品相比于Siri、小愛同學(xué)最大的變化,就是有了多輪對(duì)話的能力。相比Siri幾乎是“魚的記憶”,ChatGPT則可以一直與用戶對(duì)話,再加上對(duì)于情緒更清晰的感知,讓用戶以為真的是在與活生生的人對(duì)話。對(duì)于一個(gè)消費(fèi)級(jí)產(chǎn)品而言,用戶顯然并不在乎背后的技術(shù)原理有多么高深,而是關(guān)注它能否解決問題或是滿足需求。
生成式AI的魅力就在于它的能力上限很高,其中典型的例子就是微軟的Microsoft Copilot,同時(shí)它還能在一定程度上滿足用戶的社交需求,如今在海外已有創(chuàng)作者借助ChatGPT,推出了以自己為模型的“虛擬伴侶”,并收獲了超過1000名用戶??偟膩碚f,將生成式AI與智能音箱結(jié)合幾乎能補(bǔ)足后者的短板,使得其在消費(fèi)級(jí)賽道擁有了可堪一用的智能化水平。
事實(shí)上,部分智能音箱廠商已經(jīng)行動(dòng)起來了。例如今年2月,百度在預(yù)熱文心一言時(shí),小度就已宣布將融合文心一言,打造針對(duì)智能設(shè)備場(chǎng)景的AI模型“小度靈機(jī)”;4月天貓精靈接入“鳥鳥分鳥”模型打造的“AI嘴替”,同時(shí)宣布接入阿里巴巴的通義千問。
但需要指出的是,生成式AI并非“萬能靈藥”。就目前來說,一切生成式AI都面臨著一個(gè)不可避免的問題,那就是算力資源的稀缺。最近生成式AI天花板GPT-4“變笨”的消息引發(fā)了諸多關(guān)注,相比于剛剛發(fā)布時(shí)的狀態(tài),如今GPT-4的文本代碼質(zhì)量全方位下降已然成為了用戶的共識(shí)。
沒錯(cuò),其實(shí)不僅是GPT-4,諸如ChatGPT、文心一言等面向公眾的這類產(chǎn)品都出現(xiàn)了類似的情況,用戶量的增加導(dǎo)致了大模型性能的下降。
現(xiàn)在生成式AI領(lǐng)域面臨的核心問題,就是算力資源緊張、無法應(yīng)對(duì)洶涌而來的用戶,而為了確保用戶體驗(yàn),這類產(chǎn)品就只能降低大模型的性能、減少生成內(nèi)容的時(shí)間來給服務(wù)器“減負(fù)”。相較之下,智能音箱的存量市場(chǎng)規(guī)模無疑更加龐大,所以在接入生成式AI后,幾乎不可避免地會(huì)遇到類似的問題。
未來很有可能會(huì)出現(xiàn)的情況,是智能音箱的智能化水平呈現(xiàn)出一條拋物線,初期用戶體驗(yàn)會(huì)跨越式提升,但隨著用戶規(guī)模的不斷增加,智能化表現(xiàn)反而可能會(huì)“退化”回?cái)?shù)年前的水平。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com

