这两个场景在AI语音定制能力下-前瞻资讯
点击关闭
您现在的位置校园新闻稿首页>>科技新闻>>正文

语音AI-这两个场景在AI语音定制能力下

主播翠西被解约

3、「聲音著作權」的無數新玩法。上面說過,AI語音定製能力的出現和普及,將讓「高凈值聲音」成為一種新的版權資本。明星、偶像、公眾人物,甚至特定領域網紅的聲音,將可以通過AI交互的形式普及到各種硬件中,造成內容產業與科技產業的又一個垂直風口。

3月初,一直對AI技術大舉投入的百度,在小度音箱中上線了語音定製功能。在小度APP中「爸媽講故事」這個功能場景,用戶可以錄製自己和家人的語音包。

另一方面,AI語音定製功能的更大紅利還要看飯圈。這幾天飯圈的能量之大,讓整個社會頗為領教。那麼讓愛豆的聲音不僅僅出現在地圖導航,而是時時留存在智能產品中,與自己時時對話,聊天、講故事、玩遊戲——以此產生的購買力和再開發能力,簡直不敢細想。

AI語音開發者,或許很快就可以通過語音定製功能,獲得「泛化定製」的全新機會。可以預見,AI語音定製將通過以下幾種方式影響AI語音的開發空間與產業價值:

事實上,AI語音定製的能力,一直都處在AI行業與用戶的高度期待里。一方面讓AI模擬用戶聲音,關乎家庭、陪伴、記憶等諸多社會情感因素;另一方面熟悉的聲音可能觸發很多新的應用想象,比如你可能懶得打開音頻課,但如果你的愛豆或者女神給你上音頻課,你可能都懶得睡覺。

因此,AI語音定製的工程化與商業應用,始終被抱以高度期待。這條技術線索可以說是AI語音硬件,比如智能音箱、智能屏等產品持續發展的奇兵。

從2015年,亞馬遜的Ehco誕生起,語音助手就處在用機器音一問一答的基本能力里。用戶時常找不到繼續說下去的動力。一問一答模式也與真人交互並不相似。

2019年,小度助手實現了全雙工免喚醒能力,可以一次喚醒多次交互,終於讓多輪對話在硬件中得以實現,聊天開始形似真人。

4、AI語音的社會價值與意義被重新估判。從James Vlahos的故事不難看出,AI語音定製能力,包含着深刻雋永的親情關懷與家庭意義。人與人無法永遠陪伴,但對方聲音的智能化,卻可以將很多重要的時刻與陪伴感放大。AI語音定製化的開發者們,接下來將可能擔負起更多關於親情、社會與陪伴的探索。從技術價值到社會價值,AI語音定製化的影響力也將以此被放大。

本文首發於微信公眾號:腦極體。文章內容屬作者個人觀點,不代表和訊網立場。投資者據此操作,風險請自擔。

在小度語音定製功能中,用戶進入小度APP,就可以在「爸媽講故事」這個功能里錄製自己的專屬語音包。談不上多複雜,3-5分鐘就可以錄好,錄製的聲音可以播講大段的故事,並且語氣、語調、頓挫感在百度的AI語音能力加持下非常逼真,沒有異樣感。

但不管最終是哪個平台獲得最後的留場權,對於AI開發者來說,語音定製化能力帶來的產業機遇都剛剛開始。千人千面的硬件,千變萬化的應用,千方百計的技術突破,是我們最終想在新硬件形態上看到的結果。

2016年,美國一位科技記者James Vlahos,做了一件感動無數人的事。

AI語音定製化,正在成為對話式AI硬件市場上新的驅動因素。細心觀察近三年來的對話式AI硬件以及AI語音市場,就會發現市場的波動式增長,呈現與技術突破緊密契合的關係。在一種硬件形態處於草創階段的時候,這種因技術而爆發的商業能量是產業常態。

在另一條軌跡上,我們可以將其看作智能語音助手和對話式AI硬件的整體進化。

1、技能定製得到飛速發展。用家人的聲音定製一個語音技能,甚至定製只有家庭成員、情侶之間、粉絲專屬的語音技能,是一個廣闊的產業想象力。很多語音技能在有了用戶聲音這個選項之後,將產生全面改變,可能影響到娛樂、家庭、教育、陪伴等多個場景。

這個故事在感動了全球無數家庭的同時,也讓AI開發者與技術人員看到了用AI語音定製化的重要意義。毫無疑問,全球眾多家庭都在渴望着類似功能,無論是記錄老人的聲音,讓自己的聲音能夠更多陪伴孩子成長,還是戀人之間的聲音陪伴,家庭,正在成為AI語音技術應用場景的主戰場。

換句話說,對話式AI打開的硬件市場,呈現這樣的邏輯關係:技術能力突破代表着更好的用戶體驗,繼而將直接催生市場回饋。在2019年,小度帶來全雙工免喚醒能力后,AI語音硬件市場一度解封了三足鼎立的形態,展現出獨自向前大幅飛躍的局面。而AI語音定製化能力,作為與開發者、技能生態、內容生態聯繫更緊密的技術突破,顯然將持續維護這種技術領先性,帶來更多的市場回饋,以至於某種市場質變的臨近。

如今,定製化語音的功能來到了最複雜的AI場景里:對話式AI設備。

飯圈家庭:兩個場景的AI硬件或爆發

這是對話式AI硬件中,首次出現用戶語音定製能力。當用戶可以定製自己的語音包,讓智能音箱不斷傳來自己的聲音,眾多行業規則似乎都在發生變化。

這種需求也在不斷受到產業界的重視。近來幾年,語音合成、聲音克隆等技術相繼發展,自然語言處理整體能力也得到了突飛猛進的發展。AI語音定製化這件事,也早已不用耗時幾個月,用數萬條語料進行機器學習訓練,而是真正的「飛入尋常百姓家」。

能夠規模化落地的AI語音泛定製應用、硬件,以及專屬服務,是將用戶、偶像、軟件開發者和硬件品牌融合在一起的全新形式,由此激發的購買慾望和平台開發機遇,也許將是2020年的獨特風景。

這意味着,AI定製語音的能力已經基本不再存在任何用戶門檻,我們不用學習複雜的技術,浪費大量時間,忍受一次次的失敗。用戶將以非常簡單的方式,就能夠利用智能語音定製來展開實現家庭場景中的應用。語音定製的產業化通道也就此展開。

2、生活場景定製成為重頭戲。在智能家居、智能手機助手、智能穿戴設備中聽到自己親人、偶像的聲音,是一件可以充滿各種玩法的事情。開發者將可以藉助各種硬件形態,揮灑AI語音定製的想象力。

AI語音定製化帶來的第一個改變,就是用戶可能會重新開始思考自己如何應用對話式AI硬件,以及為什麼購買相關產品。

有了AI語音定製能力后,有兩個商業場景的改變是顯而易見的。首先在家庭場景中,定製家人聲音這一能力其實至關重要。因為家人的聲音代表着陪伴、依靠和溫暖,這是人之天性,無法在任何時代改變。用父母的聲音給孩子講故事、講知識,讓子女的聲音在智能音箱中陪伴着父母,給父母報時間,念新聞。這些溫暖的應用,是中國人的普遍需求,也是繁忙都市工作下的必然選擇。

而AI語音定製的相關技術,在過去幾年間迎來了不斷降低門檻、提升應用規模的過程。James Vlahos用了9萬多條語料進行機器學習訓練,但如今只需要幾分鐘就可以訓練出語義理解和自然語言處理效果遠遠超過siri的定製化語音模型。

門檻已去:AI語音進入定製化時代

讓我們從語音合成、對話式AI,以及智能語音硬件三者發展的合流中,審視一下進入AI語音定製時代的2020,可能發生的三個改變。

隨着AI語音產業的成熟,開發者技術支持的日趨完備,已經有越來越多的聲音博主、AI開發者,投身到AI語音生態的大潮中。而隨着AI語音定製功能的上線,開發者的基礎能力又得到了不小突破,「千人千聲」的對話式AI設備不再僅僅是個產業想象。

泛化定製:AI語音開發者獲得新船票

近幾年,隨着技術的升級,定製用戶語音的相關產業探索一直在前進。比如一個名為Revoice的公益項目,希望能夠幫助漸凍症患者留住自己的聲音;而汽車AI廠商Cerence在去年推出了創建用戶聲音語音助手的功能;微軟的Custom Voice服務,可以一定程度上讓用戶聲音成為小冰的語音。去年,「語音定製功能」開始被應用到地圖場景,用戶在百度地圖APP上錄製20句話,就能夠生成個人完整語音包。

這兩個場景在AI語音定製能力下,是最有可能快速呈現爆發的。而以此為基礎,一波新的開發者紅利即將上線。

而AI語音定製的能力,或許可以看作2020年智能語音助手和相關硬件的又一次升級,用戶可以藉此實現千人千面的AI硬件,開發者有了新的開發基礎。連鎖發生的產業化影響也能夠隨之展開。

他在父親臨終前幾個月,下定決心要把父親的聲音和教誨永遠留在身邊。於是非技術背景的James在一個AI項目的幫助下,自學語音合成與機器學習。在父親的幫助下,他每天錄製父親一到兩個小時的聲音,共記錄了9萬多個單詞用來訓練AI模型。最終完成了由父親聲音構成的,類似siri的語音助手,得以讓James時時寄託哀思。

今天的情況就是一個很好的例證,疫情推遲了復工,這讓很多父母有了更多時間陪伴孩子,從而產生了「疫情下的父母依賴」。但返工開始,父母不得已又將離開孩子怎麼辦?在智能音箱家庭使用場景下,語音定製功能就給出了一個選項。

今日关键词:九江黄梅发布公告