受風投公司Lightspeed Ventures支持的音頻平台Pocket FM剛宣布與聲音克隆公司ElevenLabs合作,利用人工智能快速將文本內容(如劇本)轉換為音頻系列。
在三月份成功融資1.03億美元的Pocket FM當時告訴TechCrunch,他們已經開始利用ElevenLabs的技術實驗將文本內容轉換為音頻。現在,這家位於印度的公司擴展了合作夥伴關係,使轉換工具將在未來幾周內提供給所有創作者使用。
在測試階段,Pocket FM已經使用ElevenLab的人工智能技術製作了30,000小時的音頻系列。通過這一新推出,該初創公司預計今年將使其100,000小時以上的音頻內容庫增長三倍。Pocket FM還表示,在實驗階段,人工智能工具幫助該公司將音頻製作成本降低了90%。
Pocket FM的共同創始人兼首席技術官Prateek Dixit在與TechCrunch的通話中表示,通過這一合作,公司希望讓作家更容易地將他們的文字轉換為音頻系列。
“我們擁有超過25萬名作家(包括公司的Pocket Novel寫作平台上的作家),這種合作降低了為他們設置和錄製音頻的成本,”他說。
“即使有了良好的錄製工具和設備,作家通常一天只能產生大約30分鐘的高質量音頻內容。使用人工智能工具,這種產量可以增加到10倍,”他補充道。
Pocket FM建立了一個集成ElevenLabs技術的工具,通過該工具為想要轉換其內容的作家提供50種語音。ElevenLabs的共同創始人Mati Staniszewski表示,他公司的工具能夠理解文字的上下文,並自動推斷聲音中的情感。
“通過與Pocket FM的合作,我們正在部署我們的新模型,這些模型更好地理解寫作的類型和情感,”Staniszewski說。
Dixit指出,根據用户與這種內容互動的數據,該平台還計劃建議適合特定類別作家的聲音。
Pocket FM不是唯一一個正在對使用人工智能工具的音頻系列平台進行實驗的公司。由Google支持的Kuku FM正在使用GPT-4、Claude、BandLab甚至ElevenLabs來幫助其作家完成不同階段的創作,包括完善劇本、生成縮略圖、添加音效,以及將文本轉換為音頻。
Kuku FM告訴TechCrunch,他們還在試驗使用視覺生成工具,如MidJourney和Runway,來製作與內容相關的廣告。
內容質量與對藝術家的影響
人工智能工具的承諾是更快地生成更多內容,但這並不意味著內容就是好的。Pocket FM為幫助發現和展示優質內容的回應是使其發現算法變得複雜並進行用戶互動實驗。
“如果一名作家發布一個音頻系列,我們將該內容展示給一小部分用戶並觀察參與度指標。如果這些指標是積極的,我們將進一步推廣,”Dixit說。
利用人工智能可能會加速這些平台的內容生成速度,增加內容庫,但也會減少與之合作的配音藝術家們的角色。印度配音藝術家協會(AVA)對人工智能接管的擔憂已經表達出來。
“如果人工智能接管,我們就完蛋了。作為配音藝術家,我們需要制定一些規定來保護我們的生計,”該協會的秘書長阿馬林德·辛格·索迪告訴印度刊物Scroll。
索迪還告訴Scroll,有些配音藝術家被召集到工作室錄製樣本以訓練人工智能,而沒有得到他們的同意或者通知他們。
“從情感上來說,這讓我感到害怕。通過使用人工智能,你基本上淡化了人類說故事的情感連接。您將失去情感聯繫,”德里的配音藝術家阿迪蒂亞·馬圖告訴TechCrunch。
他補充說,將高端聲音賦予那些還沒有培養出製作優質內容的品味和技巧的人,將導致市場被劣質內容淹沒。
當我們詢問AI生成語音對Pocket FM的影響時,該公司並未直接回答這個問題。不過,Dixit指出,在其實驗中,用戶對AI生成的內容的參與度“與使用人類配音製作的一樣好”。值得注意的是,該公司還在研究技術,以在一個音頻輸出中整合多個聲音。
Pocket FM和Kuku FM目前都沒有對其內容進行標記,以表明是否在創作過程中使用了人工智能。