"看著電腦屏幕上那有關三光頭聯系的討論,向坤背靠電腦椅,一臉的生無可戀。
本以為他那裝b的做菜視頻很快就會被網友遺忘,沒想到冒出一堆惡搞配音的玩法。
本以為這種惡搞配音的玩法用不了多久網友就會玩膩,去尋找新的素材,沒想到居然又把他之前的“背影圖”和“見義勇為視頻”給關聯了起來。
他不用去看那些評論、搜那些相關內容,就知道會是什么樣的討論情況了。
看來這熱度,一時半會又是降不下去了。
也好在是他這幾個月變化很大,又成了光頭,以前的同學、熟人什么的一般都認不出他來——連親媽都認不出來,其他人要認出來的難度可想而知。
能從這圖片和視頻分辨出他真實身份的,就那么寥寥數人。
否則的話,怕是他的真實身份,早就被人給直接扒出來了。
現在怎么整?
算了,繼續涼拌吧,反正他是不可能主動去冒頭收這個熱度的。
不過腦子里飛快地計算了一下,向坤卻是冒出了個點子,覺得或許可以用用。等天亮后,跟游猛商量商量。
向坤又想起了自己的ai助手計劃,他打開一個輸入界面,看起來就像一個簡單的文本編輯器一樣,只是文本輸入界面最下方有幾個簡單的按鍵,整個界面基本沒有什么ui設計可言。
向坤文本框里輸入了一行字:“大家好,我是唐小娜?!?/p>
然后按下了下面的播放按鈕。
接下來那句話,便以唐寶娜的聲音說了出來,聲音柔和、語氣平淡,但聽起來發音還是十分地自然順滑,乍聽之下,并不會有任何的違和感,更不會想到不是真人說出。
不過以向坤的耳朵,還是聽出了很多的問題。
他的“ai助手”計劃雖然很早前就已經做出了整個的框架,基本確定了體系結構、數據結構、關鍵算法和模塊功能。
但實際有開始去做的,只有語音合成這部分功能,因為向坤其實對他所做的這個“ai助手”計劃,依然還是不滿意。
其主要核心,依然都還是現有的、成熟的各種方案,他只是在做更好的整合和修改。
先不說以后成品的功能是否能滿足他的需要,單就這實現的過程,就還需要大量的時間和其他成本,不是他一個人一時半刻能做好的。
而現在經過幾個月的變異進化后,向坤莫名地覺得,自己花費那么多時間和成本去做出來的“ai助手”,不應該“只是這樣”而已。
所以他一直只是在做“ai助手”的門面工作——合成聲。
在中秋那晚,向坤就向唐寶娜提出了為他提供語音樣本的請求,后者也答應了,而樣本采集很早就已經完成,他也已經對已有的一個開源語音合成模型進行針對性的修改,然后經過訓練,它成功模仿唐寶娜的聲音。
雖然這段時間都是斷斷續續地在做,但經過一個多月時間,基本上已經算是完成了。
不過向坤對于這個完成結果還是有些不太滿意,雖然整體對文本朗讀的流暢度、對語境的理解程度、詞法分析、句法分析、語用分析,都比原版的語音合成模型有了非常大的提升。