本文中我愛方案網(wǎng)將給大家介紹語音轉(zhuǎn)換技術(shù)方案方案。
如需開發(fā)相關(guān)項目,快包可提供技術(shù)團(tuán)隊對接服務(wù)。
語音識別與語音合成技術(shù)在人機(jī)交互中充當(dāng)著重要角色,且其對語音的產(chǎn)生和感知模型等基礎(chǔ)理論的研究也有十分重要的意義。目前的語音系統(tǒng)合成的聲音單一,而且機(jī)器味十足,怎樣能讓合成語音自然化、多樣化、個性化是當(dāng)前語音技術(shù)研究的熱點,語音轉(zhuǎn)換是讓合成語音多樣化、個性化、提高轉(zhuǎn)換質(zhì)量的途徑之一。
本技術(shù)方案主要包括兩方面:1.將貝葉斯先驗引入傳統(tǒng)的基于高斯混合模型的轉(zhuǎn)換方法,對轉(zhuǎn)換系數(shù)設(shè)定合適的先驗信息,避免了傳統(tǒng)模型在訓(xùn)練數(shù)據(jù)較少的情況下容易出現(xiàn)過擬合的問題。使得語音轉(zhuǎn)換系統(tǒng)的性能更加穩(wěn)定,轉(zhuǎn)換誤差更小。在該方法中提出了兩種對轉(zhuǎn)換模型噪聲的建模方法:一種叫single-noise,另一種叫multi-noise,前一種假設(shè)噪聲服從高斯分布,后一種假設(shè)噪聲服從GMM分布,實驗結(jié)果表明這兩種方法效果大致相當(dāng),后者在混合數(shù)較大的時候會略好于前者。
2.將核特征引入語音轉(zhuǎn)換模型,將原始的低維特征映射到高維空間,使得轉(zhuǎn)換模型在訓(xùn)練階段能更好的對語音特征的非線性進(jìn)行建模。同時該方法也能在一定程度上避免模型的過擬合問題,而且較之傳統(tǒng)的方法,有更小的轉(zhuǎn)換誤差。
技術(shù)方案優(yōu)勢
1.引入轉(zhuǎn)換系數(shù)的先驗知識,減小傳統(tǒng)語音轉(zhuǎn)換方法的過擬合問題
2.獲得比傳統(tǒng)轉(zhuǎn)換方法更小的譜轉(zhuǎn)換誤差
3,對于訓(xùn)練數(shù)據(jù)較少的情況下,有比較穩(wěn)定的轉(zhuǎn)換性能
4.引入核特征,增強(qiáng)模型的非線性建模能力,提高系統(tǒng)性能
應(yīng)用領(lǐng)域
1.在TTs(文語合成系統(tǒng))中,目前高質(zhì)量的語音合成系統(tǒng)或文語轉(zhuǎn)換系統(tǒng)都是基于語音波形拼接的方法,這種方法合成的語音個性特征一般是比較單一,缺乏相應(yīng)的個性。本技術(shù)可以實現(xiàn)通過在語音合成系統(tǒng)中增加一個說話人語音轉(zhuǎn)換系統(tǒng),將合成的語音通過說話人語音轉(zhuǎn)換系統(tǒng)或者將合成單元通過一個說話人語音轉(zhuǎn)換系統(tǒng)再進(jìn)行合成,將其轉(zhuǎn)化為特定人的聲音,使單調(diào)的語音具有更多的個性特征,滿足不同人的應(yīng)用需要。
2.在醫(yī)學(xué)領(lǐng)域,用于語音增強(qiáng)系統(tǒng)。對于聲帶等發(fā)音器官存在病變或者損傷的病人,其話音的質(zhì)量嚴(yán)重受損,對方很難理解,嚴(yán)重影響了正常的交流。說話人語音轉(zhuǎn)換可以用于幫助恢復(fù)受損語音,把受損語音變成一個清晰可懂的語音,這將極大地改變這些病人的生活。
3.在電影配音中,通過本項目的說話人語音轉(zhuǎn)換系統(tǒng),使之重新具有原演員的特征,增強(qiáng)了電影的效果。
4.用于機(jī)器語言翻譯系統(tǒng)。現(xiàn)有系統(tǒng)其最后翻譯合成出來的聲音都沒有了源說話人的個性特征信息,非常缺乏現(xiàn)場感。本技術(shù)可以實現(xiàn)對合成的語音進(jìn)行轉(zhuǎn)換,重新恢復(fù)出說話人的身份特征,具有良好的實際效果。
關(guān)于快包與“產(chǎn)學(xué)研”
產(chǎn)學(xué)研即產(chǎn)業(yè)、學(xué)校、科研機(jī)構(gòu)等相互配合,發(fā)揮各自優(yōu)勢,形成強(qiáng)大的研究、開發(fā)、生產(chǎn)一體化的先進(jìn)系統(tǒng)并在運行過程中體現(xiàn)出綜合優(yōu)勢。 產(chǎn)學(xué)研合作是指企業(yè)、科研院所和高等學(xué)校之間的合作,通常指以企業(yè)為技術(shù)需求方,與以科研院所或高等學(xué)校為技術(shù)供給方之間的合作,其實質(zhì)是促進(jìn)技術(shù)創(chuàng)新所需各種生產(chǎn)要素的有效組合。
快包一直致力推動智能產(chǎn)業(yè)的發(fā)展,通過構(gòu)建外包平臺的形式促進(jìn)智能產(chǎn)品方案供需雙方的合作。如今快包攜手“產(chǎn)學(xué)研”旨在讓科研走進(jìn)市場。近期快包整理了一系列來自研究機(jī)構(gòu)以及高校的科研團(tuán)隊資料,推出大型產(chǎn)學(xué)研系列專題文章。通過展示他們的項目案例促進(jìn)智能產(chǎn)業(yè)界對他們更深層次的了解。這些團(tuán)隊能夠提供攻堅技術(shù)和前沿核心技術(shù),精準(zhǔn)解決一些較大企業(yè)的技術(shù)實現(xiàn)難題。
欲對接產(chǎn)學(xué)研項目,請聯(lián)系:kb@52solution.com 或 400-085-2125