タグBertVITS2を含む動画:2件 1ページ目を表示
2024年6月3日 06時23分に生成された05時00分のデータです
2023-12-25 19:00:00
感情表現も多言語もできる最新音声AI「Bert-VITS2」の導入方法~使い方【2023.12月版】中国コミュニティで生まれたらしい最新音声合成技術「Bert-VITS2」の導入方法などを解説します。AIが文章を理解して感情表現を行い、さらに音声の機械学習やクロスリンガル(日本語音源→英語で生成)まで可能というゲームチェンジャー級の性能です。
※ 以前に投稿した「RVC」のレビュー動画は現在の私の考え方とは違った観点で解説していたため動画を削除しました。詳しくはYouTubeコミュニティに書きました。
https://www.youtube.com/channel/UCWiED1Kp1MM532_p7QbhW_g/community
▼EasyBertVits2(Zuntan様)
https://github.com/Zuntan03/EasyBertVits2
▼音声モデル(litagin様)
※ 動画内では「K」の音声を一部使用してます
■サンプル音声
https://huggingface.co/litagin/bert_vits2_okiba/blob/main/examples.md
■ファイル
https://huggingface.co/litagin/bert_vits2_okiba/tree/main/ver2.1
▼Bert-Vits2
https://github.com/fishaudio/Bert-VITS2
▼fish-speech
https://github.com/fishaudio/fish-speech
▼Twitter
https://twitter.com/YuuPro_2022
▼BGM
■DOVA-SYNDROME 様:https://dova-s.jp/
■ポケットサウンド 様:https://pocket-se.info/前田佳緒里 エスケープ処理してないんか・・・ VEGAとかとかわりとレアやなw <自分でコードレビューしてどうぞ 寒いの言い方イイな これこそAI!? この声もその中のツールの一つなのかな 権利関係があるので、そこはクリアしてからね MMVCでもpt...
- 825
- 364.4
- 566.8
- 81.0
2024-02-08 18:00:00
猫声生成AIによる文章読ミャーげ【Style-Bert-VITS2】Style-Bert-VITS2に猫の鳴き声を学習させた、多言語対応の文章読み上げモデル試作品。素人なりに説明すると「猫言語モデル」と「専用喋り方モデル」を作ってマージした感じで、実は10年以上前に猫音声を買い漁って人力で試作してました。"猫らしさ-人らしさ"を調整可能で、当然ながら人言語の喋り声よりは猫言語の鳴き声を出力させた方が自然です。
想定通りの挙動を求めて学習元音声を作り続けていたら、猫以外の音声が全部自作でもそれなりに動くモデルになりました。結果的に「人間の肉声」「生成AI音声」「文章読み上げソフト音声」などの人間要素が学習元音声から無くなりましたが、Style-Bert-VITS2のパワーで喋ります。
※原文ママの入力では漢字誤読など発音の問題が出るほか動画編集上の都合もあり、テキスト入力欄は別撮りとなります。猫の顔差分は(恐れ多くも)自分で手作りしました。こちらこそ久しぶりに投稿してくれてありがとう ケフィアP猫まで喋らせ始めたw 面白い時代になりましたね 猫の口の動きと声質から、英語との相性がいいかも
- 138
- 53.6
- 64.3
- 21.4