キーワード音響モデルを含む動画:41件 ページ目を表示
2024年6月20日 07時10分に生成された05時00分のデータです
2017-09-07 16:43:10
音声をささやき声化するプログラム作ってみた動画初投稿です.よろしくお願いします.
開発中なんども耳かき音声を巡りました.
ソースコードは以下のURLで公開しています.
https://github.com/zeta-chicken/toWhisper
音声読み上げソフトにはOpen JTalkを,Open JTalkの音響モデルにはWacky↝音響モデルを利用しました.
Open JTalk : http://open-jtalk.sourceforge.net
Wacky↝音響モデル : http://yoruto.wixsite.com/wacky-haitteru
また動画中で「あみたろの声素材工房」様の声素材を使用しました.
http://www14.big.or.jp/~amiami/happy/
有志の方々が素晴らしい改良をしてくださいました.
https://twitter.com/kubimaki/status/906802212998832128 ←簡単に使えるように
https://github.com/ksasao/toWhisper ←C#へ移植
https://github.com/yamachu/toWhisper/releases ←GUIに
ar1334534 ←GUIに?全くわからん えっ ?!、?!?! なんだ、ただの神か もっと勉強しよ ささや↑き↓ この声は囁き声にするなwww まえは 88888888 えっっっっ なんかおかしい? 元の声は使ってないってこと? 天才かよ ゴノレゴ すばらしい こういう技術ボ...
- 16,174
- 950.6
- 570.4
- 5623.5
YouTubeで検索
2014-12-28 00:01:49
無料なのに超リアル!フリーの文章読み上げソフト音声比較SHABERUという文章読み上げソフトが衝撃的だったので、SHABERUで利用可能なキャラクター(音響モデル)に色々と喋ってもらいました(^ ^)
読み上げるテキストは、前作のトーク動画(sm25174979)で使用した台本の一部を使用してます。
こんなセリフでスミマセンm(_ _;)m
綺麗に喋らせるには音響モデル毎にパラメータを調整する必要があったり、他の文章読み上げソフトと比べると、ちょっと敷居が高いかもしれませんが、リアルで個性豊かな音響モデルが数多く使えるのは非常に魅力的です!
ゲーム実況など、動画作成のお供にいかがですか?
SHABERU sm22274041
http://akihiro0105.web.fc2.com/アウト wwwwwwwww wwwwwwwwwwwwww んー テキスト選べwww なんでそろって中国イントネーションなんだwww スイスぽい あさはらwww この人名前中国っぽくしたらどうか 全員中国人w 東南アジア系w 音程を個別に直せたら良いな...
- 9,937
- 930.9
- 10.0
- 320.3
YouTubeで検索
2013-11-17 16:56:45
SHABERUソフトを作ってみた。音声合成ソフトOpen_JTalkを、簡単に使えるソフト「SHABERU」を作ったので紹介します。
デフォルトの音響モデルに桃音モモ、獣音ロウを使用しています。
また、音響モデルの作成も行います。
マイリスト:mylist/27659308
SHABERUのダウンロード:http://akihiro0105.blog55.fc2.com/blog-entry-135.htmlおつおつ ここCV桃音モモじゃなくて獣音ロウだよね? おお へー それかああ! 重みで使用音源を切り替えるのか。やっときりかえれた ユーザー音源をが作れるようになれば良いのにな 喧嘩別れだww 中国っぽいw 確認してくるー これって音源側の規約OKだ...
- 9,430
- 540.6
- 30.0
- 800.8
YouTubeで検索
2008-03-10 22:23:01
【東方アレンジ集】ネイティブフェイス in Green【癒し】東方風神録EXボス曲「ネイティブフェイス」のアレンジの中でも、私のお気に入りのものを緑溢れる画像と一緒にお楽しみください。※音質変換に心理音響モデル演算を使用しましたので、心地よく音楽を楽しめると思います。 Track1:Native Faith ~MyonMyon~ Track2:孤高という恍惚 ~ししまいブラザーズ~ Track3:信仰風化曲 ~ Native Faith ~dBu music~ Track4:ネイティブフェイス ~Golden City Factory~ Track5:甦生せよ宵の国へ ~SOUND HOLIC~
p ←プラシボー効果ですね。わかります 心理音響モデルって単純に圧縮の方法だろ?別に音質...
- 5,784
- 1632.8
- 00.0
- 781.3
YouTubeで検索
2009-02-26 02:29:15
lame4.0 alpha14 test - ロートシルトRh-/anNina 高音質vertest lame4.0 alpha14 320 心理音響モデル使用 比較用→sm6267373
いいわぁ この曲、対象aよりも好きかも 声が綺麗 癒しだ・・ 寝るときに聴くと凄くリラックスできる anNinaさんの曲って本当に落ち着く。。 歌声きれい どういうコマンド使ってエンコしたか詳細希望する 音質いいね いい曲だ アルバム買った
- 4,932
- 110.2
- 40.1
- 781.6
YouTubeで検索
2011-12-15 18:04:12
【作業動画】HTSの話者依存学習の環境構築MMDagentで利用されているOpen JTalk用の音響モデルを作成するまでの作業動画です。
必要なパッケージのインストールから、環境構築、サンプルを使用した音響モデルの作成までの工程を垂れ流す動画です。
解説文等はありません。コマンド等の詳細は個人wikiを参照してください。
環境はUbuntu10.04です。
ブログ : CUBE370 - MMDAgentのNAIP化計画 http://cube370.blog87.fc2.com/
個人wiki : MMDAgent & Project-NAIP wiki http://cube370.wiki.fc2.com/
過去に投稿した動画:mylist/10465382メイク パッチコマンド HTSフォルダ以下にHTKフォルダ以外があるのがわからない。 ここに展...
- 3,435
- 100.3
- 20.1
- 290.8
YouTubeで検索
2012-11-30 02:15:35
とあるキャラの音響モデル作成してOpenJtalkで音声合成してみた知ってる人は知っているユウトですwwどれくらいのものができるか検証してみた。もっと進化させたい。画像はデスクトップのスクショと描いた絵達ですね。ATR503文を使うのが一般的な学習のさせ方ですが使ってません。ところどころおかしいのは学習外音声だからだと思われます。あと学習の時のF0の値いくらくらいにするとうまくいくのかよくわかっていないのでいい感じの採用してます。楽しんでいただけたら光栄です。タグとか詳しくないので適当に技術部にしてます。違ってたらどれが一番適切か教えてください。
草 すごい はえ〜すっごい すごい レールガンw すごい 一気に変わるな 30は繰り返し聞いてるとなんとなく分かるんだよ、でも初見だと宇宙語っぽく聞こえるんだよね・・・ 怒りながらしゃべる猫の動画思い出す 30から100と200から344で違う感じを受ける
- 3,025
- 210.7
- 10.0
- 170.6
YouTubeで検索
2014-07-18 21:52:02
俺が初音ミクだ!! ができるの作った俺が初音ミクだ!!
最近忙しすぎて全然プログラミングできない。
とりあえずUnityの練習を兼ねて作ってみました。
参考サイト 凹みTips→http://tips.hecomi.com/
アキヒロさん音響モデル提供ありがとうございます。
暇な学生7のTwitter @cof08312
mylist/45120192
「HANAUTAU」→sm21933917
HANAUTAUに関しては9月ごろに動画を投稿する予定です。888888888 こわいw 瞬きはさせてほしいw 誤認がないのはどうして? それがすごい けっこうすげw...
- 2,846
- 291.0
- 00.0
- 311.1
YouTubeで検索
2012-03-24 12:50:49
簡単にしゃべってくれるソフトを作ってみた。MMDAgentなどで使われている音響モデルをしゃべらせることができるOpenJTalkですが、設定がめんどくさいので、自分でソフトを作ってみました。名前はOpenJTalk_windowsです。これからいろいろな種類の音響モデルが出ることに期待してます。・・・誰かもっといい名前を考えてください。OpenJTalk:http://open-jtalk.sourceforge.net/ MMDAgent:http://www.mmdagent.jp/ マイリスト:mylist/27659308 ダウンロードは:http://akihiro0105.blog55.fc2.com/blog-entry-44.html *修正してみました。バージョンは1.1になりました。
立ち上げる度にパス入れなおさないといけないのが面倒くさいです sample_voice単体でCC等のラ...
- 2,563
- 220.9
- 10.0
- 441.7
YouTubeで検索
2007-08-12 06:38:24
DIVE!!(16to20/20)最初に戻る sm820882 音質重視設定メモ 44.1kHz abr 66 ジョイントステレオ 心理音響モデル 75分で良音質はこれが限界
うれしい wwww コスチューム ちょw山田ww うpありがとうございました。 wwwwwwwwww 可愛いなw そん...
- 2,523
- 502.0
- 00.0
- 110.4
YouTubeで検索
2011-09-26 15:41:07
ミクさんとおしゃべりができるはずだった。ミクさんの音響モデルを作ろうと思ったけどうまくいってる?それっぽくなってる?音響モデルの詳しい作り方はブログに書いておきます。細かな修正、面倒なことは一切省いてます。MMDAgentは音響モデルとミクさんと背景以外は初期設定のままです。前:sm15590570 マイリスト:mylist/27659308 解説ブログ:http://akihiro0105.blog55.fc2.com/blog-entry-12.html 音声データの追加と比較を行いました。sm15783850
てってってー 無調整でこれならかなり行けそうな予感 ???w 日本語でおk かわいいww ...
- 2,353
- 522.2
- 00.0
- 220.9
YouTubeで検索
2010-05-27 03:49:11
クライストの定理(ぶっちゃけAB作業用BGM)クライストの定理とは、音質テスト環境:BOSE Companion®5 multimedia speaker systemおよびaudio-technica AIR ATH-AD700 ヘッドフォン使用。frieve audioにて再生。カット周波数上限20kの下、形成される音響モデルを実験的に作業用BGMとする定理である。LAME320kbps柴田心理音響モデル仕様。3曲しか入れられなかったという・・・。1.私の魂、あなたの鼓動 2.千の敵 3.勇敢な歌 修正しておきました。しばらく前動画も残しておきますのでマイリスされてる方は移転よろしくお願いいたします。美麗な画像と音質をお楽しみください。タイトル英日逆転は通称ラルク方式です。ラルク作業用がこれでなぜか全て回避されているので。こちらにも採用いたします。
⇐ミスクライスト うわあああああこれは! と思って作業中断したらクライシスwwww 画質も音質...
- 2,231
- 200.9
- 00.0
- 602.7
YouTubeで検索
2012-03-15 17:55:11
ミクさんがしゃべってくれました。MMDAgentで使用できる音響モデルを作りました。今回はHTSの話者適応学習によって、ミクさんと自分の声を音響モデルにしました。作成した音響モデルはミクさんがatr503のa01からa50までの50文、自分の声はa01からa05までの5文の音声データを使用しています。MMDAgent:http://mmdagent.jp/ HTS:http://hts.sp.nitech.ac.jp/ 前回の話者依存モデル:sm15783850 マイリスト:mylist/27659308 会話の内容:http://akihiro0105.blog55.fc2.com/blog-entry-34.html 声が小さいです。次:sm17343388
ミク「か弱い女の子がモテると聞きまして」 50でこれはすごい 岸田今日子か ミクのVOiCELOID出ないかなぁー 声wwww あと自分の声を音響モデルにしたいとは思わないw 少ないサンプルで低クオリティの音響モデル作るぐらいなら、沢山のサンプルで高...
- 2,182
- 281.3
- 00.0
- 180.8
YouTubeで検索
2012-05-06 20:08:10
簡単にしゃべってくれるソフトを作ってみた。バージョン2前の動画のOpenJTalk_windowsがバージョンアップしました。音響モデルを自作するための機能を追加しました。また、セグメンテーションキットも配布します。ミクさんとデフォ子の声は2個の音声データから話者適応で作ってます。マイリスト:mylist/27659308 ソフトのダウンロード:http://akihiro0105.blog55.fc2.com/blog-entry-84.html
手動調教でも自然に喋らせるのは難しいから、手間考えればメリットはあるかもしれんが・...
- 1,987
- 180.9
- 10.1
- 150.8
YouTubeで検索
2011-11-09 11:40:16
MMDAgent ミクプラスv1.1改C8 CUTIE88この動画はv1.1改のプレイ画面をキャプチャしたものです。
今回は音響モデルとモデルチェンジのテスト
動きが激しいので途中で破綻する部分はあるけど動作テストということで勘弁してね
最新シナリオはversion1.6 sm28398133
CUTIE88 sm7916421QBww 「ちょびっツ」の「ちぃ」のコスプレか!? 声の高さはらぶ式<あにまさ<七葉<ラ...
- 1,762
- 171.0
- 00.0
- 341.9
YouTubeで検索
2011-10-20 21:22:22
【MMDAgent】「声」を変えてみた【テスト】MMDAgentで利用されているOpen JTalk用の音響モデルの自作方法がようやくわかったので作成してみました。
パラメータをいじったのではなく、音響モデルそのものから自作してます。
メイちゃんとの声質の違いが分かってもらえるかな?。
CUBE370 - MMDAgentのNAIP化計画
http://cube370.blog87.fc2.com/
過去に投稿した動画:mylist/10465382関西人みたいだ GJ! linux素人にはハードル高いんだよなあ すごいな! かわいいw きたぞ ば...
- 1,593
- 191.2
- 00.0
- 150.9
YouTubeで検索
2009-02-26 02:59:14
lame4.0 alpha14 test - ロートシルトRh-/anNina ver2ver2です。lame4.0 alpha14 320 心理音響モデル不使用 比較用→sm6266198
生きているという感覚だった だからきっと必要なものは いつも少しだけ届かない それに気...
- 1,366
- 352.6
- 00.0
- 90.7
YouTubeで検索
2011-10-03 17:35:36
ミクさんとおしゃべりができる?前回の動画sm15719099で聞き取りにくいとのことだったので、データ数の違いによる比較をしてみました。使わせてもらった音楽:sm7891634 モーション:sm15055946 デフォ子さんモデル:sm14527015 解説ブログ:http://akihiro0105.blog55.fc2.com/blog-entry-12.html MMDAgent:http://mmdagent.jp/ トークロイドやHANASUができる人が作ってくれないかなー マイリスト:mylist/27659308 話者適応学習による音響モデル:sm17257053
作詞作曲:ラマーズP ゴシックの初音ミクです。 歌:ななひら・色葉 てるてる ミクさんとおしゃべりができる? MikuMikuDance トークロイド とぎれなくなったね お分かりになりますか? どういたしまして。いつでも話しかけてくださいね。 キャ...
- 1,215
- 584.8
- 00.0
- 110.9
YouTubeで検索
2023-01-01 18:44:02
【AIシンガー御丹宮くるみ】きみに回帰線【NNSVS新音響モデル+HN-uSFGAN】祝・NNSVS論文公開! https://arxiv.org/abs/2210.15987
NNSVSの最新の音響モデルである NPSSMultistreamParametricModel(LF0, MGC, BAP に自己回帰のついた multistream モデル, 論文中の NNSVS-WORLD v4に相当)を試してみました. VUV は phonetic/musical context と LF0 にのみ依存するよう変更しています. ニューラルボコーダは従来からサポートされていた ParallelWaveGAN ではなく新しくサポートされた HN-UnifiedSourceFilterGAN(https://chomeyama.github.io/HN-UnifiedSourceFilterGAN-Demo/ ) を使用しました.
美麗なイラストは夏目悠李君のENUNUカバーで積極的に活動されている Froggy氏(@Froggy0m)にお願いしました.
原曲: 稲葉曇『きみに回帰線』Vo. 歌愛ユキ https://www.nicovideo.jp/watch/sm40230104
参考にした musicxml: 【AI式HALC@LOID】きみに回帰線【NNSVS新音響モデル】https://www.nicovideo.jp/watch/sm40231995
学習モデル生成, 歌声合成, ミキシング: 白丹太郎(@taroushirani)
イラスト: Froggy(@Froggy0m)ノイズ減ってる!すごい! 高音素敵...! うぽつです! イラストかわいい .
- 1,191
- 80.7
- 292.4
- 60.5
YouTubeで検索
2011-10-29 09:46:33
【MMDAgent】「声」を変えてみた その2【テスト】MMDAgentで利用されているOpen JTalk用の音響モデルの自作方法がようやくわかったので作成してみました。
パラメータをいじったのではなく、音響モデルそのものから自作してます。
メイちゃんとの声質の違いが分かってもらえるかな?
前回の動画(sm15938442)とは別の方式で作成したサンプリングデータを使用して、音響モデルを作成しています。前回よりはそれっぽい声になったかも。
ただ、ロボロボしさは逆に強調されているかも。
CUBE370 - MMDAgentのNAIP化計画
http://cube370.blog87.fc2.com/
過去に投稿した動画:mylist/10465382すげぇ 発声とともに字幕も出してほしい iikanji いいね。抑揚がちょっと違うけど うん、ミク...
- 1,064
- 70.7
- 00.0
- 121.1
YouTubeで検索
2023-08-31 02:56:02
「ChatGPTミク?」を作ってみたOpenAI APIでミクさん?のロールプレイさせてたら
依代が必要な気がしたので3Dプリンタで印刷しました。
なんとか8月31日に間に合いました。「ミクさん」と話しかけると返答してくれます
動画では完全には紹介しきれてませんが..
「ミクさん!誕生日おめでとうございます!」
動画補足
ChatGPTミク?のメインはPythonです。
Porucupineでウェイクワード「ミクさん」を検出ると「なあーに」と返答し録音を開始します。
録音ファイルは多少のチェックして
(あまり機能してないことが多くノイズを許容してWhisperAPIへ送ってしまい、
ミクさん?が不安いっぱいの返答を返し、申し訳なくなることも)
WhisperAPIにてSpeach-to-Textを実施
ノイズに対して発生しやすいテキストパターンの場合は中断します。
通過するとOpenAI APIにテキストを送ってミク?さんの返答としています。
参考サイト
maebariさん
https://piapro.jp/t/6mnk
ミクさん(DIVA Xのジャケットっぽい)
からあげさん
ミクさんの声でおしゃべりさせる方法
https://karaage.hatenadiary.jp/entry/2016/07/22/073000
MMDAgent & Project-NAIP wiki http://cube370.wiki.fc2.com/
自作音響モデル
動画内使用曲
HERO / 初音ミク
https://www.nicovideo.jp/watch/sm42419098
【初音ミク(40㍍)】 からくりピエロ 【オリジナルPV】
https://www.nicovideo.jp/watch/sm15022913
『グリーンライツ・セレナーデ』 / 初音ミク - Omoi
https://www.nicovideo.jp/watch/sm33480697
DECO*27 - 乙女解剖 feat. 初音ミク
https://www.nicovideo.jp/watch/sm34470195
初音ミクオリジナル曲 ハジメテノオト malo
https://www.nicovideo.jp/watch/sm1274898
KAZU P/源屋 さん
【初音ミク】Innocence(Long version)
https://www.nicovideo.jp/watch/sm1826238ほう gj よくやったお疲れ 16年記念グッズゲット済みか 現状はググった内容話してるだけな感じだからな・・・ これは拘束しないと危険だ GJ! なあに? おつ 声も姿もミクなの良いな こんな呪文でいいんだ 応答速度が速かったな 私はミクさんなのかフ...
- 953
- 161.7
- 252.6
- 50.5
YouTubeで検索
2012-03-14 14:58:42
ミクさんがしゃべってくれた。(仮)テスト。HTSによる話者適応適応学習から作成した音響モデル。ミクさんのサンプル音声データはatr503のa01からa50の50個を使用。音小さいです。マイリスト:mylist/27659308 本番できました:sm17257053
はなしてるの おばあちゃんみたいな声だなwwwwwwおっと誰か来たようだ・・・ ああ名...
- 938
- 111.2
- 00.0
- 80.9
YouTubeで検索
2011-12-10 17:30:50
MMDAgent ミクプラスv1.1改SN 淋しい熱帯魚この動画はv1.1改のプレイ画面をキャプチャしたものです。
今回は音響モデルとマイク持ち替えのテスト
前回よりもミクらしい声になったかな?
最新シナリオはversion1.6 sm28398133
淋しい熱帯魚 sm9194264おい、なんか居るぞw ネルはガムを踏んだ 1
- 802
- 30.4
- 00.0
- 81.0
YouTubeで検索
2022-03-27 00:52:02
【AI式HALC@LOID】きみに回帰線【NNSVS新音響モデル】祝・ウェザーステーション発売 & NNSVS新音響モデル実装!
NNSVSでsinsyの最近の論文を元に実装されたResSkipF0FFConvLSTMを使ってみましたが, 一部の滑舌が不明瞭になるなどまだ工夫が必要そうです(改良されたduration予測は大変良い).
原曲: 稲葉曇『きみに回帰線』Vo. 歌愛ユキ https://www.nicovideo.jp/watch/sm40230104
musicxml: https://bowlroll.net/file/276648 (pass: wahhoi)
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
timelag model: MDN, hidden_dim 32, num_layers 3, num_gaussians 1
duraion model: MDN, hidden_dim 256, num_layers 3, num_gaussians 1
acoustic model: ResSkipF0FFConvLSTM, conv_hidden_dim 1024, lstm_hidden_dim 256, ff_hidden_dim 2048, dropout: 0.0, bidirectional True
vibrato model: sine普通に歌えていて凄い うぽつ .
- 718
- 30.4
- 182.5
- 60.8
YouTubeで検索
2019-03-24 12:52:02
【自作音響モデル】綴よだか 音響モデルVer.01.01配布のお知らせ(追記)Ver.01.02上げました→sm34922581
綴よだか 音響モデルVer.01.01を配布します。
相変わらずカテゴリとタグに悩む・・。
前回:sm34792582
動画で使用したのはTypeBです。
TypeBは若干高めの声質ですが、イントネーションや声量があまり良くないかも。
TypeAのほうがイントネーション、抑揚ともに綺麗に発音できるかと思います。
「綴よだか」「紬たか」総合サイト : http://sn1572-nighthawk.sakura.ne.jp
Ver.01.01音響モデルDLはこちらから(TypeAとB両方同梱してます)
https://bowlroll.net/file/194485
立ち絵素材:im9070022
Twitter→@paopaoyumyum声が高くなって可愛くなった 期待してます。 きょどっているような声の震えがだいぶ落ち着いてきましたね。 上下差もすごい() 自作すごい 制作乙です 自作でこれはすごい うぽつ うぽつ
- 690
- 91.3
- 00.0
- 20.3
YouTubeで検索
2019-03-17 16:30:02
【自作音響モデル】綴よだかβ版です。
イントネーションやいろいろおかしい部分があるので今後精進します。
SHABERUを紹介するにあたり許可をくださったアキヒロ様、ありがとうございました。
立ち絵素材:im9070022
Twitter→@paopaoyumyum
「綴よだか」「紬たか」総合サイト : http://sn1572-nighthawk.sakura.ne.jpちゃんと腹から声出してる よだかでお星様って教科書に載ってたアレか
- 516
- 20.4
- 20.4
- 10.2
YouTubeで検索
2019-06-15 01:29:13
自作音響モデル「綴よだか」紹介動画ゆかりねっとで喋らせるテスト動画のつもりでしたが、冒頭以外は殆ど棒読みちゃんだったりします。
音響モデル 綴よだかのVer01.03を上げました。
こちらからDLできます(過去バージョン含)。
https://bowlroll.net/file/194485
導入方法などはこちら
「綴よだか」「紬たか」総合サイト : http://sn1572-nighthawk.sakura.ne.jp
立ち絵素材
im9247730
im9070022おつ 草 うぽつ おつ これを機械学習でできるのすごいなぁ うぽつ
- 495
- 61.2
- 00.0
- 00.0
YouTubeで検索
2023-04-21 19:00:00
【AIシンガー御丹宮くるみ】絶体暗星【NNSVSカバー】「カバーしてみたCollection」参加作品. 音響モデルは lf0 に sm41592261(NNSVS-WORLD v4) と同様の自己回帰モデルを, mgc/bap に DiffSinger 由来の拡散モデルを使用したハイブリッドモデル(NNSVS-WORLD v5)になります. ニューラルボコーダは引き続きHN-uSFGANを使用しています.
原曲: 稲葉曇 絶体暗星 https://www.youtube.com/watch?v=lYtZ5oMs3_8
参考にしたUST: coolkiwiii 【巡音ルカ】絶体暗星【VOCALOIDカバー】+VSQ/UST/SVP/MIDI sm39972572
使用した歌声データベース: 御丹宮くるみ歌声データベース http://onikuru.info/db-download
使用した音声合成ツール: NNSVS
学習モデル生成, 歌声合成, ミキシング: 白丹太郎(@taroushirani)
イラスト: Froggy(@Froggy0m)いい歌声すぎる .
- 452
- 30.7
- 61.3
- 20.4
YouTubeで検索
2019-04-06 19:22:04
【自作音響モデル】綴よだかのMinecraft Part0 【Ver01.02配布】前回→sm34837961
自作の音響モデルを棒読みちゃんで喋らせるテスト動画です
適切なタグがわからないので「非VOICEROID実況プレイ」で失礼します
音響モデル 綴よだかのVer01.02を上げました。
こちらからDLできます(過去バージョン含)。
https://bowlroll.net/file/194485
導入方法などはこちら
「綴よだか」「紬たか」総合サイト : http://sn1572-nighthawk.sakura.ne.jp
その他素材など
立ち絵 : im9070022
スキン : im9093346うぽ 見れば見る程かわいくみえてくる おつ 所詮敗北者じゃけぇ… 可愛い うぽつ
- 450
- 81.8
- 00.0
- 00.0
YouTubeで検索
2022-05-03 21:38:02
【AI式HALC@LOID】天泣【NNSVS+Hn-sinc-NSF】NNSVSのdevブランチで開発中のParallelWaveGANサポートを使用して, 音声の出力をPyWorldからNEUTRINOでも採用されているHn-sinc-NSFに変更してみました. 音響モデルはResidual F0を使った新しい音響モデルが学習データ不足で安定しないため従来のままです.
原曲: 稲葉曇 天泣 https://www.youtube.com/watch?v=1_8pQVYJtwQ
musicxml: https://bowlroll.net/file/276647 (pass: wahhoi)
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)うぽつです。 .
- 346
- 72.0
- 123.5
- 72.0
YouTubeで検索
2022-07-01 23:13:03
【ソフトウェアトーク企画】ユーザーモデル応援祭、開会です!◆主催はいつもギリギリを生きていますが、参加者さん方は無理せず楽しくやりましょう!
◆ユーザーモデル応援祭 開催告知動画 (sm40524476) のご視聴、いいね、広告、コメント、ありがとうございました!規約を守って作品投稿をお楽しみいただければ幸いです!
◆niconicoに作品を投稿して、「ユーザーモデル応援祭」のタグロックと、
告知動画 sm40524476 のコンテンツツリー親作品登録で参加完了!
振り返り生放送は7/18(月) 21:00から 開催予定です。
◆遅刻組の「ユーザーモデル応援祭」タグの使用は31日までOKです。
猛暑日が続いていますので、無理せず体と相談しながらの作品作りを!
◆追記:「SHABERU」につきましては、今回のレギュレーション対象には明記しておりませんが、ユーザー制作音響モデルのアクティブユーザーの方がいらっしゃるようであれば参加を黙認し、次回からレギュレーションに追加いたしますので、作品の投稿をお待ちしております!
また、「シロワニさんのつくよみちゃんトークソフト」につきましては、シロワニさんが開発した後継ソフトとしてつくよみちゃんが初期実装されている「COEIROINK」が存在しており、そちらがレギュレーション除外となるため、同様に対象外となります。ご了承ください。なん…だと!? うぽつ! 応援の仕方は色々あるもんね たすかる シロワニさんのつくよみちゃんTTSはなしなのか なぜSHABERUがいないんだ...。一応ユーザーモデルみたいなもんなのに...。
- 337
- 103.0
- 226.5
- 10.3
YouTubeで検索
2023-07-02 00:48:02
【AI式HALC@LOID】期待通り【NNSVSカバー】原曲: 稲葉曇『期待通り』Vo. AI音街ウナ sm42389178
参考にしたust: ばにらあいす氏 【黯冥ダスト】期待通り【UTAUカバー&ust配布】 sm42392026
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
---
新音響モデルで AI式HALC@LOID を学習させるには学習データ量が不足しており, 特に学習データにない長い音符で破綻しがちなので, 安定性を優先してより単純な自己回帰モデルを独自に実装しました(参考: NII の Xin Wang 博士の論文 https://ieeexplore.ieee.org/document/8341752 ). 2021 年頃に AI式HALC@LOID で使用していた RMDN に深い自己回帰入力を追加しただけですが, 以前は必要だった動的特徴量の推定が不要になるなど一定の効果はあるようです. Vocoder はまた前回 (sm42337928) と同じく ParallelWaveGAN(Hn-sinc-NSF) を使用しました.投稿早い .
- 315
- 20.6
- 72.2
- 20.6
YouTubeで検索
2020-01-13 15:20:02
【オリジナル音響モデル】紬たか 紹介動画オリジナル音響モデル(Open JTalk)の二人目「紬たか」が完成しました。
遊んでくださると嬉しいです。
※動画中に書き忘れていましたが、音響モデル登録後は棒読みちゃんだけではなく、SofTalkでも使えるようになります。
【紬たか】
音響モデル◇https://bowlroll.net/file/215731
立ち絵素材◇im10010237
【綴よだか】
音響モデル◇https://bowlroll.net/file/194485
立ち絵素材◇im9247730
■OpenJTalk SAPI(nakanohito様開発)のDLはこちらから
http://ime.nu/2sen.dip.jp/arcs/OpenJTalkSAPI_101.zip
音響モデル導入方法は動画よりこちらのほうが参考になると思います
https://ch.nicovideo.jp/blister55/blomaga/ar241174
「綴よだか」「紬たか」総合サイト : http://sn1572-nighthawk.sakura.ne.jp
BGM:魔王魂様わ^~い わーよだかちゃんだいぶ滑らかにしゃべるようになってる うぽつ うぽつ
- 281
- 41.4
- 31.1
- 41.4
YouTubeで検索
2023-06-11 01:22:02
【AI式HALC@LOID】レイニーブーツ【NNSVS-WORLD v4(自己回帰モデル)+ParallelWaveGAN】原曲: 稲葉曇『レイニーブーツ』Vo. 歌愛ユキ sm38927801
参考にしたust: ばにらあいす氏の ust https://lit.link/Vanilla9831
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
----
NNSVSの最近の音響モデルに関して得られた知見
・2021年頃のAI式HALC@LOIDで採用していたRMDNと比較して大量の学習データが必要. NNSVS-WORLD v4(自己回帰モデル)で1h, NNSVS-WORLD v5(拡散モデル)で2h以上
・学習データ量が足りないと音程の他に音量(低次のmgcが関係)も不安定になり音痴に聴こえる
・学習データ量が足りない場合は pitch-shift data augmentation (以下PSDAと省略)という手法で
学習データを拡張することで音程や音量が安定化させることができる(場合がある) (参考: https://github.com/nnsvs/nnsvs/blob/master/utils/pitch_augmentation.py )
・PSDA で学習データを拡張しても元の学習データ量が30分程度だと NNSVS-WORLD v5で良好な結果を得ることは難しい
・有声/無声の誤推定が目立つ場合は vuv_model から mgc に対する依存を外した方が良い
・新しく採用されたニューラルボコーダである HN-uSFGAN, SiFiGAN はどちらも素晴しい出力が得られるが, 学習データにリバーブ等のノイズが乗っている場合は ParallelWaveGAN(Hn-sinc-NSF)の方がノイズに対して堅牢である(気がする).
- 276
- 51.8
- 103.6
- 62.2
YouTubeで検索
2021-03-13 20:02:03
綴よだか 新音響モデル配布のおしらせ【OpenJTalk】新しく作り直しました。
ほんっと音沙汰なくてすいません!
3Dモデルも作り直したりいろいろやってたので順次公開していく予定です。
DLはこちらから→http://sn1572-nighthawk.sakura.ne.jp/distribution.html
立ち絵素材→im10710614
BGM:魔王魂様
紬たか→sm38457191- 254
- 00.0
- 52.0
- 10.4
YouTubeで検索
2024-01-15 23:59:02
【AIシンガー御丹宮くるみ】リレイアウター【NNSVSカバー】音響モデルは前回(sm42103805)のNNSVS-WORLD v5(DiffSinger由来の拡散モデル)ではなく, sm41592261 と同じNNSVS-WORLD v4(自己回帰モデル)を使用しました. ニューラルボコーダは SiFiGAN を使う予定でしたが, ブレスの金属音ぽいノイズが解決出来なかったため引き続き HN-UnifiedSourceFilterGAN を使用しています.
原曲: 稲葉曇『リレイアウター』Vo. 歌愛ユキ sm42576236
参考にしたust: ばにらあいす氏 【黯冥ダスト】リレイアウター【UTAUカバー&ust配布】 sm42580913
使用した歌声データベース: 御丹宮くるみ歌声データベース http://onikuru.info/db-download
学習モデル生成, 歌声合成, ミキシング: 白丹太郎(@taroushirani)
イラスト: Froggy(@Froggy0m)ここ凄いっ! .
- 226
- 31.3
- 125.3
- 20.9
YouTubeで検索
2013-07-24 02:21:26
「ウェアラブル電極」の説明に声を付けてみたOpen JTalkを使用しています。
話者適応学習の音響モデルのテストとして声を付けてみました。
しゃべってる内容とかは元動画のサイトに載っています。
元動画:http://jp.diginfo.tv/v/13-0058-r-jp.php
誰の声かわかるかな?
マイリスト: mylist/27659308ほー 1
- 216
- 20.9
- 00.0
- 10.5
YouTubeで検索
2023-02-28 13:48:02
【AIシンガー御丹宮くるみ】浮遊月光街【NNSVS新音響モデル+HN-uSFGAN】sm39078487のセルフリメイクです. 音響モデルとニューラルボコーダは前回(sm41845588)と同じく NPSSMultistreamParametricModel(NNSVS-WORLD v4相当)とHN-UnifiedSourceFilterGAN の組み合わせを使用しました.
曲: 稲葉曇『浮遊月光街』Vo. 歌愛ユキ https://www.nicovideo.jp/watch/sm34347007
参考にしたUST: 【櫻花アリス】浮遊月光街【UTAUカバー+UST配布】 https://www.nicovideo.jp/watch/sm34398772
使用歌声データベース: 御丹宮くるみ歌声データベース http://onikuru.info/db-download
学習モデル生成, 歌声合成, ミキシング: 白丹太郎(@taroushirani)
イラスト: 御丹宮くるみイラスト可愛い…! .
- 178
- 21.1
- 63.4
- 10.6
YouTubeで検索
2021-03-19 23:49:02
紬たか 新音響モデル配布のおしらせ【OpenJTalk】DLはこちらから→http://sn1572-nighthawk.sakura.ne.jp/distribution.html
立ち絵素材→im10713883
sm38414733←綴よだか
BGM:魔王魂様すごい はじめまして
- 123
- 21.6
- 21.6
- 00.0
YouTubeで検索
2023-02-25 03:09:07
【AIシンガー御丹宮くるみ】ひみつの小学生【NNSVS新音響モデル+HN-uSFGAN】sm39085000のセルフリメイクです. 音響モデルとニューラルボコーダは前回(sm41592261)と同じく NPSSMultistreamParametricModel(NNSVS-WORLD v4相当)とHN-UnifiedSourceFilterGAN の組み合わせを使用しました.
曲: 稲葉曇『ひみつの小学生』Vo. 歌愛ユキ https://www.nicovideo.jp/watch/sm36042320
参考にしたUST: ばにらあいす氏 https://lit.link/Vanilla9831
使用歌声データベース: 御丹宮くるみ歌声データベース http://onikuru.info/db-download
学習モデル生成, 歌声合成, ミキシング: 白丹太郎(@taroushirani)
イラスト: 御丹宮くるみ声澄んでて可愛い .
- 115
- 32.6
- 54.3
- 10.9
YouTubeで検索
1970-01-01 09:00:00
- 0
- 0nan
- 0nan
- 0nan
YouTubeで検索