キーワードHALC@LOID(NNSVS) を含む動画: 58件 ページ目を表示
2025年2月17日 07時06分に生成された05時00分のデータです
2位
2021-04-30 23:11:02投稿
- 2,762
- 90.3%
- 220.8%
- 210.8%
じゃんPのアイドルマスター 『樹海の糸』 春香ソロ(sm4914451)にNNSVSを使用して深層学習で合成した歌声を付けてみました.
● NNSVSを使用した深層学習版HALC@LOIDの作成方法
用意するもの: xbox360, アイドルマスターL4U, キャプチャボード, NNSVSの実行環境, (NVIDIAのGPU)
1. L4Uで「i」, 「kosmos, cosmos」, 「いっぱいいっぱい」を除く29曲をボーカル有り/ボーカル無しの2条件でキャプチャする(全部で58曲キャプチャする).
2. 1でキャプチャした音源からアカペラ音源を作成する. 位相を反転して足し合わせても良いし歌声りっぷなどのソフトを使っても良い.
3. musicxml形式で各曲のボーカルパートの楽譜を用意する. ニコニ・コモンズに投稿されている midi 音源や www 上に投稿されているピアノ譜などを参考にすると良い
4. 各曲の音素ラベルファイル(各音素がどのタイミングで発声されているか)を作成する. WavesurferまたはAudacityで手作業で作成するか, julius(segmentation-kit)またはSHIROを使って自動でラベリングしても良い
5. NNSVS の egs ディレクトリに含まれる pjs のレシピを参考にして自作音源のレシピを作成する. ofuton_p_utagoe_db, natsume_singing, oniku_kurumi_utagoe_db のレシピは各歌声データベースに合わせてカスタマイズされているので参考にしてはいけない
6. bash run.sh --stage 0 --stop-stage 6 を走らせて数時間~1日程度待つ春香さんの樹海の糸を新しい形で世に出してくれてありがとう… すげぇ 888888888888888888 名作に新たな命が宿ったな。 すごい技術とクオリティだ すごい GJ .
3位
2021-07-21 23:06:02投稿
- 2,144
- 30.1%
- 110.5%
- 70.3%
原曲: 稲葉曇『浮遊月光街』Vo. 歌愛ユキ sm34347007
参考にした ust: 【櫻花アリス】浮遊月光街【UTAUカバー+UST配布】sm34398772
学習モデル生成, 歌声合成, ミキシング: ひょこおじ
イラスト: かづき(@kAduk0).
4位
2021-07-11 18:13:03投稿
- 1,807
- 40.2%
- 271.5%
- 150.8%
第2回アイマス人力歌謡祭失格作品(レギュレーション違反). イラストはズブロカPに描いて頂いて候.
fftq氏のHALC@LOID sm1303096いいね おお ズブロカP!? 可愛らしい空だったGJ!
5位
2021-12-01 22:41:02投稿
- 1,787
- 30.2%
- 120.7%
- 110.6%
Visual M@ster 2021 遅刻作品 / 伴奏は "WISH/LUNASEA/カラオケ用" (https://www.youtube.com/watch?v=JI56Kz7Eu1M) から無断で拝借して候 / オリジナルキー+5 / HALC@LOID(NNSVS) - WISH(LUNA SEA)
良いね 良き感じですなぁ .
6位
2021-05-30 20:46:02投稿
- 1,720
- 20.1%
- 90.5%
- 100.6%
日本語歌唱の学習データで英語詞を歌わせるための習作. 映像は適当.
歌声はコンプ, EQ, リバーブ, ディレイをかけていますが, タイミングやピッチ補正はしておらず NNSVS の出力のままです.素晴らしい… .
7位
2021-12-08 21:40:02投稿
- 1,702
- 40.2%
- 130.8%
- 191.1%
元動画: タクヲP THE iDOLM@STER 天海春香「サンデイ」 sm6141655
嬉しい!!!新しい形でまた見れるなんて!!! また見れて嬉しい 当時の驚きが蘇る! .
8位
2021-02-13 21:20:00投稿
- 1,662
- 30.2%
- 50.3%
- 130.8%
深層学習による歌唱合成 / HALC@LOID-NN - Stay Gold(Hi-STANDARD) / お借りした演奏 https://www.youtube.com/watch?v=Z6SDOVF5n_Y
ほげ~ .
9位
2021-12-30 22:33:02投稿
- 1,510
- 90.6%
- 241.6%
- 140.9%
第3回アイマス人力歌謡祭参加作品 / 原曲: EasyPop ハッピーシンセサイザ【EasyPop/巡音ルカ GUMI】 sm12825985
参考にした ust: https://bowlroll.net/file/251497
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)千早はかなり似てる すごい…! 公式かと思った GJ これが新技術か AI力じゃねーか!タコ! GJ 割と違和感無い。 .
10位
2025-02-02 03:24:03投稿
- 1,238
- 20.2%
- 30.2%
- 30.2%
そうさ僕は狂ってんだ
原曲: r-906 まにまに / 初音ミク sm40349788
参考にしたust: スガゼリ 【重音テト】まにまに【UST配布】 sm40399195
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
---
Timelag model: MDNv2
Duration model: VariancePredictor
Acoustic model: NPSSMultistreamParametricModel
lf0_model: BiLSTMResF0NonAttentiveDecoder
mgc_model: BiLSTMNonAttentiveDecoder
bap_model: BiLSTMNonAttentiveDecoder
vuv_model: FFConvLSTM
Vibrato model: none
Vocoder: ParallelWaveGAN(Hn-sinc-NSF)ヒリヒリくる .
11位
2024-10-26 00:46:03投稿
- 1,142
- 10.1%
- 30.3%
- 30.3%
原曲: 稲葉曇 かたむすび https://www.youtube.com/watch?v=n9xlE973OMs
musicxml: https://bowlroll.net/file/326353 (pass: wahhoi)
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
---
Timelag model: MDNv2
Duration model: VariancePredictor
Acoustic model: NPSSMultistreamParametricModel
lf0_model: BiLSTMResF0NonAttentiveDecoder
mgc_model: BiLSTMNonAttentiveDecoder
bap_model: BiLSTMNonAttentiveDecoder
vuv_model: FFConvLSTM
Vibrato model: none
Vocoder: ParallelWaveGAN(Hn-sinc-NSF).
12位
2024-11-21 00:36:03投稿
- 1,115
- 20.2%
- 30.3%
- 30.3%
元動画: スーP アイドルマスター 春香 千早 「スマトラ警備隊」 sm11250006
うpおつ .
13位
2024-10-17 01:49:03投稿
- 1,111
- 20.2%
- 90.8%
- 40.4%
原曲: MV「シンカンセンスゴイカタイアイス」/ 初音ミク & GUMI & 歌愛ユキ sm44166253
参考にしたust: r__Em氏 https://bowlroll.net/file/325532
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
---
Timelag model: MDNv2
Duration model: VariancePredictor
Acoustic model: NPSSMultistreamParametricModel
lf0_model: BiLSTMResF0NonAttentiveDecoder
mgc_model: BiLSTMNonAttentiveDecoder
bap_model: BiLSTMNonAttentiveDecoder
vuv_model: FFConvLSTM
Vibrato model: none
Vocoder: ParallelWaveGAN(Hn-sinc-NSF)すごく合ってるー .
14位
2021-09-17 22:57:02投稿
- 1,086
- 20.2%
- 30.3%
- 70.6%
元動画: OGOP アイドルマスター春香「ワールズエンド・スーパーノヴァ」 sm2910223
原曲キー+9(オク上-3)古いのに新しい .
15位
2021-09-17 23:05:02投稿
- 993
- 10.1%
- 20.2%
- 30.3%
元動画: ヨルP 【1M】アイドルマスター春香×くるり「さよならリグレット」 sm5681329
原曲キー+7(オク上-5).
16位
2021-09-12 23:20:02投稿
- 988
- 20.2%
- 10.1%
- 50.5%
元動画: シーバスP 【アイマスMAD】 強く儚い者たち sm39325387
. .
17位
2025-01-22 00:15:04投稿
- 953
- 10.1%
- 50.5%
- 10.1%
歌詞はえきちのみ氏の書き起こし(https://note.com/ekichinomi/n/n11c1c90a11fa )を底本としvocadb(https://vocadb.net/S/254986/lyrics?lyricsId=166984 )の歌詞と自分が聞きとったものを統合しました.
2番のBメロの「天命」は「て」から始まる何らかの気象に関する単語のような気がしますが, 何度聞き返しても「テムメイ」にしか聞こえませんでした...
原曲: 稲葉曇 遷移一区画 https://soundcloud.com/inabakumori/senihitokukaku
musicxml: https://bowlroll.net/file/330438 (pass: wahhoi)
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
---
Timelag model: MDNv2
Duration model: VariancePredictor
Acoustic model: NPSSMultistreamParametricModel
lf0_model: BiLSTMResF0NonAttentiveDecoder
mgc_model: BiLSTMNonAttentiveDecoder
bap_model: BiLSTMNonAttentiveDecoder
vuv_model: FFConvLSTM
Vibrato model: none
Vocoder: ParallelWaveGAN(Hn-sinc-NSF).
18位
2024-12-08 02:01:03投稿
- 891
- 20.2%
- 30.3%
- 20.2%
原曲: 稲葉曇『アイペース』Vo. 歌愛ユキ sm44388570
参考にしたust: ばにらあいす氏【黯冥ダスト】アイペース【UTAUカバー&ust配布】 sm44393389
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
---
Timelag model: MDNv2
Duration model: VariancePredictor
Acoustic model: NPSSMultistreamParametricModel
lf0_model: BiLSTMResF0NonAttentiveDecoder
mgc_model: BiLSTMNonAttentiveDecoder
bap_model: BiLSTMNonAttentiveDecoder
vuv_model: FFConvLSTM
Vibrato model: none
Vocoder: ParallelWaveGAN(Hn-sinc-NSF)歌声素敵 .
19位
2025-01-12 01:07:03投稿
- 856
- 10.1%
- 40.5%
- 10.1%
原曲: 稲葉曇 渦巻ハナビ https://www.youtube.com/watch?v=e5d-DvD55OI
musicxml: https://bowlroll.net/file/329940 (pass: wahhoi)
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
---
Timelag model: MDNv2
Duration model: VariancePredictor
Acoustic model: NPSSMultistreamParametricModel
lf0_model: BiLSTMResF0NonAttentiveDecoder
mgc_model: BiLSTMNonAttentiveDecoder
bap_model: BiLSTMNonAttentiveDecoder
vuv_model: FFConvLSTM
Vibrato model: none
Vocoder: ParallelWaveGAN(Hn-sinc-NSF).
20位
2024-11-10 00:25:03投稿
- 849
- 10.1%
- 40.5%
- 40.5%
アイドルマスター 春香さんがアルバイトを始めましたベーリング海峡編
原曲: 稲葉曇 かにだいすき https://www.youtube.com/watch?v=KK9nXYdmkiM
musicxml: https://bowlroll.net/file/327100 (pass: wahhoi)
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
---
Timelag model: MDNv2
Duration model: VariancePredictor
Acoustic model: NPSSMultistreamParametricModel
lf0_model: BiLSTMResF0NonAttentiveDecoder
mgc_model: BiLSTMNonAttentiveDecoder
bap_model: BiLSTMNonAttentiveDecoder
vuv_model: FFConvLSTM
Vibrato model: none
Vocoder: ParallelWaveGAN(Hn-sinc-NSF).
21位
2022-02-14 22:50:02投稿
- 808
- 10.1%
- 111.4%
- 60.7%
原曲: ∴flower『紗痲』/ 煮ル果実 sm33974546
アレンジ: 稲葉曇 https://twitter.com/inabakumori/status/1110154553138118656
参考にした ust: 【ZOLA_PROJECT】紗痲【MMDボカロカバー+ust配布】 sm38910522
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0).
22位
2022-02-07 23:03:02投稿
- 785
- 50.6%
- 91.1%
- 70.9%
原曲: 稲葉曇 絶体暗星 https://www.youtube.com/watch?v=lYtZ5oMs3_8
参考にした ust: coolkiwiii 【巡音ルカ】絶体暗星【VOCALOIDカバー】+VSQ/UST/SVP/MIDI sm39972572
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
オフボーカル音源は spleeter ( https://github.com/deezer/spleeter ) で作成しています. 歌愛ユキの歌声は
spleeterとの相性が良いのかかなり綺麗に分離することができます(2022/6/12追記).ボーカルのないバージョンはどこに? 綺麗な曲だあ 人が歌ってるみたい、、、すごい 8888 .
23位
2024-11-06 00:21:03投稿
- 768
- 10.1%
- 40.5%
- 20.3%
原曲: 稲葉曇 歌愛ユキ『ループスピナ』 sm28759701
参考にしたust: half a head氏 https://half-a-head.tumblr.com/USTs
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
---
Timelag model: MDNv2
Duration model: VariancePredictor
Acoustic model: NPSSMultistreamParametricModel
lf0_model: BiLSTMResF0NonAttentiveDecoder
mgc_model: BiLSTMNonAttentiveDecoder
bap_model: BiLSTMNonAttentiveDecoder
vuv_model: FFConvLSTM
Vibrato model: none
Vocoder: ParallelWaveGAN(Hn-sinc-NSF).
24位
2022-03-27 00:52:02投稿
- 726
- 30.4%
- 182.5%
- 60.8%
祝・ウェザーステーション発売 & NNSVS新音響モデル実装!
NNSVSでsinsyの最近の論文を元に実装されたResSkipF0FFConvLSTMを使ってみましたが, 一部の滑舌が不明瞭になるなどまだ工夫が必要そうです(改良されたduration予測は大変良い).
原曲: 稲葉曇『きみに回帰線』Vo. 歌愛ユキ https://www.nicovideo.jp/watch/sm40230104
musicxml: https://bowlroll.net/file/276648 (pass: wahhoi)
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
timelag model: MDN, hidden_dim 32, num_layers 3, num_gaussians 1
duraion model: MDN, hidden_dim 256, num_layers 3, num_gaussians 1
acoustic model: ResSkipF0FFConvLSTM, conv_hidden_dim 1024, lstm_hidden_dim 256, ff_hidden_dim 2048, dropout: 0.0, bidirectional True
vibrato model: sine普通に歌えていて凄い うぽつ .
25位
2021-11-22 20:24:02投稿
- 687
- 30.4%
- 101.5%
- 81.2%
原曲: 稲葉曇『ハローマリーナ』Vo. 歌愛ユキ & 初音ミク sm39646734
参考にした ust: 【黯冥ダスト】ハローマリーナ【UTAUカバー&ust配布】 sm39649483
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)ブレス良い いいね .
26位
2021-01-03 14:41:02投稿
- 628
- 10.2%
- 81.3%
- 71.1%
深層学習による歌声合成のための習作. 伴奏は稲葉曇様のオリジナル(sm37198038)から, ust はばにらあいす様の黯冥ダストカバー(sm37199842)よりお借りしました.
.
27位
2022-05-20 19:42:02投稿
- 605
- 40.7%
- 101.7%
- 101.7%
Hn-sinc-NSFは学習データの音域から外れると著明に合成結果が悪くなるので今回はWorldで合成しました. 一部歌詞を改変しています.
原曲: ちいたな 『篝火』- IA - sm34128998
アレンジ: 稲葉曇 https://www.youtube.com/watch?v=2A46CwhV4aE
musicxml: https://bowlroll.net/file/277823 (pass: wahhoi)
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)うぽつです。 .
28位
2024-11-29 01:38:03投稿
- 604
- 10.2%
- 20.3%
- 20.3%
原曲: 稲葉曇 さかさま少女感 https://www.youtube.com/watch?v=n8O_gZ0Ebbs
musicxml: https://bowlroll.net/file/327898 (pass: wahhoi)
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
---
Timelag model: MDNv2
Duration model: VariancePredictor
Acoustic model: NPSSMultistreamParametricModel
lf0_model: BiLSTMResF0NonAttentiveDecoder
mgc_model: BiLSTMNonAttentiveDecoder
bap_model: BiLSTMNonAttentiveDecoder
vuv_model: FFConvLSTM
Vibrato model: none
Vocoder: ParallelWaveGAN(Hn-sinc-NSF).
29位
2024-12-24 23:52:03投稿
- 574
- 10.2%
- 10.2%
- 10.2%
原曲: 稲葉曇 レーダー https://www.youtube.com/watch?v=xyrUvwVpDRI
musicxml: https://bowlroll.net/file/328983 (pass: wahhoi)
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
---
Timelag model: MDNv2
Duration model: VariancePredictor
Acoustic model: NPSSMultistreamParametricModel
lf0_model: BiLSTMResF0NonAttentiveDecoder
mgc_model: BiLSTMNonAttentiveDecoder
bap_model: BiLSTMNonAttentiveDecoder
vuv_model: FFConvLSTM
Vibrato model: none
Vocoder: ParallelWaveGAN(Hn-sinc-NSF).
30位
2025-01-01 06:41:03投稿
- 513
- 10.2%
- 20.4%
- 10.2%
迎春
原曲: 稲葉曇 もち https://www.youtube.com/watch?v=QpKaP3oGBXE
musicxml: https://bowlroll.net/file/329371 (pass: wahhoi)
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
---
Timelag model: MDNv2
Duration model: VariancePredictor
Acoustic model: NPSSMultistreamParametricModel
lf0_model: BiLSTMResF0NonAttentiveDecoder
mgc_model: BiLSTMNonAttentiveDecoder
bap_model: BiLSTMNonAttentiveDecoder
vuv_model: FFConvLSTM
Vibrato model: none
Vocoder: ParallelWaveGAN(Hn-sinc-NSF).
31位
2024-11-17 00:14:04投稿
- 512
- 10.2%
- 40.8%
- 20.4%
原曲: 稲葉曇 歌愛ユキ『秘密音楽』 sm28276659
参考にしたust: half a head氏 https://half-a-head.tumblr.com/USTs
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
---
Timelag model: MDNv2
Duration model: VariancePredictor
Acoustic model: NPSSMultistreamParametricModel
lf0_model: BiLSTMResF0NonAttentiveDecoder
mgc_model: BiLSTMNonAttentiveDecoder
bap_model: BiLSTMNonAttentiveDecoder
vuv_model: FFConvLSTM
Vibrato model: none
Vocoder: ParallelWaveGAN(Hn-sinc-NSF).
32位
2021-08-16 23:50:02投稿
- 491
- 20.4%
- 102.0%
- 102.0%
原曲: 稲葉曇『ノンユース』Vo. 歌愛ユキ & 初音ミク sm35109167
参考にした ust: 【黯冥ダスト】ノンユース【UTAUカバー+ust配布】 (現在非公開)
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)かづきさんのイラスト合ってる .
33位
2021-08-27 19:36:02投稿
- 466
- 51.1%
- 81.7%
- 81.7%
原曲: 稲葉曇『ひみつの小学生』Vo. 歌愛ユキ sm36042320
参考にした ust: 【黯冥ダスト】ひみつの小学生【UTAUカバー+ust配布】 (現在非公開)
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)GJ のヮの のヮの .
34位
2021-10-14 22:48:02投稿
- 459
- 30.7%
- 92.0%
- 71.5%
原曲: 稲葉曇『ハルノ寂寞』Vo. 弦巻マキ sm38728089
参考にした ust: ばにらあいす氏(現在非公開)
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)すごい うぽつ .
35位
2022-06-05 15:57:02投稿
- 443
- 30.7%
- 132.9%
- 71.6%
原曲: 稲葉曇『とこしずめ』Vo. 星界 sm40564386
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)うぽつです。 GJ .
36位
2022-01-30 22:05:02投稿
- 441
- 30.7%
- 112.5%
- 71.6%
原曲: 稲葉曇『ポストシェルター』Vo. 弦巻マキ sm39963084
参考にした ust: ばにらあいす 【黯冥ダスト】ポストシェルター【UTAUカバー&ust配布】 sm39964733
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)GJ はや .
37位
2024-12-12 00:03:03投稿
- 438
- 10.2%
- 20.5%
- 30.7%
原曲: [GUMI] チーズケーキクライシス / TOKOTOKO(西沢さんP) sm36009455
参考にしたust: 千沢るう氏 【千沢露_Cinnamon】チーズケーキクライシス【UTAU COVER+UST】 sm36042087
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
---
Timelag model: MDNv2
Duration model: VariancePredictor
Acoustic model: NPSSMultistreamParametricModel
lf0_model: BiLSTMResF0NonAttentiveDecoder
mgc_model: BiLSTMNonAttentiveDecoder
bap_model: BiLSTMNonAttentiveDecoder
vuv_model: FFConvLSTM
Vibrato model: none
Vocoder: ParallelWaveGAN(Hn-sinc-NSF).
38位
2022-08-28 19:57:02投稿
- 426
- 51.2%
- 102.3%
- 40.9%
思い出してもらいたいな / Voc@loidM@ster祭り'22フライング参加作品
--
原曲: 稲葉曇『シンクタンク』Vo. 裏命 sm40978472
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)ハルカロイドと聞いて イラスト素敵です .
39位
2024-10-14 23:10:03投稿
- 409
- 10.2%
- 51.2%
- 30.7%
原曲: 稲葉曇『フロートプレイ』Vo. 歌愛ユキ sm41645109
参考にしたust: ばにらあいす氏 【黯冥ダスト】フロートプレイ【UTAUカバー&ust配布】 sm41646580
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
---
Timelag model: MDNv2
Duration model: VariancePredictor
Acoustic model: NPSSMultistreamParametricModel
lf0_model: BiLSTMResF0NonAttentiveDecoder
mgc_model: BiLSTMNonAttentiveDecoder
bap_model: BiLSTMNonAttentiveDecoder
vuv_model: FFConvLSTM
Vibrato model: none
Vocoder: ParallelWaveGAN(Hn-sinc-NSF).
40位
2023-02-20 01:11:02投稿
- 395
- 10.3%
- 51.3%
- 20.5%
ゆのすと申します。
蜂屋ななし様の『シャボン(sm35191636)』を
Heimatlos氏作成のAI式HALC@LOIDと一緒に歌わせていただきました。
Vocal:ゆのす(mylist/71936118)、AI式HALC@LOID(sm40995997)
Mix:やまやま(@yama2mix)
イラスト:かづき(@kAduk0)
音源、イラストで協力いただいた方々ありがとうございました。
普段はニコマスMADをつくってます。
つくったもの:mylist/62150623かっこよかった!GJ!
41位
2022-05-03 21:38:02投稿
- 389
- 71.8%
- 123.1%
- 71.8%
NNSVSのdevブランチで開発中のParallelWaveGANサポートを使用して, 音声の出力をPyWorldからNEUTRINOでも採用されているHn-sinc-NSFに変更してみました. 音響モデルはResidual F0を使った新しい音響モデルが学習データ不足で安定しないため従来のままです.
原曲: 稲葉曇 天泣 https://www.youtube.com/watch?v=1_8pQVYJtwQ
musicxml: https://bowlroll.net/file/276647 (pass: wahhoi)
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)うぽつです。 .
42位
2023-08-11 00:01:02投稿
- 353
- 185.1%
- 102.8%
- 41.1%
ボカコレ2023夏TOP100ランキング1位おめでとうございます.
原曲: 稲葉曇『リレイアウター』Vo. 歌愛ユキ sm42576236
参考にしたust: ばにらあいす氏 【黯冥ダスト】リレイアウター【UTAUカバー&ust配布】 sm42580913
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
---
NNSVS-WORLD v4(自己回帰モデル)と SemiMultistreamRDARMDN(自作のより単純な自己回帰モデル)をコンピングしてミックスしています.春香かわいい .
43位
2021-01-03 14:35:02投稿
- 329
- 30.9%
- 20.6%
- 61.8%
深層学習による歌声合成のための習作. ustおよび伴奏は耳ロボPのオリジナル(nm3611741)よりお借りしました.
他のPによる耳ロボ: ヨコハマP sm5346842 , アシスP sm12678961, パラP sm11892625よき これは良い .
44位
2023-07-02 00:48:02投稿
- 324
- 20.6%
- 72.2%
- 20.6%
原曲: 稲葉曇『期待通り』Vo. AI音街ウナ sm42389178
参考にしたust: ばにらあいす氏 【黯冥ダスト】期待通り【UTAUカバー&ust配布】 sm42392026
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
---
新音響モデルで AI式HALC@LOID を学習させるには学習データ量が不足しており, 特に学習データにない長い音符で破綻しがちなので, 安定性を優先してより単純な自己回帰モデルを独自に実装しました(参考: NII の Xin Wang 博士の論文 https://ieeexplore.ieee.org/document/8341752 ). 2021 年頃に AI式HALC@LOID で使用していた RMDN に深い自己回帰入力を追加しただけですが, 以前は必要だった動的特徴量の推定が不要になるなど一定の効果はあるようです. Vocoder はまた前回 (sm42337928) と同じく ParallelWaveGAN(Hn-sinc-NSF) を使用しました.投稿早い .
45位
2023-12-22 23:55:02投稿
- 320
- 20.6%
- 92.8%
- 41.3%
原曲: 稲葉曇『電気予報』feat. 初音ミク sm43089818
参考にしたust: 冬宮紀沙氏 【Cevio AIカバー+ust】電気予報【東北きりたん】 sm42882718
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
---
Timelag model: MDNv2
Duration model: VariancePredictor
Acoustic model: NPSSMultistreamParametricModel
lf0_model: BiLSTMResF0NonAttentiveDecoder
mgc_model: BiLSTMNonAttentiveDecoder
bap_model: BiLSTMNonAttentiveDecoder
vuv_model: FFConvLSTM
Vibrato model: none
Vocoder: ParallelWaveGAN(Hn-sinc-NSF)うぽつ .
46位
2021-09-14 22:38:02投稿
- 290
- 10.3%
- 72.4%
- 62.1%
原曲: 歌愛ユキ『うつしあそび』 sm31093977
参考にした ust: 【黯冥ダスト】うつしあそび【UTAUカバー+UST配布】 (現在非公開)
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0).
47位
2023-06-11 01:22:02投稿
- 285
- 51.8%
- 103.5%
- 72.5%
原曲: 稲葉曇『レイニーブーツ』Vo. 歌愛ユキ sm38927801
参考にしたust: ばにらあいす氏の ust https://lit.link/Vanilla9831
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
----
NNSVSの最近の音響モデルに関して得られた知見
・2021年頃のAI式HALC@LOIDで採用していたRMDNと比較して大量の学習データが必要. NNSVS-WORLD v4(自己回帰モデル)で1h, NNSVS-WORLD v5(拡散モデル)で2h以上
・学習データ量が足りないと音程の他に音量(低次のmgcが関係)も不安定になり音痴に聴こえる
・学習データ量が足りない場合は pitch-shift data augmentation (以下PSDAと省略)という手法で
学習データを拡張することで音程や音量が安定化させることができる(場合がある) (参考: https://github.com/nnsvs/nnsvs/blob/master/utils/pitch_augmentation.py )
・PSDA で学習データを拡張しても元の学習データ量が30分程度だと NNSVS-WORLD v5で良好な結果を得ることは難しい
・有声/無声の誤推定が目立つ場合は vuv_model から mgc に対する依存を外した方が良い
・新しく採用されたニューラルボコーダである HN-uSFGAN, SiFiGAN はどちらも素晴しい出力が得られるが, 学習データにリバーブ等のノイズが乗っている場合は ParallelWaveGAN(Hn-sinc-NSF)の方がノイズに対して堅牢である(気がする).
48位
2021-11-13 00:24:02投稿
- 273
- 41.5%
- 93.3%
- 62.2%
原曲: 稲葉曇『アンチサイクロン』Vo. 歌愛ユキ sm35909360
参考にした ust: ばにらあいす氏(現在非公開)
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)調声すごい GJ .
49位
2022-01-16 22:16:02投稿
- 258
- 31.2%
- 103.9%
- 62.3%
原曲: 稲葉曇 歌愛ユキ『ツクリカケノ心象』 sm30117882
参考にした ust: あめころもるち゛ 【飴音わめあ】ツクリカケノ心象【UTAUカバー+UST配布】 sm30182652
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)春香の歌声がすごい うぽつ .
50位
2024-05-14 23:43:04投稿
- 225
- 31.3%
- 73.1%
- 52.2%
原曲: 稲葉曇『私は雨』Vo. 歌愛ユキ sm43679339
参考にしたust: ばにらあいす氏 【黯冥ダスト】私は雨【UTAUカバー&ust配布】 sm43680466
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
---
Timelag model: MDNv2
Duration model: VariancePredictor
Acoustic model: NPSSMultistreamParametricModel
lf0_model: BiLSTMResF0NonAttentiveDecoder
mgc_model: BiLSTMNonAttentiveDecoder
bap_model: BiLSTMNonAttentiveDecoder
vuv_model: FFConvLSTM
Vibrato model: none
Vocoder: ParallelWaveGAN(Hn-sinc-NSF)パンダさそ〜 パンダたそ〜 .
51位
2023-08-20 02:29:03投稿
- 208
- 2612.5%
- 104.8%
- 41.9%
原曲: ヨルシカ - 言って。(Music Video) https://www.youtube.com/watch?v=F64yFFnZfkI
参考にしたust: ばにらあいす氏 https://lit.link/Vanilla9831
オフボーカル音源: 【生音カラオケ】言って。 / ヨルシカ【Instrumental / Off Vocal】https://www.youtube.com/watch?v=Ao9K0RFBjXQ
学習モデル生成, 歌声合成, ミキシング: Heimatlos
イラスト: かづき(@kAduk0)
---
HN-uSFGANの学習に失敗してブレスが有声化けしてしまうため, ParallelWaveGAN(Hn-sinc-NSF)の出力と適宜コンピングしています..