タグ形態素解析を含む動画:1件 1ページ目を表示
2024年4月29日 06時22分に生成された05時00分のデータです
2022-12-02 18:13:02
【にじさんじ】ライバーのネットワーク作ってみた【コメント分析】にじさんじライバーの配信コメントを分析して、ライバー間のコメントの雰囲気の近さを地図にしてみました。
vtuberの統計分析だと視聴回数とかスパチャ額のランキングが多くて、それはそれで面白いとして、自分は競争的なものじゃない分析したいなって思ったり。だから今回も、コメントの量は関係のないようにしてたりします。
→次は海外勢を混ぜて、期間も伸ばしてやってみようかと。あと笹は草に変換しますね。
※緑仙のチャンネルが2つなのに気づくの遅れたため、地図に2つあります。
※メンバーシップのスタンプは解析からは排除してます。
ーーーーーーーーーーーー
分析手法
・22年の8月から10月の3か月間のコメントについて、10回以上の配信やプレミア公開をしたライバーを対象
・チャットを収集し、形態素解析を行い単語の頻度を算出。頻度は出現回数÷コメント総数。(なお単語は名詞、動詞、副詞、感動詞、!、?など)
・集めた単語のうち頻度が0.01%未満のものはデータの軽量化のためカット。この時点で一人当たり2000〜2500語、全員で約8000語の単語が集まった。
・TF-IDFを使って特徴的な単語を増幅(IDFは1+log)、ライバー2人の間のcos類似度Θを算出し、これで近さR=10-Θ/9をとる。
・近さRの値が全体的に密集していたので、(2^R)/200で近さの差を広げた。
・ライバーAと近い順にその他のライバーB〜Zを並べて、一番近いライバーがすごい近かったら近さ上位6人と線をむすぶ。まあまあ近いなら上位4人、そこまでなら上位2人、近いライバーがいないなら1人と線を結ぶ。ライバーAを変えて全部やる。(だからネットワークで結ばれているのは近い上位だけ)
・結ぶライバーのセットとその近さがまとまったので、これをソフトGephiで自動でネットワークを可視化した(パラメータを微調整していい感じにばらけさせる)(このとき全ライバーが線で結ばれているとカオスな絵になる)
ーーーーーーーーーーーー
22.12.07_1万再生
参考:にじさんじの配信者の類似性をチャットデータからネットワークグラフにして分析する
https://qiita.com/fufufukakaka/items/9f73389e0ea0ba95307c
BGM: vivid (igrek-uさん)
編集: aviutl, ゆっくりMovieMaker4
解析: python (library: jamone→janome)
可視化ソフト:gephiめっちゃ平和じゃん 視聴者の分布なんだよな アンジュとベルさん繋がってないんやなぁ 別次元すぎてよくわからねー 面白かった!! やしチャイは無いのか カナカナも中々強くてな 笹木…? 詩子さんwンゴw 笹木は「笹」だもんな いい匂いしそう なんでやろ...
- 54,229
- 8911.6
- 1,3202.4
- 2400.4