今回はとある映像コンテンツの
タイトルを調べてみました。
解説動画はこちら
ラグジュTVは凄まじく
素晴らしい映像コンテンツの
シリーズ物で1326本(動画作成時)
ありました。
さて調査方法ですが
次のような手順で行っています。
Pythonではスクレイピングや
形態素解析を簡単に行うことができます。
とあるサイトをスクレイピングするコードは
お伝えできないのですが、
形態素解析は janome ライブラリを用いて
タイトルをキーワードに分割し
その出現頻度でランク付けしました。
TOP41-50
TOP31-40
TOP21-30
口に出すのも恥ずかしい
言葉がたくさん並んでいますねーーーー
TOP20からは動画の方をご覧くださいませ
それでは。
タイトルを調べてみました。
解説動画はこちら
ラグジュTVは凄まじく
素晴らしい映像コンテンツの
シリーズ物で1326本(動画作成時)
ありました。
さて調査方法ですが
次のような手順で行っています。
1.タイトルをスクレイピング
2.データ化
3.前処理(辞書作成,不要文字削除)
4.形態素解析
5.キーワードカウント
Pythonではスクレイピングや
形態素解析を簡単に行うことができます。
とあるサイトをスクレイピングするコードは
お伝えできないのですが、
形態素解析は janome ライブラリを用いて
タイトルをキーワードに分割し
その出現頻度でランク付けしました。
TOP41-50
TOP31-40
TOP21-30
口に出すのも恥ずかしい
言葉がたくさん並んでいますねーーーー
TOP20からは動画の方をご覧くださいませ
それでは。
コメントする