今回はとある映像コンテンツの
タイトルを調べてみました。

解説動画はこちら




ラグジュTVは凄まじく
素晴らしい映像コンテンツの
シリーズ物で1326本(動画作成時)
ありました。

さて調査方法ですが
次のような手順で行っています。

1.タイトルをスクレイピング
2.データ化
3.前処理(辞書作成,不要文字削除)
4.形態素解析
5.キーワードカウント

Pythonではスクレイピングや
形態素解析を簡単に行うことができます。

とあるサイトをスクレイピングするコードは
お伝えできないのですが、
形態素解析は janome ライブラリを用いて
タイトルをキーワードに分割し
その出現頻度でランク付けしました。


TOP41-50
41自ら
42スタイル
43彼氏
44よう
45男性
46全身
47濃厚
48敏感
49スレンダー
50興奮

TOP31-40
31カラダ
32美女
33
34旦那
35男根
36ランジェリー
37卑猥
38責め
39本能
40彼女



TOP21-30
21恍惚
22グラマラスボディ
23AV
24
25オイル
26必見
27性欲
28何度
29ボディ
30

口に出すのも恥ずかしい
言葉がたくさん並んでいますねーーーー

TOP20からは動画の方をご覧くださいませ

それでは。