ワードクラウドづくりにハマっております。
ワードクラウドは文章中で
出現頻度が高い単語を複数選び出し
その頻度に応じた大きさで図表化する手法のことで
文章の特徴を一目で見ることができると言うものです。
解説動画はこちら
Pythonでは
wordcloud
と言うライブラリがあるので
これを用いるとワードクラウドを簡単に作成できます。
インストール方法は
pip install wordcloud
これでライブラリがインストールされたら
必要なものとしては
文章をまとめたものが必要です。
スクレイピングや
形態素解析などして
集めて集計すればできます。
名詞や動詞など意味のあるものだけを残し
要らない助詞などは削ります。
単語と単語の間はスペースなどで
空けておきましょう。
ファイル化したら
ワードクラウドの作成です。
嵐の歌詞を集めて
ワードクラウドを作ってみましょう。
ワードクラウドは次のようなコードで作成できます。
ワードクラウドを作るには
フォントの指定が必要です。
日本語でやるには日本語対応のフォントが必要です。
上記の例はmacなので
Windowsの人は
C:/Windows/Fonts/
配下になると思います。
.ttc拡張子のファイルを指定しましょう。
フォントをうまく指定できたら
画像ファイルができるので
それを表示してみると
はい出来ました。
僕らを筆頭に未来、明日、きっとなど
すごく明るい未来が感じられる世界観の歌詞だと
見受けられますねーーー
1曲も知らないけどwww
こんな感じですぐに作ることができるので
めちゃくちゃ楽しいです。
今度は
米津玄師さんの歌詞でやってみましょう!!!
こうなりました。
あなた、笑う が
中心の世界観です。
嵐と比べてみると
人称の違いや
言葉のチョイスが対照的で面白いですね
・嵐は自分中心
・米津さんは相手想い
そんな歌詞なんだろうと思いますね。
Lemonしか知らないけどwww
非常に面白いし、理解しやすいので
表現方法として優秀です。
皆さんも
作ってみてはいかがでしょうか?
それでは
ワードクラウドは文章中で
出現頻度が高い単語を複数選び出し
その頻度に応じた大きさで図表化する手法のことで
文章の特徴を一目で見ることができると言うものです。
解説動画はこちら
Pythonでは
wordcloud
と言うライブラリがあるので
これを用いるとワードクラウドを簡単に作成できます。
インストール方法は
pip install wordcloud
これでライブラリがインストールされたら
必要なものとしては
文章をまとめたものが必要です。
スクレイピングや
形態素解析などして
集めて集計すればできます。
名詞や動詞など意味のあるものだけを残し
要らない助詞などは削ります。
単語と単語の間はスペースなどで
空けておきましょう。
ファイル化したら
ワードクラウドの作成です。
嵐の歌詞を集めて
ワードクラウドを作ってみましょう。
ワードクラウドは次のようなコードで作成できます。
from wordcloud import WordCloud from PIL import Image import matplotlib.pyplot as plt %matplotlib inline with open('arashi_list.txt', encoding='utf-8') as _f: text = _f.read() font_path = '/System/Library/Fonts/ヒラギノ丸ゴ ProN W4.ttc' exc_words = ['たち','みる','そう', 'ない', 'いる', 'する', 'まま', 'よう', 'てる', 'なる', 'こと', 'もう', 'いい', 'ある', 'ゆく', 'れる'] wordcloud = WordCloud(background_color='white', font_path=font_path, width=800, height=600, stopwords=set(exc_words)).generate(text) wordcloud.to_file('arashi.png') im = Image.open('arashi.png') plt.figure(figsize=(16,12)) plt.imshow(im) plt.tick_params(labelbottom=False,labelleft=False,labelright=False,labeltop=False) plt.tick_params(bottom=False,left=False,right=False,top=False) plt.show()
ワードクラウドを作るには
フォントの指定が必要です。
日本語でやるには日本語対応のフォントが必要です。
上記の例はmacなので
/System/Library/Fonts/フォルダを指定していますが
Windowsの人は
C:/Windows/Fonts/
配下になると思います。
.ttc拡張子のファイルを指定しましょう。
フォントをうまく指定できたら
画像ファイルができるので
それを表示してみると
はい出来ました。
僕らを筆頭に未来、明日、きっとなど
すごく明るい未来が感じられる世界観の歌詞だと
見受けられますねーーー
1曲も知らないけどwww
こんな感じですぐに作ることができるので
めちゃくちゃ楽しいです。
今度は
米津玄師さんの歌詞でやってみましょう!!!
こうなりました。
あなた、笑う が
中心の世界観です。
嵐と比べてみると
人称の違いや
言葉のチョイスが対照的で面白いですね
・嵐は自分中心
・米津さんは相手想い
そんな歌詞なんだろうと思いますね。
Lemonしか知らないけどwww
非常に面白いし、理解しやすいので
表現方法として優秀です。
皆さんも
作ってみてはいかがでしょうか?
それでは
コメントする