はいどうも乙pyです。

先日8年間見ていた
モコズキッチンが終わってしまいました。

今回はそのモコズキッチンに関するデータのお話です。



モコズキッチンとは
2011年4月から8年間放送日本テレビ系列の
朝の情報番組「ZIP!」の料理コーナーで8時手前の3分間放送
この時間帯のF層を独占

俳優速水もこみち氏 通称「もこにき」による
オリーブオイルの多用や調味料の投下打点の高さ
手に入りにくい食材の乱用などで注目された
はちゃめちゃ料理エンターテイメント番組であった


人気若手俳優、速水もこみちさんが料理人として、毎日登場!
アドリブ満載、自然体の料理コーナー、
新感覚のキッチン・バラエティー (ZIP!公式サイトより引用) 


動画はこちら


桝太一アナの話では
全部で1896レシピ有ったそうです。

今回は少し欠けますが
1826レシピ分のデータを取得して
そのなかでのランキングを出しました。

なのでデータを料理する方法を
今回はやっていきたいと思います。

調理工程:
1.まずはデータを集める

日テレの公式サイトやFuluには
過去の動画やレシピがあるそうです
こういったところからデータを集めます。

手で頑張りたい方は
1レシピあたり20 * 1800回ほどのコピペをすることで
データを作ることができるかと思います。

データをプログラムで作りたい方は
クローラーを作成して頂くとちゃちゃっと
データが手に入ります。

Python
BeautifulSoup
requests
Selenium
ここら辺のライブラリがキーになりますので
ググって頑張ってみてください。

2.集めたデータを前処理する

手法としては
PythonとPandasを使ってデータ前処理をします。
1食材ごとに切り分けてカラムを作ります。
その食材があれば1 , なければ 0 として値を入れます。

いくら いちご
0            1
1            0
このような感じですね

これでカラムが食材と料理名になります。



3.前処理したデータで集計する

データフレーム化したデータを使っていきます

Pandasで

df[(df['カラム']==1)]['料理名'].count()

とすればカウント出来ます。

これをカラム分やるには

sum_dict = {}
for name in df.columns:
    sum_dict[name] = df[name].sum()

のように辞書型で集計してあげると良いでしょう。

最後に降順で辞書型の集計結果を表示すれば
どの食材が最も多く使われたのかが
導き出せます。

結果に関しては
ネタバレすると
面白くないと思うので
動画の方をご覧ください。

それでは