はいどうも乙pyです。
先日8年間見ていた
モコズキッチンが終わってしまいました。
今回はそのモコズキッチンに関するデータのお話です。
モコズキッチンとは
2011年4月から8年間放送日本テレビ系列の
朝の情報番組「ZIP!」の料理コーナーで8時手前の3分間放送
この時間帯のF層を独占
俳優速水もこみち氏 通称「もこにき」による
オリーブオイルの多用や調味料の投下打点の高さ
手に入りにくい食材の乱用などで注目された
はちゃめちゃ料理エンターテイメント番組であった
人気若手俳優、速水もこみちさんが料理人として、毎日登場!
アドリブ満載、自然体の料理コーナー、
新感覚のキッチン・バラエティー (ZIP!公式サイトより引用)
動画はこちら
桝太一アナの話では
全部で1896レシピ有ったそうです。
今回は少し欠けますが
1826レシピ分のデータを取得して
そのなかでのランキングを出しました。
なのでデータを料理する方法を
今回はやっていきたいと思います。
調理工程:
1.まずはデータを集める
日テレの公式サイトやFuluには
過去の動画やレシピがあるそうです
こういったところからデータを集めます。
手で頑張りたい方は
1レシピあたり20 * 1800回ほどのコピペをすることで
データを作ることができるかと思います。
データをプログラムで作りたい方は
クローラーを作成して頂くとちゃちゃっと
データが手に入ります。
Python
BeautifulSoup
requests
Selenium
ここら辺のライブラリがキーになりますので
ググって頑張ってみてください。
2.集めたデータを前処理する
手法としては
PythonとPandasを使ってデータ前処理をします。
1食材ごとに切り分けてカラムを作ります。
その食材があれば1 , なければ 0 として値を入れます。
いくら いちご
0 1
1 0
このような感じですね
これでカラムが食材と料理名になります。
3.前処理したデータで集計する
データフレーム化したデータを使っていきます
Pandasで
df[(df['カラム']==1)]['料理名'].count()
とすればカウント出来ます。
これをカラム分やるには
のように辞書型で集計してあげると良いでしょう。
最後に降順で辞書型の集計結果を表示すれば
どの食材が最も多く使われたのかが
導き出せます。
結果に関しては
ネタバレすると
面白くないと思うので
動画の方をご覧ください。
それでは
先日8年間見ていた
モコズキッチンが終わってしまいました。
今回はそのモコズキッチンに関するデータのお話です。
モコズキッチンとは
2011年4月から8年間放送日本テレビ系列の
朝の情報番組「ZIP!」の料理コーナーで8時手前の3分間放送
この時間帯のF層を独占
俳優速水もこみち氏 通称「もこにき」による
オリーブオイルの多用や調味料の投下打点の高さ
手に入りにくい食材の乱用などで注目された
はちゃめちゃ料理エンターテイメント番組であった
人気若手俳優、速水もこみちさんが料理人として、毎日登場!
アドリブ満載、自然体の料理コーナー、
新感覚のキッチン・バラエティー (ZIP!公式サイトより引用)
動画はこちら
桝太一アナの話では
全部で1896レシピ有ったそうです。
今回は少し欠けますが
1826レシピ分のデータを取得して
そのなかでのランキングを出しました。
なのでデータを料理する方法を
今回はやっていきたいと思います。
調理工程:
1.まずはデータを集める
日テレの公式サイトやFuluには
過去の動画やレシピがあるそうです
こういったところからデータを集めます。
手で頑張りたい方は
1レシピあたり20 * 1800回ほどのコピペをすることで
データを作ることができるかと思います。
データをプログラムで作りたい方は
クローラーを作成して頂くとちゃちゃっと
データが手に入ります。
Python
BeautifulSoup
requests
Selenium
ここら辺のライブラリがキーになりますので
ググって頑張ってみてください。
2.集めたデータを前処理する
手法としては
PythonとPandasを使ってデータ前処理をします。
1食材ごとに切り分けてカラムを作ります。
その食材があれば1 , なければ 0 として値を入れます。
いくら いちご
0 1
1 0
このような感じですね
これでカラムが食材と料理名になります。
3.前処理したデータで集計する
データフレーム化したデータを使っていきます
Pandasで
df[(df['カラム']==1)]['料理名'].count()
とすればカウント出来ます。
これをカラム分やるには
sum_dict = {}
for name in df.columns:
for name in df.columns:
sum_dict[name] = df[name].sum()
のように辞書型で集計してあげると良いでしょう。
最後に降順で辞書型の集計結果を表示すれば
どの食材が最も多く使われたのかが
導き出せます。
結果に関しては
ネタバレすると
面白くないと思うので
動画の方をご覧ください。
それでは

コメントする