乙Py先生のプログラミング教室
初学者のためのプログラミング学習サイト

Pandas

水曜日のダウンタウンが大好きなので

勝手にグランプリ開催です。

2019年度の説の中で
誰が一番面白かったのかを決めたいと思います。

解説動画はこちら




さてまずは
2019年度の放送データですね

頑張ってデータ化したので
貼っておきます。
面白い日付プレゼンター
020190109ハッピーバースデーの歌 ちょっと長い説バカリズム
020190109霊感強い女 ブス説小木
020190109190cm以上の日本人に犯罪者いない説河合俊一
020190109コンビニ定員で実際にカラーボールを強盗に当てた事ある人 存在しない説田村亮
020190109かるたの「る」の札 やっつけ説伊集院光
020190109夜の10時半過ぎの新幹線 グリーン車に乗ってるサラリーマンの8割はエロ動画見てる説フット後藤
120190109オネエタレント 雰囲気が面白いだけで本当は何ら面白いこと言ってない説藤原
020190109「イマル」という名前 IMARUが最初説IMARU
020190109「ブンブン」サウンドシステム鳴らしてる車でかかってる曲 ダサい説Bose
020190109美味しいカレーを作れる人は カレー屋さんよりバーで出した方がいい説矢作
020190109小さい女性はエロい説矢口
020190109土砂崩れ止めとワッフル どっちが先なのかみうらじゅん
120190109浜田に下の名前で呼ばれる女性タレント巨乳説指原
120190109めちゃくちゃ喉が渇いてたらセンブリ茶でも気付かず飲める説高山一実(乃木坂46)
020190109親戚辿ったら 1人はAKB存在する説入山杏奈(AKB48)
020190109女芸人に「カワイイじゃないですか」って言うアイドル クソ説いとうあさこ
020190109インスタのフォロワー買ってる芸能人 意外と多い説重盛さと美
020190109パンツ穿き続け対決を今のダウンタウンにやって欲しい宮川大輔
020190109遊んでいた男ほど 娘に厳しくなる説高橋真麻
020190109俺はメガネをいっぱい持ってると思われてる説具志堅用高
020190109ハトの大きさ みんな同じ説つるの剛士
020190109同じスポーツやってる兄弟 弟・妹の方が強い説杉山愛
020190109車に熊出没注意のステッカー貼ってる人絶対フリートークつまんない説土田晃之
020190109浜田 収録合間の動きが怪し過ぎる説陣内智則
020190109「噂の!東京マガジン」日本一 白髪の多い番組説千原ジュニア
020190109コンビニのエロ本売り場が広い地域 原チャリが多い説千原せいじ
020190109いかがわしいお店のタイマー ほぼりんごの形説ロバート秋山
020190109あき竹城 私物に何でも名前 書いてる説濱口
0201901097は3画説ジミー大西
020190109先輩が帰ったあとの後輩 絶対 悪口言ってる説宮迫
020190109若手漫才師 間に耐えられない説富澤たけし
120190109漫才の客席に元カノがいたら間がズタズタになる説博多大吉
020190109芸能人のゴシップを一番知ってるの音声さん説コカドケンタロウ
120190109女性の好きな女性芸能人を聞くとちょっと自分に似ている人を挙げる説柳原可奈子
020190109松本 吉本の社長になろうとしてる説今田耕司
120190116芸人なら どんなにキツめの設定背負わされてもつい乗っかっちゃう説小藪
120190116モノマネ芸人だったら 初めてのモノマネでも伝言ゲームで最後まで伝えられる説ダイアン
1201901161つのメニューのみでやっている店どんなジャンルにも存在してる説春日
120190116ミスター押忍の「押忍」でBINGO出来る説春日
0201901301時間に1回泣かないといけない生活泣けるアイテムが充実していてもしんどい説サバンナ高橋
020190130クマ倒したジジイ-1GP春日
120190130ドッキリのネタばらし架空の番組名を言われてもつい知ったかぶりしちゃう説たむけん
020190130結局一番クサいモノ○○説たむけん
120190206ロケ中にタレントを撒くことなど容易説 第2弾サバンナ高橋
020190206自転車の上でも 人はなんとか生活できる説小宮
020190206ミスター押忍の「押忍!空手道」 第2弾博多大吉
120190213IKKOとチョコレートプラネット松尾、もはや身近な人でも声聞き分けられない説麒麟川島
020190213奇人芸人No.1決定戦ダイアン
020190213仙人みたいなおじいさんの笑い声「フォッフォッフォ」説たむけん
0201902202018年ドッキリにかけられた芸能人ランキング小峠
020190220悲鳴-1 グランプリ陣内智則
020190220日本一髪が長い男芸人、トム・ブラウン布川説アルコ&ピース
020190220DISIRE 合いの手選手権アルコ&ピース
120190227家に人が山ほど隠れていても意外と気付かない説サバンナ高橋
020190227芸人解散ドッキリ師匠クラスの方が切ない説小藪
020190227飲食店に貼ってあるサイン最古のモノはもはや真っ茶色説たむけん
020190227外国人に「浜田と松田どっちがゴリラに似てる」と聞いたら意外と松本と答えるんじゃないか説たむけん
120190306逆挨拶チャレンジ庄司
0201903064世代対抗リレーさらば青春の光 森田
020190306自分の楽屋であってもキス現場目撃したらとりあえず謝っちゃう説さらば青春の光 森田
020190306ガンコな汚れ-1グランプリアンガールズ田中
120190313「いい意味で」をつければどんな悪口でも怒られない説バカリズム
020190313未だにバイトしてる最も芸歴が長い芸人リットン調査団説小峠
120190313三つ巴 盛り上がる説パンサー
020190320しあわせあかつ計画説タイトル100個暗記できたら100万円たむけん
120190327愛煙家 喫煙所までの道のりがどんなに困難でも向かっちゃう説千鳥
020190327なにやら占い師に傾倒し始めた相方が改名を訴えてきても応じられない説小藪
020190327打ち合わせ相手の名前聞いた直後なのに答えられないようでは芸能人並びに社会人失格説チョコプラ
120190403「お前が歌うんかい!」のパターン、ツッコミ芸人ならどんな状況でも一発でツッコめる説ハリセンボン
020190403説教中の「帰れ!」額面通り受け取るわけにはいかない説ナイツ
020190403忘れられない不気味なファンレター、芸能人なら1つはある説たむけん
120190410早弁先生 第3弾麒麟川島
020190410アスリートが仕掛け人のドッキリ大根すぎて逆に面白いんじゃないか説 第2弾三四郎小宮
020190410達人であっても背後からの気配実際に感じること不可能説たむけん
020190424笑いや驚きで飲み物吹き出させるの現実にはかなり難しい説サバンナ高橋
120190424空気砲、色が付いてなければ不可避説チョコプラ
020190424立ちっぱなしと座りっぱなし、意外と座りっぱなしの方がしんどい説アルコ&ピース
020190424池谷直樹式の腕立て伏せ、池谷直樹が最強説アルコ&ピース
120190508新元号を当てるまで脱出できない生活麒麟川島
120190515日本生活が長い外国人でも、めちゃくちゃ驚いた時の第一声は母国語説霜降り明星
020190515ロッシー、何でも受け入れちゃいすぎておっかない説サバンナ高橋
020190515コワモテ男性、一度は「お前に娘はやらん」と言われたことある説たむけん
020190529街で母親と出会ってもめちゃくちゃよそよそしかったらそのうちスゴく似ている別人だと思い始める説小藪
020190529引っ張って温めるタイプの牛タン弁当の紐が実はパーティのクラッカーになっていても手前で気付きようない説小藪
020190529パチンコ屋店員の休日の過ごし方第1位、パチンコ説小藪
020190529どっちが正解かわからない言い争いの答えを電話で他人に確認して自分の意見が正解だったとき、電話を切ったあとの第一声「ほらー」説小藪
020190529マラソンで優勝したのにゴールの瞬間手を上げない選手などいない説小藪
120190529歌詞の中に出てくる髪型、ポニーテールがダントツ説小藪
020190529起きた時VRの世界だったらめちゃくちゃビックリする説たむけん
020190529めちゃくちゃ怒ればどんな生き物にも怒り伝わる説たむけん
020190529トゲトゲの首輪してるブルドッグ実在しない説たむけん
120190529クロスワードの本買う人、直近の予定ない説たむけん
120190529彦摩呂、マズイ料理もいい感じにディスれる説たむけん
020190529「駄々をこねる」大人がやっても有効説さらば青春の光森田
020190529松尾伴内の似顔絵、ほうれい線描かないわけにはいかない説さらば青春の光森田
020190529小学生が使う漢字ドリル「殺す」の例文は全て「息を殺す」説さらば青春の光森田
020190529「布袋」さんのあだ名100%あの布袋関連説さらば青春の光森田
020190529「ストロング」といえば?20代は「ゼロ」60歳以上は「小林」説さらば青春の光森田
020190529他人のパーカーのフードにこっそり小銭入れていっても1万円くらいまでバレないんじゃないか説さらば青春の光森田
020190605「俺に何か言わなきゃいけないことないか?」とカマかけられたら、ベタに余計なこと喋っちゃう説陣内智則
120190605キャイ~ン1日連動電流生活ずん飯尾
120190605ピッチャーとファーストがマジシャンだったら隠し球で軒並みアウトに出来る説かまいたち
120190612中継先にヤバめ素人が現れてもベテランリポーターなら華麗にさばける説陣内智則
0201906124世代対抗リレー第2弾霜降り明星
120190612説教食らってる時、あの色ナシ臭いアリ空気砲食らってもクサいとは言えない説たむけん
120190619IKKOワード言わせ合い対決サバンナ高橋
120190619プライベート大声選手権春日
1201906194の字固め女性に電話口で伝えるの不可能説スーパー・ササダンゴ・マシン
12019626後輩にめちゃくちゃキレたあと不機嫌な顔を見せづらい先輩の前でおちゃらけを演じなきゃいけない状況 地獄説小峠
02019626女子中高生の人気芸人ランキング、さすがにもうNONSTYLEランク外説平成ノブシコブシ徳井
12019626打ち合わせ中、隣の部屋からカレーの匂いを送り続けたら、その後全員カレー食う説かまいたち
12019626「墓場まで持っていく話」後期高齢者に頼み込んだら教えてもらえるんじゃないか説かまいたち
020190703一声かければ有名人呼び出せる素人、都会なら結構存在する説庄司
020190703おぼん・こぼんでも催眠術さえあれば仲直りできる説たむけん
020190717街中異種ビンゴ大会岡田
020190717そこそこ売れてるのに「あの人は今」系のオファーがきたらショックと不快が半々説麒麟川島
120190717人気がピッタリ3等分のトリオ芸人いない説小籔
120190724芸人なら自分のネタと同じ状況が現実に起きたら完璧にツッコめる説 第2弾陣内智則
120190724地方ならダウソタウソでも意外とバレずにロケできちゃう説ケンドーコバヤシ
120190724トンビがタカを生むにも限界ある説チョコプラ
120190724ナゾに大道具通路を歩かされて、向かいからシルクハットにステッキのコラおじさん風男性が歩いてきたら、めちゃ警戒しちゃう説チョコプラ
120190731大食王vs東大王「大食いクイズ」霜降り明星
020190731おばちゃんファンから逃走中サバンナ高橋
020190807汚部屋アイドル、ヤリにいき放題説サバンナ高橋
120190807鳥のフン、積極的に落とされにいくの難しい説千鳥
020190807一世帯しか存在しないのに跡継ぎがいない崖っぷちの名字、結構ある説たむけん
120190821決めゼリフが封じられた芸人の営業、地獄説ミキ
120190821"リアル“プロゴルファー猿""選手権"陣内智則
120190821色ナシ臭いアリ空気砲第3弾たむけん
020190904曲のサビでちょうど涙は難しい説 第3弾サバンナ高橋
020190904「すべらない話」のMVSトロフィー、絶対家に飾ってある説勝俣州和
020190904タクシー運転手の過去最長走行距離、のっぴきならない事情ある説小峠
120190911ニセ番組「説タイトル」逆算クイズたむけん
020190925ソフトクリーム買った直後に説教食らったら 、食べるわけにいかず溶けて無くなっちゃう説小宮
020190925サインが飾ってある店、よく見ると全く知らない謎の人のサインも紛れてる説庄司
020190925ウザ絡みして旦那を寝かさない女王決定戦ずん飯尾
020191023電話口で「その場で土下座しろ」とキレられても、さすがにしたことにして済ます説サバンナ高橋
020191023愛煙家芸人、タバコに火をつけた瞬間に血相を変えたスタッフから「相方が倒れた」と言われても、そのまま捨てることなくひと吸いはする説陣内智則
020191023「誰でも一つはすべらない話を持っている」なら、街の一般人でもギリ持っている説たむけん
120191030ドッキリ仕掛け人としてクローゼットに隠れてる時、色ナシ臭いアリ空気砲食らっても出ていくわけにはいかない説春日
120191030彦摩呂、海鮮丼のフタを開けて本物の宝石が入っていたらストレートに「宝石箱や」と言うはず説春日
020191030押忍10回クイズ春日
120191030ザ・グレート・カブキ、お茶に見せかけてお酢をドッキリ的に飲ませたらキレイに霧状に吹き出す説春日
120191030ハンバーグこねた手でスナック菓子の袋開けるの不可能説春日
0201910303つの競技でプロになったアスリートいない説春日
120191030クロちゃん、寝て起きてお花畑にいたら死んだと思う説小峠
120191030濡れたナスとイルカの感触一緒説小峠
120191030ビンタされたとこ、そのあと絶対触る説小峠
120191030デヴィ夫人、犬が1匹くらい増えていても気付かないんじゃないか説小峠
020191030ボトルキャップチャレンジ、このタイミングでアップしてるヤツおっかない説小峠
120191030「たむらけん○○」さんのあだ名、全員たむけん説たむけん
020191030TBSのライブラリーにある猪木のビンタだけでドレミファソラシド揃う説たむけん
120191030"歌詞の中で最も“盗んだモノ""バイク説"たむけん
020191030「Toshl」の「i→l」表記に親しんでるXファンなら「Hotel」を「ホテイ」と読む可能性も僅かながらある説たむけん
020191030スタミナ定食だいぶ逸脱したやつが出てきても文句言えない説たむけん
020191030ミニサラダ ミニが過ぎても文句言えない説たむけん


まずはこれをCSVファイルにしてもらい
それを読み込みします。

PythonのPandasで読み込んで
データフレームにしてみましょう。
import pandas as pd
file_path = 'data/水曜日のダウンタウンの説2019.csv'
df = pd.read_csv(file_path)

df.head()

面白い
日付プレゼンター
0020190109ハッピーバースデーの歌 ちょっと長い説バカリズム
1020190109霊感強い女 ブス説小木
2020190109190cm以上の日本人に犯罪者いない説河合俊一
3020190109コンビニ定員で実際にカラーボールを強盗に当てた事ある人 存在しない説田村亮
4020190109かるたの「る」の札 やっつけ説伊集院光

Pandasで読み込みすると
こんな感じのデータになります。

ここから集計をしていきます。

面白いフラグ0,1で
1が面白いとしています。

プレゼンター別にフラグ値別で集計し
打率を出していきます。

打率の計算方法は

面白かった回数(1の数) / 登場回数(0,1の合計)

としています。

また、登場回数として「打席」も設けます。

1回だけ出てそれが面白いだと
打率10割りになってしまうので
規定打席以上の人のみにします。

df3 = pd.crosstab(df['プレゼンター'],df['面白い']).sort_values([1],ascending=False)
df3['打席'] = (df3[1]+df3[0])
df3['打率'] = df3[1] / (df3[1]+df3[0])

これで準備が整いました。

規定打席5回以上として
最終的に打率のよかったプレゼンターは
・・・

・・・

・・・

ジャーン
面白い01打席打率
プレゼンター
春日37100.700000
小峠4590.555556
陣内智則4370.428571
たむけん188260.307692
サバンナ高橋73100.300000
小藪7290.222222
さらば青春の光森田6060.000000

オードリー春日氏に決まりました!!!!!

プレゼンターとしての登場回数10回
うち7回は(俺が)面白いと判定された
説を持って来ていたということで
見事優勝です!!!!!!

どんな説があったかと言うと

面白い日付
371201901161つのメニューのみでやっている店どんなジャンルにも存在してる説
38120190116ミスター押忍の「押忍」でBINGO出来る説
40020190130クマ倒したジジイ-1GP
106120190619プライベート大声選手権
139120191030ドッキリ仕掛け人としてクローゼットに隠れてる時、色ナシ臭いアリ空気砲食らっても出ていくわけに...
140120191030彦摩呂、海鮮丼のフタを開けて本物の宝石が入っていたらストレートに「宝石箱や」と言うはず説
141020191030押忍10回クイズ
142120191030ザ・グレート・カブキ、お茶に見せかけてお酢をドッキリ的に飲ませたらキレイに霧状に吹き出す説
143120191030ハンバーグこねた手でスナック菓子の袋開けるの不可能説
1440201910303つの競技でプロになったアスリートいない説

こんな感じの説が有りました。

独断と偏見による判定のため
異論は大いにあると思いますので

ぜひ上のデータを用いて
面白かったやつにフラグ付けしていただけると
ご自身でもできると思うので
ぜひやってみてください。

それでは。

はいどうもこんばんは乙pyです。

今日はニコニコ動画さんの
有料会員の推移が気になってしまったので
有料会員数の予測をしてみました。

解説動画はこちら


まずニコニコ動画さんの
最近の有料会員数ですが
決算などで発表されているので
そこからデータ化しました。
年(期) 会員数(万人)
2015-09 253
2015-12 254
2016-03 256
2016-06 256
2016-09 256
2016-12 252
2017-03 243
2017-06 236
2017-09 228
2017-12 214
2018-03 207
2018-06 200
2018-09 194
2018-12 188


さてこれをPythonを使って予測していきます。
最初に必要なライブラリの読み込みです。
from fbprophet import Prophet
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

次の会員数をデータ化します。
データはPandasのデータフレームにします。
df = pd.DataFrame({
    'ds': pd.to_datetime([
        "2015-09-01","2015-12-01","2016-03-01","2016-06-01",
        "2016-09-01","2016-12-01","2017-03-01","2017-06-01",
        "2017-09-01","2017-12-01","2018-03-01","2018-06-01",
        "2018-09-01","2018-12-01"])
    ,'y': [253,254,256,256,256,252,243,236,228,214,207,200,194,188]
} , index=pd.to_datetime([
    "2015-09-01","2015-12-01","2016-03-01","2016-06-01",
    "2016-09-01","2016-12-01","2017-03-01","2017-06-01",
    "2017-09-01","2017-12-01","2018-03-01","2018-06-01",
    "2018-09-01","2018-12-01"
]))
これでデータフレームの完成です。

一旦可視化をして推移を見てみましょう。
plt.figure(figsize=(12, 6))
plt.scatter(df.index, df['y'])
plt.xticks(rotation=70)
plt.show()
nico01

このような会員数の推移ですね。
2015年あたりをピークに
そこからは下降路線をたどっています。

この推移から未来を予測します。

予測にはFacebookの
Propfetというライブラリを用います。

モデルの呼び出しも簡単です。
#モデルの呼び出し
model = Prophet()
学習も1行で終わります。
#学習
model.fit(df)
学習させるにはコツが必要で
時間に該当するものを ts というカラムでTimestampにしておく
数値は y というカラムでデータフレームに定義しておく
必要があります。

ファイルを読み込んでデータフレームを作った際は
カラム名やカラムのデータ型を
Propfet用に合わせる必要があります。

次に予測です。

予測は未来3000日分としました。
このライブラリは日で計算されるようで
引数 periods に日数を入れてあげて
model.make_future_dataframe()という関数を
呼んであげます。

そうすると予測用のデータフレームが作られます。

最後にmodel.predict()で作ったデータフレームで
予測結果のデータフレームを作ります。
#予測
future = model.make_future_dataframe(periods=3000)
forecast = model.predict(future)
たったこれだけで未来予測が終わります。

使える変数は日付と数値だけと
変数が少ないので
簡易な予測にはもってこいのライブラリです。


最後に予測の結果を可視化しましょう。
# 可視化
model.plot(forecast) plt.show()
nico02

日での予測の結果はかなり上下動が激しい感じなので
周期性の方を見てみます。

model.plot_components(forecast)
plt.show()
nico03

はい
これだと綺麗に予測の結果が出ますね。

このままの下降ラインをたどると
2026年には有料会員数が0になるという結果がでました。

下振れが激しければ2024年でも
有料会員数が0になる未来もあり得るという予想結果でした。

あくまでも現状の数値を使っての予測のため
そのままの下降線をたどるということは
少ないかもしれませんが

施策次第では
V字回復もあり得るシナリオではあるので
これからのニコニコ動画さんの
巻き返しに注目したいところです。

頑張れニコ動!!!

はいどうも乙pyです。

先日8年間見ていた
モコズキッチンが終わってしまいました。

今回はそのモコズキッチンに関するデータのお話です。



モコズキッチンとは
2011年4月から8年間放送日本テレビ系列の
朝の情報番組「ZIP!」の料理コーナーで8時手前の3分間放送
この時間帯のF層を独占

俳優速水もこみち氏 通称「もこにき」による
オリーブオイルの多用や調味料の投下打点の高さ
手に入りにくい食材の乱用などで注目された
はちゃめちゃ料理エンターテイメント番組であった


人気若手俳優、速水もこみちさんが料理人として、毎日登場!
アドリブ満載、自然体の料理コーナー、
新感覚のキッチン・バラエティー (ZIP!公式サイトより引用) 


動画はこちら


桝太一アナの話では
全部で1896レシピ有ったそうです。

今回は少し欠けますが
1826レシピ分のデータを取得して
そのなかでのランキングを出しました。

なのでデータを料理する方法を
今回はやっていきたいと思います。

調理工程:
1.まずはデータを集める

日テレの公式サイトやFuluには
過去の動画やレシピがあるそうです
こういったところからデータを集めます。

手で頑張りたい方は
1レシピあたり20 * 1800回ほどのコピペをすることで
データを作ることができるかと思います。

データをプログラムで作りたい方は
クローラーを作成して頂くとちゃちゃっと
データが手に入ります。

Python
BeautifulSoup
requests
Selenium
ここら辺のライブラリがキーになりますので
ググって頑張ってみてください。

2.集めたデータを前処理する

手法としては
PythonとPandasを使ってデータ前処理をします。
1食材ごとに切り分けてカラムを作ります。
その食材があれば1 , なければ 0 として値を入れます。

いくら いちご
0            1
1            0
このような感じですね

これでカラムが食材と料理名になります。



3.前処理したデータで集計する

データフレーム化したデータを使っていきます

Pandasで

df[(df['カラム']==1)]['料理名'].count()

とすればカウント出来ます。

これをカラム分やるには

sum_dict = {}
for name in df.columns:
    sum_dict[name] = df[name].sum()

のように辞書型で集計してあげると良いでしょう。

最後に降順で辞書型の集計結果を表示すれば
どの食材が最も多く使われたのかが
導き出せます。

結果に関しては
ネタバレすると
面白くないと思うので
動画の方をご覧ください。

それでは



 

このページのトップヘ