先日、食べログ関係の裁判結果が
ニュースになっていたので
気になって調べちゃいました。

解説動画はこちら 


さて、最近こんな判決がニュースになっていました。

東京地裁は16日
グルメサイト「食べログ」の運営会社カカクコムに対し
3840万円の損害賠償金の支払いを命じる判決を出した。

気になってしまったので
二年前に作った
食べログの星を予測するモデルを
引っ張り出してきました。

当時の記事はこちら

さて、データも昔のデータが有ったので
そのまま流用してモデル作成です。

RandomForest
MAE :  0.08949504442045006
RMSE :  0.1153333553457383

download

精度としては
3.2と予測したら
実際が3.1 - 3.3くらいに落ち着くような
結果を出すモデルになります。

たまに大きく外れますが
まあ、誤差でしょう・・・。

これを踏まえて
今回の裁判を起こした側のお店のデータを取って
このモデルにかけてみました。

すると
スクリーンショット 2022-06-25 17.45.13

平均で0.18
最大0.4ほどずれる結果となりました。

予測よりも実測が全体的に低くなる
結果となりました。

download-1

誤差を見てみると
高い点を予測した方が
ズレが大きいですねー

download-2

予測モデルの検証では誤差が少ないものが
最頻値でしたが、この店舗のデータだと
結構外れていますね。


ここからは個人的な推測になりますが
この問題は一方的な意見のみを
見るべきではないと思っています。

採点アルゴリズムというのは
いわば企業秘密であり
秘伝のタレもようなものです
コーラの元みたいな。

他者に教える事は出来ないものであるので
いわば生命線となります。

これにいちゃもんつけて来た訳になるので
この際は白黒はっきりしてもらいたい訳です。

この手のアルゴリズムには
不正防止の観点から
有る程度の秘匿性を持って
運営を行う必要があります。

攻略できてしまったら
不正に点を釣り上げようとすることも
出来てしまう訳なので。

というわけで一方的に
食べログが悪いという判断はできません。

考えられる事象としては
・何らかの理由で故意に下げた
・不正の排除の結果下がった

というのが可能性としてあるのかなと思います。



おいしいお店はおいしく採点されるべきだし
おいしくないお店は
低くなっていないとおかしいです。

お店や食べログの利益は二の次
最優先に守るべきは
使うユーザー側の利益です。

ですので、裁判では
この点を白黒はっきりしてもらいたいですね。

今後もおもしろくなっていきそうです。

今回はこれまでです
それでは。