コラム　【食べログ　アルゴリズムと統計学】

2016/10/18 02:03

私は、PCが苦手。
仕事で使ってなかったので、何も出来なかった。

でも、専業主婦になってから、自治会やPTAでの必要に迫られて、
自力でワードとエクセルを覚えた。
食べログに写真をアップしたくて、画像の扱い方もｗ

しかし、食べログの根幹をなす『アルゴリズム』とやらについては、
未だ全く理解出来ていない。

統計学についてなら、大学の教養部でちょこっとかじった。
入門編程度の知識だけど。

そんな素人の感想だから、詳しいヒトからすれば噴飯モノかもしれないけど。
食べログのアルゴリズムって、根本的に、統計学に反してないか？？

間違ってたら、ごめんなさい。

でも、統計学の基本って帰納法だと思う。
たくさんの標本を集めて、そこから事実を導き出す、みたいな。
で、その標本は多ければ多いほど信頼度が高まるし、
一定の数を超えていなければ、結果の有意性が判別出来ない。

対して、食べログの点数は、演繹法的に決められている。
５０も１００も口コミが集まる人気店ならともかく、
１件しか口コミのないお店にも、点数がついている不思議。
アルゴリズムによって求められた信頼度をモトに、
イチ個人＝イチ標本の評価を普遍化しているからこその、不思議。

統計学とは真逆の方向性。

では、そのアルゴリズムって何？

少数の評価を多数に敷衍するコトを可能にするほどの、
数学的に立証された、確たるモノなんだろうか？
確たるモノにしては、度々変更があるのは何故なのだろう？
例えば数式のようなモノだとして、何か変数があるのかもしれない？
じゃあ、その変数を決めるのは誰がどうやって何を根拠に？

あぁ、素人がいくら考えても解らない･･･

ただ、言えるのは。

業者によるステマの排除という課題は、単なる入口部分。
統計学における、標本は対象の集団の中から無作為に選ばれるべき、
という初歩と同様に。
排除できれば、それでイイ。
その後の段階で、標本間の評価に軽重の差をつける必要はナイ。

よく、コンテストの採点などで、
専門家と一般審査員の票に点数の違いがあったりするけど。
それは、統計学的に正しくある必要がナイ場面だから。
単なる主催者の判断による、便宜上の基準で構わないから。

食べログのアルゴリズムも、それと同じなんじゃないかな？

軽重の差をつける必要はナイのに、食通度とやらで差をつけているのは、
それが便宜上必要だから。
統計学的に正しくはなくとも。

要するに、食べログの点数というモノは、そういう、云わば「遊びの数字」。
もしくは、「商売の数字」。
決して、「数学の数字」ではナイというコト。

だから、盲信せずに、「ふ～ん」くらいに接していればイイ、
と、素人なりに思っているのです。

あぁ、それにしても。

誰か詳しいヒト、出来れば食べログの担当者ご本人から、
スパッとした解りやすい解説を、聞いてみたい･･･

人気ブログランキング
に参加しています、クリックして頂けると嬉しいです♪♪

写真版ぐるめ部長の『ほぼ高槻』グルメガイドvol.１