写真版ぐるめ部長の『ほぼ高槻』グルメガイドvol.1

画像の無断使用はご遠慮ください。ヒトサラなどに食べログから提供された画像も含みます。地元のキュレーションサイトに結構使われてしまったので、こう書かざるを得ません(^^;)

コラム 【食べログ アルゴリズムと統計学】




私は、PCが苦手。
仕事で使ってなかったので、何も出来なかった。


でも、専業主婦になってから、自治会やPTAでの必要に迫られて、
自力でワードとエクセルを覚えた。
食べログに写真をアップしたくて、画像の扱い方もw


しかし、食べログの根幹をなす『アルゴリズム』とやらについては、
未だ全く理解出来ていない。


統計学についてなら、大学の教養部でちょこっとかじった。
入門編程度の知識だけど。


そんな素人の感想だから、詳しいヒトからすれば噴飯モノかもしれないけど。
食べログのアルゴリズムって、根本的に、統計学に反してないか??



間違ってたら、ごめんなさい。


でも、統計学の基本って帰納法だと思う。
たくさんの標本を集めて、そこから事実を導き出す、みたいな。
で、その標本は多ければ多いほど信頼度が高まるし、
一定の数を超えていなければ、結果の有意性が判別出来ない。


対して、食べログの点数は、演繹法的に決められている。
50も100も口コミが集まる人気店ならともかく、
1件しか口コミのないお店にも、点数がついている不思議。
アルゴリズムによって求められた信頼度をモトに、
イチ個人=イチ標本の評価を普遍化しているからこその、不思議。


統計学とは真逆の方向性。



では、そのアルゴリズムって何?


少数の評価を多数に敷衍するコトを可能にするほどの、
数学的に立証された、確たるモノなんだろうか?
確たるモノにしては、度々変更があるのは何故なのだろう?
例えば数式のようなモノだとして、何か変数があるのかもしれない?
じゃあ、その変数を決めるのは誰がどうやって何を根拠に?


あぁ、素人がいくら考えても解らない・・・



ただ、言えるのは。


業者によるステマの排除という課題は、単なる入口部分。
統計学における、標本は対象の集団の中から無作為に選ばれるべき、
という初歩と同様に。
排除できれば、それでイイ。
その後の段階で、標本間の評価に軽重の差をつける必要はナイ。


よく、コンテストの採点などで、
専門家と一般審査員の票に点数の違いがあったりするけど。
それは、統計学的に正しくある必要がナイ場面だから。
単なる主催者の判断による、便宜上の基準で構わないから。



食べログのアルゴリズムも、それと同じなんじゃないかな?


軽重の差をつける必要はナイのに、食通度とやらで差をつけているのは、
それが便宜上必要だから。
統計学的に正しくはなくとも。


要するに、食べログの点数というモノは、そういう、云わば「遊びの数字」。
もしくは、「商売の数字」。
決して、「数学の数字」ではナイというコト。


だから、盲信せずに、「ふ~ん」くらいに接していればイイ、
と、素人なりに思っているのです。



あぁ、それにしても。


誰か詳しいヒト、出来れば食べログの担当者ご本人から、
スパッとした解りやすい解説を、聞いてみたい・・・




人気ブログランキング
に参加しています、クリックして頂けると嬉しいです♪♪