コラム 【食べログ アルゴリズムと統計学】
私は、PCが苦手。
仕事で使ってなかったので、何も出来なかった。
でも、専業主婦になってから、自治会やPTAでの必要に迫られて、
自力でワードとエクセルを覚えた。
食べログに写真をアップしたくて、画像の扱い方もw
しかし、食べログの根幹をなす『アルゴリズム』とやらについては、
未だ全く理解出来ていない。
統計学についてなら、大学の教養部でちょこっとかじった。
入門編程度の知識だけど。
そんな素人の感想だから、詳しいヒトからすれば噴飯モノかもしれないけど。
食べログのアルゴリズムって、根本的に、統計学に反してないか??
間違ってたら、ごめんなさい。
でも、統計学の基本って帰納法だと思う。
たくさんの標本を集めて、そこから事実を導き出す、みたいな。
で、その標本は多ければ多いほど信頼度が高まるし、
一定の数を超えていなければ、結果の有意性が判別出来ない。
対して、食べログの点数は、演繹法的に決められている。
50も100も口コミが集まる人気店ならともかく、
1件しか口コミのないお店にも、点数がついている不思議。
アルゴリズムによって求められた信頼度をモトに、
イチ個人=イチ標本の評価を普遍化しているからこその、不思議。
統計学とは真逆の方向性。
では、そのアルゴリズムって何?
少数の評価を多数に敷衍するコトを可能にするほどの、
数学的に立証された、確たるモノなんだろうか?
確たるモノにしては、度々変更があるのは何故なのだろう?
例えば数式のようなモノだとして、何か変数があるのかもしれない?
じゃあ、その変数を決めるのは誰がどうやって何を根拠に?
あぁ、素人がいくら考えても解らない・・・
ただ、言えるのは。
業者によるステマの排除という課題は、単なる入口部分。
統計学における、標本は対象の集団の中から無作為に選ばれるべき、
という初歩と同様に。
排除できれば、それでイイ。
その後の段階で、標本間の評価に軽重の差をつける必要はナイ。
よく、コンテストの採点などで、
専門家と一般審査員の票に点数の違いがあったりするけど。
それは、統計学的に正しくある必要がナイ場面だから。
単なる主催者の判断による、便宜上の基準で構わないから。
食べログのアルゴリズムも、それと同じなんじゃないかな?
軽重の差をつける必要はナイのに、食通度とやらで差をつけているのは、
それが便宜上必要だから。
統計学的に正しくはなくとも。
要するに、食べログの点数というモノは、そういう、云わば「遊びの数字」。
もしくは、「商売の数字」。
決して、「数学の数字」ではナイというコト。
だから、盲信せずに、「ふ~ん」くらいに接していればイイ、
と、素人なりに思っているのです。
あぁ、それにしても。
誰か詳しいヒト、出来れば食べログの担当者ご本人から、
スパッとした解りやすい解説を、聞いてみたい・・・
人気ブログランキング
に参加しています、クリックして頂けると嬉しいです♪♪
