2016年11月13日日曜日
でかいと絶対に間違う仮説
∧∧
(‥ )嘘か本当か...
\− ヒラリーさんはデータ解析で
ここでこう演説すると
効果的だという結果を受けて
行動したんだけど
うまくいかなかった
という話があるね
(‥ )大統領選でまさかの
トランプ勝利だったから
予測は外れた!
データ解析の敗北だ!
とか言ってる人も
いるみたいね
でもしかし、トランプを支持していまーす、とおおっぴらに言えないような状況のアンケートで僅差だったことを考えれば
∧∧
( ‥)データ解析が
うまくいかなかった
というよりは
データが悪かったんじゃね?
( ‥)あるいはそもそも
−/ データの収集が
間違ってるか だな
そうなると解析以前の問題で、解析手段ではなくお前が希望的観測で物事を歪め過ぎなんだよ、お前達インテリは底抜けの馬鹿でしょ? と、それだけの話になる
∧∧
(‥ )でもそれだけでは
\− 説明つかないってことも
あるわけだよね
(‥ )ここで演説したら良いよ
という予想が外れた
って話はそういうもの
だろうな
今時はビッグデータというものが流行りだ。何をもってビッグデータと呼ぶのかはともかくとして、人は言うのである。大きなデータなんだから良いでしょう!!?? と
∧∧
( ‥)あなたも言われたよね?
相手の言うことを
胡散臭げに聞いてたら
北村さん! データは
大きければ大きいほど
良いでしょう??!! と
相手が
たたみかけてきたことが
(‥ )はははっ
そういう見解もあるけど
どうなんでしょうねえ?
と笑っておいたけどな
実のところ、その時は言わなかったが、ことはそう単純ではない。
例えば、データを巨大化させれば巨大化させるほど、答えが絶対に間違うということがあり得るのだ。
∧∧
(‥ )あれは…
\− なんと説明するべき
なんでしょうね
(‥ )そうだなあ
こんな説明が正しいのかは
審議が必要なんだけども
要するにこう答えればどう?
データを巨大化させると解析手段は解析の哲学、あるいは設計思想に最もそった解答を発見する。
これ自体は良い。これは単なる技術的な話だ。
解析手段には必ず設計思想なり哲学なり、基準が存在する。
これは絶対的に必要だ。
問題はである
∧∧
( ‥)現実は設計思想ではない
ここだよね
(‥ )設計思想とか哲学は
”現実はおおむね
こういう振る舞いを示す”
という方便でしか
ないのだ
もちろんこれ自体も実は問題ない。問題になるのは巨大なデータによって、”設計思想に最も沿った解答を発見できてしまう”、という点だ。
∧∧
(‥ )設計思想は方便で
\− 現実そのものではない以上
設計思想に最も沿った
解答とは
自動的に現実ではない
ということになる
(‥ )つまり絶対に間違う
ということになるのだ
この理解で良いのかは良くわからない。ただ
解析手段には設計思想があり、設計思想が現実でない以上、データの数を増やして答えを厳密化すればするほど、解答は設計思想に沿ってしまって現実から乖離し、絶対に間違う。
というのは道理にかなっている。
∧∧
( ‥)しかもこれ原理上
いかなる解析も逃れられない
ことみたいですよね?
(‥ )俺も詳しくは知らん
いずれは理解に
手を出すにしても
理解は保留のままだ
だがどうも聞いた限りではそう聞こえる内容であった。
∧∧
(‥ )でもこれを考えると
\− ビッグデータを用いた
選挙対策が失敗した
というのは
必然だということですか
(‥ )ビッグデータとか
ゴミですよゴミ
というか多ければ良いはずだ、と無条件に考えたのがおかしかったのだ。
実際、彼女を口説く時に小指の第一関節のしわの数を考慮にいたりしないだろう?
∧∧
( ‥)むしろ
重要なデータとは何か?
そこに当たりをつけて
取捨選択することが
大事なんである
(‥ )まあ主観的な方針が
大事だってことだな
∧∧
(‥ )...ヒラリー当選を信じた人や
\− ヒラリー確実と
報じたマスコミは
主観的にデータを
ゆがめてましたけどね?
(‥ )それはあれだろ?
トランプは悪い
悪いから落選する
そういう循環論法を
用いたからだろ?
これは、
真であるという設定で解析して出した答えは真理である
そういう主張だ。
この主張は正しい。ただしこの真理は真偽については、実のところ何も語っていない。
設定された真理から導かれた真理は何も語れないのだ。だがそれで真理を証明したとうそぶく。
こういうことをするから知識人というのは頭がいかれている。