2012年8月24日金曜日
大きいデータは良いものだ(本当に?)
∧∧ 学会終了でーす
( ‥)
–( ‥)後半だけ参加したけど
やっぱ疲れるな
さて
以前、こんな人がいた。
分子系統学が信用できない。分岐学も信用できない。
∧∧
( ‥)なぜかというに
( ‥)単純に自分の思い描く
–□ シナリオと違う系統樹が
出てくるからだろうね
しばらく前、何年もたったある日、ひさかたぶりに出会ってみると、分子系統学の熱烈な支持者になっていた。
∧∧
( ‥)理由は?
(‥ )出てきた系統樹が自分の
シナリオに合っていたから
じゃねえかな?
分子系統学の支持者になったのではない。単に自分の思い描いていたシナリオを出力した研究にしびれた、と言うべきかもしれない。
∧∧
( ‥)悪いことではないですね
( ‥)自分の研究に都合の良い
–□ 研究やデータを引用する
それは論文生産という点
では当然だし、誰しも
やっていることなのだ
別にそれ自体は悪いこっちゃない。確かに我田引水の度合いがひどすぎてひんしゅくを買ったり、あるいは白い眼で見られることもあるが、ありっちゃありだ。少なくとも科学のルールには抵触していない。
*ただし、科学は実力と検証の世界なので、出来の悪い業績を作るとみんなから、めった切り、なます切りにされる、というだけの話(”めった切りにされる”、とは反対論文が多数出る、というわけで、ある意味、新たな業績のきっかけと貢献ではある。自分ではなく他人の、ではあるが)。
とはいえ、どこまで自覚的なのかなー、と思って探りを入れてみると、こんな返事が返ってきた。
核ゲノムの全塩基配列を比べたのですよ!!?? データは多い方が正しいに決まっているでしょう??
∧∧
( ‥)一見するとすごく
もっともなんですけどね
( ‥)でもさー遺伝子みたいにさ、
挙動がある程度分かっている
言い換えると分かっていない
ものを一括して、多ければ
良いはずだ、というの
すごく危険なのよね
異なる振る舞いをする部位を混ぜたり、挙動が分かっている部位と分かっていない部位を一緒にしたり、それを単純に、多ければ良い、と言うのは、しかも把握しないままに言うのは危険だ、という意味。
あるいは最低限こう?
ちょーっと不用心すぎやしませんか?
∧∧
( ‥)遺伝子重複どうします?
進化速度が違っている配列を
混ぜたらどうなります?
データを”きれいに”した時
何が起きているのでしょう?
( ‥)言い出したらきりないんだ
でも、ある程度分かっている
とはこういうリスクや考慮や
把握をせまられることなのだ。
分かっているは、挙動を把握せよ、という要請であるし、分かっていない部分もあるとは、今は良いがいずれ何か来るかもしれない、ということでもある。
∧∧
( ‥)でも、それを言ったら
あなたも同様なんですよ
(‥ )うん、うかつだったな
素人でさえ、すぐにこれだけ危うさに思い当たるのだ。研究者が何もしていないわけがない。
∧∧
(‥ )どんな状況で何が起きて
□– どう混ぜるとどんな誤謬が
生じるのか、それを防ぐ
方法は何か、一般に行われる
処理に潜む問題点は何か
根本問題その他
(‥ )論文が幾つも出ているわけだ
リサーチしなければならん
そうだ、すべては基礎の把握にある。そして以上のように問題点と対処方法、危険の指摘をする研究者がすでにいるのは当然。それは心強い。だがしかし、すべての系統解析者がそこまで踏み込むのかというと、それは必然ではない。
*まったく配慮していない人もいますよ、という意味(系統解析や遺伝子の振る舞いと影響。それを議論する/議論できる研究者と、解析法を利用する研究者。この両者が同じとは限らない。というか多くの場合、違うよね、という意味)。
∧∧
(‥ )...くだんの人は、、こういう
\– 危険に気がついていたの
でしょうかね?
(‥ )気づいてないだろう
気づいていたらあんな隙のあることは言わない。