ビッグデータの正体
少し前に読んだ本を紹介します。
ビッグデータに対する考え方みたいなものが網羅的に書かれた一般向けの本です。サラッと読むのにおすすめです。
本書の中で、「因果関係を特定する必要はなくて、相関関係を見つければそれで良い」という主張がありました。
世の中、因果関係で説明できないことは山ほどあるが、悲しいかな、人間というものは、原因がわからないとすっきりしない。
しかし因果関係に執着しないのが、ビッグデータの世界だ。重要なのは「理由」ではなく「結論」である。データ同士の間に何らかの相関関係が見つかれば新たなひらめきが生まれるのだ。
相関関係は、正確な「理由」を教えてくれないが、ある現象が見られるという「事実」に気づかせてくれる。基本的にはそれで十分なのだ。
例えば、膨大な電子カルテのデータから「オレンジジュースとアスピリンの組み合わせで癌が治る」ことが言えるなら、正確な理由はどうあれ、この組み合わせが癌に効くという事実の方がはるかに重要となる。
航空運賃の決まり方など詳しく知らなくても、航空券の買い時さえわかれば財布にやさしい。それで十分だ。
ビッグデータの世界では、ある現象の理由を何が何でも知る必要はない。データがすべてを物語っているからだ。
最近は因果推論が流行しているようですが、こんな考え方もあるんですね。
(因果推論についての一般向け書籍は、例えば下記)
Amazonでおすすめ商品を提示するだけであれば、たしかに因果関係まで考えなくてもいい気がします。
ファイナンスの分析は理論モデルに基づくものがほとんどなので、そもそも因果関係を問題にすることは少ないです。
大量のデータ(縦にも横にも)があれば、テクニカル分析(ただの相関関係に着目)のようなものであっても有効に機能するということでしょうか。
(テクニカル分析を本気でやっている人ごめんなさい。)