OpenOffice Calcの相関係数

今私が使っている、OpenOfficeは2.3です。で、ヘルプを流し読みしてるときに気がついたんですが、correl関数って言う項目が。
マジで!? 単相関係数関数あるのかよ。っていうか、2.2の時は無かったですよね?
とりあえずヘルプを見る限りでは、excelのcorrrel関数と同様に、ピアソンの積率相関係数を求めるようで、これでcovar関数とstdeva関数の連係プレーから開放されますね。

ところで、一般に相関係数とだけ言う場合は、ピアソンの積率相関係数を指すわけですが、この関数がパラメトリック(この場合であれば、対象のデータが正規分布に従うという意味)を前提とした手法であることは、統計をかじった人間でもない限りあまり意識されないのかもしれません。
これに対して、ノンパラメトリックな手法における相関係数としては、スピアマンの順位相関係数、ケンドールの順位相関係数などがあるわけですが、確かにPCで手軽に適用できる点では積率相関係数に分があるのでしょう。現実的には偏った分布を形成しているデータの場合でも、パラメトリックな分析を行う余地は十分にありますしね。

ただそうは言っても、あまり各種の社会学の入門書などでは、調査の前提となる統計分析手法に触れることはないように思います。例えば、2変数の相関関係を調べるにしても、そこにはデータが数量データなのか、カテゴリカルデータなのか、といった前提があってこそ単相関係数をとるのか、クロス集計してクラメールの連関係数を取るのか、などといった判断が出来るわけです。

このブログをどれぐらいの数の学生が読んでいるかは、全く分からないのですが、間違っても相関係数が0.7や0.8と言った“良い”数字が出ても、相関関係と因果関係は別物であると言うことは忘れないで下さい。ましてや、自分が考えた説明変数が“因”であることの証明になるなどということは決して無いのです。

因果関係そのものの証明ができるかと言われると、ヒューム達が言うように「人間はりんごが落ちる所を認識できても、重力と言う因果関係そのものは認識できない」ので、また別の問題にはまり込むのですが・・。