このうちの30%ぐらいは、統計学関係だと思うのですが(www.estat.usのほう)、多くのはこのブログです。

不思議なことにGOOGLEで英語発音と打ってもたどりつけない英語喉ブログなんですが、なんででしょうね。

http://www.google.com/search?hl=en&source=hp&q=%E8%8B%B1%E8%AA%9E%E7%99%BA%E9%9F%B3&aq=f&aql=&aqi=&oq

これは決定的な弱点かもしれない。リンクのほうよろしくお願いします。

webstat.jpg 

右から2番目がこの火曜日の結果ですが、これまでで最高の1130人でした。HITSという統計でみると、その4倍ぐらいです。一人につき、平均4回ぐらいクリックして、過去のBLOGなどを読んでいただいている、、、ということ?あるいは4回ぐらい見てくれているということかな。

www.estat.usのほうは、統計学とデータ分析について、私の15年ぐらいの経験をシェアしています。

私がよく知っている統計モデルはHLMとRASCH MODELです。統計モデルを説明するときは、自分も昔は分からなかったのだが、何が一体分からなかったのか、、、という根本的のところを意識して、説明を書いています。根本を考えていくと、私が統計学がわからなかった理由は二つ。

1.私が授業でとっていた統計モデルには、PARAMETER ESTIMATESの部分と、統計テストの部分があり、教授が説明している90%は後者(エラーの求め方)。この二つの領域の違いがよくわからなかった。教授がASSUMPTIONがどうのこうのと連呼するが、それは統計テストに関すること。この違いが分からなかった理由は、教授たちが、私がこの違いに混乱しているということを知らずに、教えていたことだろう。

あ、思いだした、大学院1年のとき、SEM(STRUCTURAL EQUATION MODEL)を教えるのに、「みなさん、すごいですよ、SEMはPREDICTORが相関しててもよいんですよ」と、、、とものすごくうれしそうに、スマイルしていた。分からんちゅーんじゃ。もちろん、今は分かる。さすがに。このアメリカ人の先生は、「自分の授業の目的は皆さんにやる気を与えること」と言っていて、なんか授業の最初にユーモアのある話をしていたのだけど、実際の話、やる気があって授業とっているんだから、無駄なことは何もいわんでくれと思って授業をとっていた。

2.いろいろモデルがあるが、結局は、GENERAL LINEAR MODELの家族の一員であるということ。だから、例えば、HLMとRASCHモデルというのがあるが、HLMをつかってRASCHモデルをすることができる。実際には、それをしない。HLMもRASCHモデルも、それぞれのソフトウェアが、目的によって、使い勝手がよいようにできているため。例えばRASCHモデルは学力テストのスコア化をするために、最も便利にできている。だから理論的にはHLMのソフトを使ってもRASCHモデルはできるのだけど、HLMは、学力テストのスコア化のために開発されたソフトではないので、非常に面倒になってしまう。

統計モデルが分かりにくい理由は、ソフトウェアの存在。HLMというソフトウェアがあり、RASCHのソフトウェアがある。だから、二つのモデルがぜんぜん違うように感じる。私がこの二つのモデルの理解を深めたのは、SASという同じ統計ソフトをつかって両者を試してみたとき。なーるほど、、、これら違うように見えたモデルは、この部分が同じで、この部分が違うんだ、、、と気づいた。それから、わざと、エクセルを使って、手計算的に、ソフトウェアででてきた数値を確認してみることで、理解を深めた。

あ、もう一つ理由があった。どちらのモデルも社会科学の中で出てきた。なにかを計ったりするためには、数理的なことだけでなくて、理論的にどうして、それがよいやりかたなのか?など、賢い議論をして、正当化していく。すると、公式にたどり着くまでにもうわけがわからなくなる。私が統計モデルが良く分かったと感じたのは、SASという統計ソフトのマニュアルを読んだとき。単なるソフトなので、経済学者でも、自然科学でも、社会学でもない人たちがマニュアルを書いているために、逆にいらんことがかいていない。

RASCHモデルが、たかが、LOGISTIC REGRESSION MODEL(OLSについで単純なモデル)だと知ったときは唖然とした。じゃあ、それならそうと言ってくれればよいじゃないか。OLSで独立変数をつかわずに走らせると、小学校でならった平均と同じになる、、、というのを知って愕然とした。なんで、それを最初にいってくれないの?と(実際は、独立変数をSPECIFYしないとPROCEDUREが走らなかったりするからだ、、、走るPROCEDUREもあるが、、、理論的には可能でないといけないのだけど、ソフトウェアを書いた人の気分?で理論的に可能なことが不可能だったりする。)

私は大学で英文科だったのだが、文系だったはずの自分が、なぜ統計やデータをやっているのか、分かりにくいが、アメリカに来たらそうなった。

高校の段階でコースを決めてしまうのは大問題だ。

そもそも、私は数学的なことが好きだというより、コンピュータで、さくっと答えを出したりするという過程がすきなのだと思う。

だから中学高校と、コンピュータを使わずに黒板で数学をされても、好きになれなかった。でも、あの当時、コンピュータプログラミングなどを使って、教えてくれてたら、NEAT!だなあ、という感じで、好きになっていたと思う。しかし、コンピュータなんてまわりになかった。初めてコンピュータを使った・買ったのは26才のときだ。

証明せよ、、、という問題などは、やはりノートに書いて考えると思うのだが、おそらく、こう言っただろう。「その問題は、ギリシャの偉い人によってすでに解決されているのでしょう。なんでわしが証明しないといかんのですか?」と。証明ずみなら、使ってみましょうよ、、と。

紙と鉛筆による受験制度に基づいた文系VS理系の分割は多いに問題あり。

英語喉オンラインコースへ飛ぶ(ニュースレター登録をお願いします)

Follow me!

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.