November 2022

Uncategorized
解説 英語学習課題コース 月謝制53週間分

月謝制ですが(月に2500円)、53週分の課題が置いてあります。月謝制ではありますが、全ての課題が置いてありますので、自分のペースで勉強してください。 こちらから参加できます=>https://nippondream.mykajabi.com/offers/y5tu6M2L/checkout それでは、課題を見ていきます。WEEK3を例として使います。 [00] 今週使って覚える英語表現 "I'm gonna have to…" 最初の課題は、皆さんに使ってもらいたい表現を紹介します。この週はI'm gonna have to +動詞を紹介しました。本当に使える表現だけを紹介します。 こちらから参加できます=>https://nippondream.mykajabi.com/offers/y5tu6M2L/checkout [01] 20秒ディクテーションに挑戦 USA出身ELANさん 次の課題は、ディクテーションです。10秒ほどの自然な英語を聞いてもらって、書きとってもらいます。材料はPodcastのVoicyから、選びました。以下はエランさんの会です。 こちらから参加できます=>https://nippondream.mykajabi.com/offers/y5tu6M2L/checkout [02] 英作文(日本ではクリスマスはどのように祝いますか?) 英作文をしてもらいます。添削はできませんが、オンラインの先生などに直してもらってください。こちらをクリックすると、実際に課題が見れます。 https://nippondream.mykajabi.com/assessments/2147542986? [03] まずは聞いてみよう  "roll with the punches" [English in a minute] 次は、Voice of America のLearning Englishの企画から借りてきた、1分スキットを聞いてもらいます。この題材は、著者権フリーで、自由に使うことができるので、利用しています。 こちらから参加できます=>https://nippondream.mykajabi.com/offers/y5tu6M2L/checkout [04] 英文解釈 [English in a minute] 私が上のVoice of America 素材を解説します。 こちらから参加できます=>https://nippondream.mykajabi.com/offers/y5tu6M2L/checkout [05] 2ステップ音読練習 動画で [English […]

Read more
Uncategorized
データサイエンスについて

本日は自分がしているデータサイエンスについて書いてみます。 自分がデータサイエンティストをしていると言い出したのは、2年前に、コロナの影響で、会社が3か月パートタイムになったことがあり、転職活動のために、リンクトインのタイトルをデータサイエンティストに変えたのがきっかけです。マイクロソフト社の友人が、アドバイスしてくれました。彼女はマイクロソフト社のデータサイエンティストですが、私としている内容がそんなに違いませんでした。 A/Bテストと呼ばれていますが、自分の分野では大きく分けて、RCTとQEDがあります。RCTはrandomized controlled trialでQEDはQuasi-experimental designと言います。前者のほうが、厳密な実験です。後者は実験できないときに、使うメソッドで、厳密性が少し下がります(英語ではrigorが落ちると言います)。 ツイッターなどでは、まるでデータサイエンスをするには、数学がいると言われていますけど、色々で、これは、調べたわけではありませんが、おそらく、仕事の大部分がデータをいじることの場合が多いのではないかと思います。 データは分析できる形でもらえなくて、自分で色々とエディットします。これが色々と大変で、やっているうちに仕事の80%はこれになります。数学はいりません。 面倒な理由は私の分野では、分析は自分達が担当ですが、データを集めるのはIT系の会社がやります。SQLを使うので、データが複雑になり、複雑な形で、ポイっと渡されるわけです。しかし、複雑な形のままでは(relational tables)、分析ができません。 分析自体は、仕事の半分ぐらいは確かに統計モデルを使うので、統計モデルの知識がいります。しかし、統計モデルを使うという観点で考えると厳密な数学ではないと思います。数学は、統計モデルのアルゴリズムの正当化のために使われていると思うのですが、それはすでに、証明されていることなので、使う場面には、数学を使いません。 ソフトウェアを使うことが多いのですが、実際に、コーディングっぽいことをして、統計テストをすることがあります。そっちのほうが早い場合があるからです。その場合は、アルゴリズムをコードで自分で書きます。例えば、二つのグループを比べて、その二つの何かの平均がだいたい同じかどうかを判断するということがあるのですが、これは、適当に使えるソフトウェアがないので、自分で書きます。厳密には、前に書いたものを再利用します。 どうやって書いたかというと、アルゴリズムを探してきて、それを書くのです。 自分で書いたものは不安なので、何回も何回も正しいかどうかを確認します。 この部分はなんとなく、数学っぽいものを応用している感じですが、統計的なことで、確かに大学院で勉強したようなモデルを使うのですが(自分の場合は、multilevel modeling)、多くのプロジェクトでは%や単なる平均を使うことが多いのです。 というわけで、実際の仕事の世界ではデータサイエンスと言っても、泥臭い仕事が多くて、そのために数学がいるということではありません。 いるのは、絶対に間違わないぞという気合じゃないかと思います。 実際に社会に存在するデータサイエンティストの仕事をこなすために何が必要かと考えますと、まず無料のR-studio(とr)を自分のPCに入れて、いじるといいと思います。 でも自分は流行りのマシーンラーニングとか知りません。それをするのに数学がいるのかなと思いますが、よく知りません。

Read more