回 | 主題 | コマシラバス項目 | 内容 | 教材・教具 |
1
|
授業概要・記述統計
|
科目の中での位置付け
|
学期最初の授業であることから、まずは統計学の授業全般の運営の仕方を確認する。また、最も基本的な、データの定義と種類、変数の定義と種類(質的データ、量的データ)、中央値(平均値、メジアン、モード)、データの分散(分散、標準偏差、四分位数)を表す記述統計の定義と計算方法を学習する。この授業では、基本的は統計手法や計算方法を取得することはもとより、最終的には勘や感覚で物事を考えるのではなく、統計的な物事の見方を習得することを目標とする。このコマでは、この学期を通してこの授業に必要な事項(LiveQの使い方、ポータルにアップロードされている教科書、期末テスト、電卓の使用、RStudio Cloudのアカウントの作り方)について確認する。LiveQは、無料のオンラインサービスで、これを使って授業中に手を上げることなく自由に質問できる。教科書はオンラインで無料公開されている統計の教科書をポータルにアップロードしてアクセスできるようにしてある。また、毎週授業後にManaba上で練習問題を自分でやってみて、計算方法や概念を理解できているかを確認する。
|
テキスト 統計学入門③5~23、講義用パワーポイント
|
コマ主題細目
|
① 授業概要 ② 変数 ③ 記述統計
|
細目レベル
|
① 統計学の全体の授業の進め方について一緒に確認する。まずポータルにアップロードしてある教科書へのアクセスの仕方を確認する。この教科書に載っていないことも講義内容に含まれるが、それらの内容な講義中に使用するパワーポイントスライドで補う。成績(期末テスト、課題、アンケート回答)について、それぞれの配点などを確認する。まず、期末テストでは、オープンノートで、計算機の使用可能あることを確認する。さらに、Rを使い、検定などを行った結果とその解釈を行う課題について確認する。また、アンケートを回答して、それが今後講義内で使用するデータになることを確認する。この授業では、授業中いつでも質問できるように、LiveQという無料オンラインサービスを使用するため、LiveQの使い方を説明する。
|
② 変数の定義とタイプを学習する。まず、変数とはデータを考える上で重要な概念で、物事の特徴を表すものであり、2つ以上の測定された値を持っているものであることと学ぶ。そして、質的データは、カテゴリ変数と呼ばれる変数で構成されている。そして、カテゴリ変数には名目変数と順序変数があることを学ぶ。名目変数は、職業や血液型など、カテゴリがはっきりしているものである。そして、順序変数は、マラソンの順位や好きなものの順位など、順序は重要だがその間隔は重要ではない変数である。さらに、量的データは連続変数で構成されており、その連続変数には間隔変数と比例変数があることを学ぶ。間隔変数は、間隔が一定である(と仮定されている)もので、知能指数や摂氏温度などがあることを学習する。
|
③ このコマでは、基本的な記述統計の定義と計算方法を学習する。具体的にはまず、変数の中央値の定義を学び、中央値として、平均値、メジアン、モードがあることと、それぞれの計算方法を学ぶ。平均値は、変数の平均の値である。メジアンは、測定値を小さい方から大きい方に並べたときに、中央に位置する値を指す。そして、モードは最も頻繁に測定された値を指す。これらの値について、架空のデータを使い実際に計算してみる。さらに、データがどのように分布しているのかを表す値として、偏差値、分散、標準偏差、四分位数があることとそれぞれの計算方法を学び、実際に計算してみる。偏差値は、それぞれの測定値が平均値からどれほど離れているのかを指す値で、分散はそれを平均した値である。そして標準偏差は、分散を元の測定値の尺度に戻した値を指す。四分位数は、測定値を小さい方から大きい方に並べたときに、25%、50%、75%のポイントにある値を指す。
|
キーワード
|
① 授業概要 ② カテゴリ変数 ③ 連続変数 ④ 中央値 ⑤ 分散
|
コマの展開方法
|
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
|
小テスト
|
「小テスト」については、毎回の授業終了時、manaba上において5問以上の、当該コマの小テスト(難易度表示付き)を実施します。
|
復習・予習課題
|
予習: 教科書の第1章(5~15、19~22ページ)を読んで、中央値と分散の定義を確認しておく。復習:変数(カテゴリ変数、名目変数、順序変数、間隔変数、比例変数)の定義、データの種類(質的データ、量的データ)の定義、それぞれの具体例を再度確認し、理解しておく。さらに、基本的な記述統計の中央値(平均値、メジアン、モード)の定義と計算方法を再度確認し、理解しておく。そして授業中に解いた例題を自分自身でもう一度解いてみる。記述統計の分散(偏差値、分散、標準偏差、四分位数)についても、定義と計算方法を再度確認し理解し、授業中の例題をもう一度解いてみる。さらに、Manaba上の小テストの問題を解いてみて理解度を確認しておく。特に、分散と標準偏差については、初めて見聞きする概念である場合、すこしややこしいこともある。しかし、後に学習する統計にも関係してくることなので、こでしっかりと理解しておくことが大切である。(予習・復習時間30分)
|
2
|
R・R Studio
|
科目の中での位置付け
|
このコマでは、統計学ソフトのRの基本的な使い方を学習し、データをまとめるときによく使われる表と図を、Rを使っての作成の仕方を学ぶ。この授業ではR Studioという、IDE(統合開発環境)を使用してRを使う。RとR Studioは今後の授業においても使うため、この授業ではR Studioの開き方、簡単な見方や使い方を学び始める出発点になる。また、一つ目の課題であるRを使った頻度分布の出し方、連続変数の要約、円グラフの作成、棒グラフの作成、ヒストグラムの作成について説明する。このとき、受講生が回答したアンケートをデータとして使用するため、締め切りまでに必ずアンケートに回答しておきましょう。Rはプログラミング言語でもあるため、慣れるまでは扱いにくいかもしれないが、最初は配布されるRコマンドのサンプルをまねながら、票や図を作っていくことを奨励する。今後このR Studioを使用して、χ2検定、1標本t検定、ピアソン積率相関係数を行い課題として提出するため、このコマでデータの読み込み方などの基本的な操作を理解しておくことが大切になる。
|
R、RStudio Cloud、講義用パワーポイント
|
コマ主題細目
|
① R ② 表の作成 ③ 図の作成
|
細目レベル
|
① このコマでは、統計ソフトウェアであるRの使い方、特にR Studioの基本的な使い方を学習する。R StudioはRを使うときなどに使用できるIDEで、これによってRの使用が少しだけ容易になる。まず、R Studioを開くと、左側のウィンドウがコンソールとなっている。このウィンドウに解析結果などが出力される。さらに、右上のウィンドウはグローバル環境で、この場所には読み込んだデータ、作成したデータ、解析結果のオブジェクトなどが表示される。右下のウィンドウは作業フォルダー内のファイルの表示、Rパッケージの表示、作成した図の表示のためのものである。また、上部のリボン部分の「ファイル」のすぐ下にある「新しいファイル」アイコンをクリックすると様々な新しいファイルが作れるようにオプションが用意されている。この授業では、その中からRスクリプトのみを使用する。Rスクリプトを選択すると、左上にRスクリプト用の新しいウィンドウが追加される。このRスクリプト内に図を作ったり表を作ったりするためのRコマンドを入力していく。また、データの読み込み方法も学習する。
|
② 次に、R Studioを使って頻度分布の出し方を学習する。頻度分布表では、変数の測定値の頻度を示すリストを観ることができる。頻度分布は、データをまとめるときに役に立つばかりでなく、外れ値(異常な測定値)などがあるかどうかなどの、データの傾向も分かる。したがって、データが集まったら、他の統計処理を行う前に、カテゴリー変数については頻度分布を確認することが奨励される。頻度分布を確認するときのRコマンドは、table(data$x)、とRスクリプトに入力する。dataとxには、それぞれデータファイルの名前とカテゴリー変数の名前を代入する。それぞれの値の割合が知りたいときは、prop.table(table(data$x))を使う。これらのコマンドを実行することで、コンソールウィンドウに頻度分布が出力される。
|
③ 次に、R Studioを使って円グラフ、棒グラフ、ヒストグラムの作成のやり方を学習する。円グラフは変数の値がどのような割合になっているのかを視覚的に確認することができる。棒グラフでは、データが棒の高低で表されるため、データの大小を視覚で確認できる。ヒストグラムは、データの頻度や分散を視覚的に確認でき、外れ値(異常な測定値)などがあるかどうかなどの、データの傾向も分かる。したがって、データが集まったら、他の統計処理を行う前に、これらの図を作成して視覚的にデータを確認することも重要になる。円グラフを作るときのRコマンドは、pie(table(data$x), main='Figure Title')、とRスクリプトに入力する。dataとxは、それぞれデータファイルの名前とカテゴリー変数の名前を代入する。Figure Titleには円グラフの任意のタイトルを代入する。棒グラフを作成するときのRコマンドは、barplot(table(data$x), main='Figure Title')、とRスクリプトに入力する。また、ヒストグラムを作成するためのコマンドは、hist(data$x, main='Figure Title')、を使うことを学ぶ。
|
キーワード
|
① R Studio ② 頻度分布 ③ 円グラフ ④ 棒グラフ ⑤ ヒストグラム
|
コマの展開方法
|
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
|
小テスト
|
「小テスト」については、毎回の授業終了時、manaba上において5問以上の、当該コマの小テスト(難易度表示付き)を実施します。
|
復習・予習課題
|
予習: Manabaに載せてあるRStudio Cloudのアカウント作成の仕方を見ながら講義までにアカウントを作成しておく。また、アンケートに回答し、その集計結果のデータを講義までにダウンロードしておく。復習:RStudio Cloudの、データの読み込みや基本的な使い方などをもう一度理解できているか確認する。Rを使って講義内で作成した表や図をもう一度見直し、表や図からデータについて何が分かるかをまとめてみる。課題である頻度分布表の作成、連続変数の要約、円グラフの作成、棒グラフの作成、ヒストグラムの作成を行い、それぞれについて説明できるようにしておく。(予習・復習時間30分)
|
3
|
確率1
|
科目の中での位置付け
|
このコマでは統計の基本的な概念である確率について学習する。確率の概念は、今後の統計学の中で常に使われているものであるので、正しく理解することが、さまざまな事象についての統計的な考え方につながる。この授業では、まず集合(空集合、部分集合、全体集合、補集合、和集合、共通部分)という概念について学習し、そこから確率(標本空間、空事象、事象、余事象、和事象、排反)の概念へと移行していく。このため、集合の概念を理解できれば確率の概念も比較的簡単に理解できるようになる。また、集合や確率の法則についての学習する。これらの法則は今後学習する確率やベイズ定理の理解にも役立つ。さらに、理解を深めるために、集合や確率についての例題を実際に解く。
|
テキスト 統計学入門①25~29 ②30 ③31~37、講義用パワーポイント
|
コマ主題細目
|
① 集合 ② 集合の演算規則 ③ 確率
|
細目レベル
|
① 集合の種類とそれぞれの定義を学習する。具体的には、集合はある要素(例: 整数、アミノ酸など)の集まりであり、空集合、部分集合、全体集合、補集合、和集合、共通部分、などの種類があることを学ぶ。空集合は、要素が何も入っていない集合のことで、部分集合とはさらに大きな集合の中の一部の集合のことをいう。全体集合とは、考えられる要素を全て含んだ集合のことをいう。そして、補集合は全体集合の中にある、ある部分集合に含まれていない部分のことをいう。和集合とは、二つの集合の少なくとも1つの集合に含まれている要素の集合のことで、共通部分とは、二つの集合に共通して含まれている要素の集合のことをいう。この授業ではこれらの集合について学び、ベン図を用いるなどしながら、これらの集合に含まれる要素の頻度について例題を解く。
|
② 次に、集合の演算規則を学習する。まず、交換法則がA∩B = B∩AやA∪B = B∪Aとなり、= の左と右が同じ集合であることを学ぶ。結合法則とはA∪(B∪C) = (A∪B)∪CやA⋂(B⋂C) = (A⋂B)⋂Cとなる法則で、そのことをベン図を使って確認する。また、分配法則はA⋂(B⋃C) = (A⋂B)⋃(A⋂C)やA⋃(B⋂C) = (A⋃B)⋂(A⋃C)となることを示す法則で、この法則についてもベン図を使って確認する。さらに、ドモルガンの法則と呼ばれる集合の法則についても学習し、ベン図を使ってこの法則が成り立つことを確認する。この法則では、AとBの和集合の補集合 = Aの補集合とBの補集合の共通部分であることを学ぶ。さらに、AとBの共通部分の補集合 = Aの補集合とBの補集合の和集合であることを学ぶ。
|
③ 次に、集合の概念から確率の概念へと移行する。まず、標本空間は、考えられる全ての事象の集合であり、この場合の実現確率は1であると学ぶ。標本空間の中には事象がいくつもあり、事象同士が独立している場合にはその確率を足すことができる。そして、これらの独立した事象が同時に起こる確率は、それぞれの事象が起こる確率の積によって求めることができ、そのことを例題をときながら学ぶ。さらに、条件付き確率が、ある事象が起きているときに外の異なった事象が起きている確率をいうことを学び、実際に例題を解いて理解する。そして、事前確率とは、ある事象Aが起きる確率のことであり、事後確率とは何か他の別の事象Bが事象Aが起こっているときに起こる確率のこということを学習する。
|
キーワード
|
① 確率 ② 事象 ③ ベイズの理論 ④ 医療と統計 ⑤ 置換
|
コマの展開方法
|
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
|
小テスト
|
「小テスト」については、毎回の授業終了時、manaba上において5問以上の、当該コマの小テスト(難易度表示付き)を実施します。
|
復習・予習課題
|
予習: 教科書の第2章(23~35ページ)を読んで、集合と確率の定義を確認しておく。復習:集合の各種類の定義を再確認し、授業中に解いた例題をもう一回解いてみる。集合の演算規則は複数の法則が含まれておりややこしいので、学習者が自分でベン図を使って再確認しておく。さらに、Manabaにアップロードしてある例題を解いて理解できているか確認する。確率については、事象の各種類の定義を再確認し、授業中の例題をもう一度解いてみる。さらにManabaにアップロードされている例題を解いてみて、理解できているかを確認する。理解できていないところがあった場合には、科目担当教員またはクラスメイトにわからない箇所を訊き理解するように務める。(予習・復習時間30分)
|
4
|
確率2
|
科目の中での位置付け
|
このコマでは引き続き確率についての定義と計算方法を学習する。具体的には、空事象、余事象、和事象について学習し、これらの事象の計算方法や数学的な表現方法を学ぶ。これらの事象の概念や計算は今後も出てくるので、ここで理解しておく必要がある。さらに、オッズ比について学習する。オッズ比は、新薬の効果や新しい治療法の効果などを示すときに頻繁に使われる手法である。医療に関連した例題を解いてオッズ比がどのように使われるのかを理解する。そして、この授業では二種類類似した統計の概念である置換と組み合わせについて学習する。置換とは何通りのパターンがあるかを計算する方法であり、その順序を気にする方法である。また、組み合わせとは、順序を気にせずに何通りのパターンが有るのかを計算する方法である。これらのことについて、例題を解きながら、理解できているかどうかを確認しながら学習する。
|
テキスト 統計学入門①36, 37 ②41~43 ③65, 66、講義用パワーポイント
|
コマ主題細目
|
① 確率 ② オッズ比 ③ 置換
|
細目レベル
|
① このコマでは引き続き、確率についての学習を行う。具体的には、空事象、余事象、和事象の確率について学習し、これらの事象の計算方法や数学的な表現方法を学ぶ。基本的には、空事象とは、要素が何も入っていない事象なので、空事象の確率は0である。余事象は標本空間のある事象には入らない要素なので、余事象を求める方法は1からある事象の確率を引いたものになる。さらには、和事象は独立した事象のどれか一つに含まれている要素なので、和事象の確率は二つの独立した事象の和から、この二つの事象の積を引いた値となることを学習する。これらの事象について理解を深めるために、実際にサイコロを使った問題と誕生日問題を例題として解いてみる。最後にギャンブラーの誤謬について学習する。
|
② 次にこのコマではオッズ比について学習する。オッズ比は頻繁に新薬の効果や新しい治療法の効果を検証するときに用いられるので、今後よく見かけることになる統計であるため、ここで計算方法と解釈の仕方を理解しておくことが大切である。オッズ比の計算方法は、(a/c)/(b/d)である。たとえばある実験の中で、aは新薬を投与された人の数、cは新薬を投与されて症状が改善した人の数、bは偽薬を投与された人の数、dは偽薬を投与されて症状が改善した人の数、のようになる。結果、オッズ比が1よりも大きい場合は、この新薬の効果があったという解釈ができる。これを例題を解きながら理解を深める。さらに、このコマではスクリーニング検査などに関係する、陽性、陰性、偽陽性、偽陰性、真の陽性、真の陰性などの概念、そしてそれに関連した感度、特異度、陽性的中率、陰性的中率などの概念を学ぶ。
|
③ 最後にこのコマでは、置換について学習する。具体的に、置換とは事象の中で組み合わせが何通りあるかを求めることであると学び、その計算式についても学習する。置換には二通りあり、順序が関係する置換と順序を気にしない組み合わせである。まず、順序を気にする置換では、例えば、袋の中に4つある飴玉をランダムで2つ選んだとき、何通りの選び方があるか、といった問に答えることができるようになる。この場合、1回目にAの飴玉を選んで2回目にCの飴玉を選んだ場合と、1回目にCの飴玉を選んで2回目にAの飴玉を選んだ場合は結果的に同じ飴玉を2つ選ぶことになる。その様な結果を取り除いて選択肢が何通りあるのかを計算することができるのが、順序を気にしない組み合わせであることを理解する。このことを更に良く理解するために、ピザのトッピングの問題を例題として解く。
|
キーワード
|
① 確率 ② オッズ比 ③ 感度と特異度 ④ 置換 ⑤ 組み合わせ
|
コマの展開方法
|
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
|
小テスト
|
「小テスト」については、毎回の授業終了時、manaba上において5問以上の、当該コマの小テスト(難易度表示付き)を実施します。
|
復習・予習課題
|
予習: 教科書の第2章(35~54ページ)を読んで、確率、事象、オッズ比、置換の定義を確認しておく。復習:空事象、余事象、和事象の定義と計算方法について理解しておき、もう一度授業中の例題を解いてみる。オッズ比についての概念を理解しているか確認する。さらに、授業中の例題を解いて自分自身でもできるか確認しておく。置換については、に種類の置換、順序を気にする置換と順序を気にしない組み合わせがあることを確認し、違いを明確にしておき、授業中の例題を再度解いてみる。さらに、Manabaに例題を数問リストしてあるので、それを解いてみて理解度を確認する。もし分からない箇所があれば担当科目教員かクラスメイトに訊いて理解しておく。(予習・復習時間30分)
|
5
|
確率分布
|
科目の中での位置付け
|
この講義では確率分布に関する授業を行う。 まず、確率変数とは事象を数値で代表させようとした場合の変数であると学ぶ。さらに、確率関数、分布関数について学習し、離散型一様分布について学ぶ。最後に、離散的確率変数とは確率変数が飛び飛びの値をとるものであることを学習し、その期待値と分散の定義と計算方法について学ぶ。これらの確率関数と分散の概念は、6コマ目で学習する二項分布、多項分布、ポアソン分布、超幾何分布についてや、7コマ目で学習する連続型一様分布、連続的確率関数でも出てくるので、このコマでその概念を理解しておきましょう。さらにこれらの様々な確率分布は今後、6コマ目、7コマ目、13コマ目と14コマ目で学習するベイズ定理にも関連する。
|
テキスト 統計学入門①57~59 ②59 ③59~64、講義用パワーポイント
|
コマ主題細目
|
① 確率変数 ② 離散型一様分布 ③ 離散的確率変数
|
細目レベル
|
① このコマでは、まず、確率変数とは事象を数値で代表させようとした場合の変数であると学ぶ。これは、ある確率の数学的な表し方である。確率変数は、確率関数という関数のような形に変換することができることを学ぶ。このことに関する理解するための第一歩として、2枚のコインを投げてその表裏が何通りあるか、という問題を表が出る回数をxとしたとき確率を確率変数を使って表現してみる(f(0)=1/4, f(1)=2/4, f(2)=1/4)。さらに、この確率関数は分布関数というそれぞれの値の確率をたすと1になるということを表す表現に変換できる。例題として、六面体のサイコロを二個投げたときの確率関数と分布関数を書き出す練習をする。
|
② 次に、離散型一様分布は、どの場合も等しい確率で実現するような特別な確率関数であることを学習する。例えば、六面体のサイコロを一つ投げたときに出る目の確率などは、1から6までそれぞれ全て1/6の確率となる(f(1)=1/6,f(2)=1/6,f(3)=1/6,f(4)=1/6,f(5)=1/6,f(6)=1/6,または、f(x)={1/6, 0)。また、コイントスで出る表と裏の確率はそれぞれ1/2の確率となる(f(H)=1/2, f(T)=1/2,または、f(x)={1/2, 0)。それをさらに深く理解するために、サイコロを使った問題を例題として解いて、確率関数と分布関数の表現で書き出して理解する。
|
③ 離散的確率変数とは確率変数が飛び飛びの値をとるもの(例: 6面体のサイコロを一回投げる、ランダムに選ばれた20人の集団の中で特定の血液型を持つ人数、宝くじの当選金額など)ということを学習する。さらには、これには、多数の試行の後で確率変数が収束する値である、期待値というものの定義と計算式を学習する。この期待値についてより深く理解するために、実際に勝率と賞金が明らかになっている賭けごとの問題を例題として解いてみる。さらに、多数の試行のあとで確率変数のばらつきを示す、離散的確率変数の分散の定義と、計算の方法を学習する。また、例題としてコイントスを3回行って表が出る回数の期待値と分散を求め、確率変数について理解を深める。
|
キーワード
|
① 確率変数 ② 確率関数 ③ 分布関数 ④ 離散型一様分布 ⑤ 離散的確率変数
|
コマの展開方法
|
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
|
小テスト
|
「小テスト」については、毎回の授業終了時、manaba上において5問以上の、当該コマの小テスト(難易度表示付き)を実施します。
|
復習・予習課題
|
予習: 教科書の55〜61ページを読んで確率分布、確率変数、確率関数、分布関数、離散型一様分布、離散的確率変数、離散的確率変数の期待値、離散的確率変数の分散について定義などを確認しておく。復習:確率分布、確率変数、確率関数、分布関数、離散型一様分布、離散的確率変数、離散的確率変数の期待値、離散的確率変数の分散の定義と計算方法について理解しておき、もう一度授業中の例題を解いてみて、理解できているか自分で確認しておきましょう。さらに、Manabaにこれらについての例題を数問ずつリストしてあるので、それを解いてみて理解度を確認する。もし分からない箇所があれば担当科目教員かクラスメイトに訊いて理解しておく。(予習・復習時間30分)
|
6
|
二項分布
|
科目の中での位置付け
|
このコマでは、二項分布、多項分布、ポアソン分布、超幾何分布について学習する。二項分布は、n回の試行において、確率pであるような事象がx回起きる確率関数の確率分布のこという。多項分布は、二項分布の中でも確率pである様な事象が複数ある場合に適応される。そして、ポアソン分布とは、一つ一つの確率は低いものの、多数の回数の試行が行われる現象に適用される確率分布であることを学ぶ。さらに、超幾何分布とは、標本抽出をしたあとで、その標本に変わるものを元の標本空間に戻すことなく、標本抽出を繰り返したときの確率分布であることを学習する。ここではこれまでの過去の授業で学習してきた確率をより特別な設定状況において求めることが必要になってくる。これらは一見ややこしく、混同しがちなため、それぞれの違いをはっきりと理解し、正しい計算式を用いることでそれぞれの分布の正しい確率を求めることができるようになることが目標である。
|
テキスト 統計学入門①65~68 ②69~72、講義用パワーポイント
|
コマ主題細目
|
① 二項分布 ② ポアソン分布 ③ 超幾何分布
|
細目レベル
|
① このコマでは、二項分布について学習する。二項分布は、n回の試行において、確率pであるような事象がx回起きる確率関数の確率分布のこという。例としては、40%の人の血液型がA型であった場合、ランダムに選ばれた10人の人の中で、4人がA型である確率を求める場合などがある。さらに、二項分布の計算式を学び、例題として、血液型の問題、テストにランダムに答える問題を使ってより理解を深める。そして、二項分布の期待値と分散について学ぶ。二項分布の期待値と分散を求める計算式を学び、血液型の問題を例題として使い、解くことによってより理解を深める。さらに、二項分布の応用である、多項分布についても学習する。多項分布の計算式を学び、血液型の問題を例題として問うてみることで、より深く理解する。
|
② このコマでは、ポアソン分布とは、一つ一つの確率は低いものの、多数の回数の試行が行われる現象に適用される確率分布であることを学ぶ。通常はおよそn (試行回数)> 50であることと、n ≈ 50に対してnp ≤ 5程度であれば適用可能であるとされている。少し具体的には、何かの平均値が分かっている事象があるとして、同じ事象がx会起こる確率を求めるときなどに役に立つ。そして、ポアソン分布の計算式を学び、これを適応できる消防署への電話の数についての問題とある窓口にかかってくる電話の数についての問題を例題として解いてみて、理解をより深める。最後に、ポアソン分布の期待値と分散が両方共μ(ミュー)であると学ぶ。
|
③ 超幾何分布とは、標本抽出をしたあとで、その標本に変わるものを元の標本空間に戻すことなく、標本抽出を繰り返したときの確率分布であることを学習する。少し具体的にいうと、あるグループ(事項)の中からランダムで3つの要素を再びそのグループの中に戻すことなく選び、この3つの要素のうち2つがある特定の条件を持っている確率を求めるときに役に立つ。そして、超幾何分布の確率を求めるための計算式を学ぶ。より深い理解を得るために、その計算式を使ってトランプを使った問題を例題として解いてみる。さらに、超幾何分布の期待値と分散の計算式を学ぶ。この超幾何分布のための計算式はややこしく、母集団の中の成功数や標本の中の成功数など、ほか多数の項目が含まれているが、例題を解くことによって理解し、慣れておく。
|
キーワード
|
① 二項分布 ② 多項分布 ③ ポアソン分布 ④ 超幾何分布 ⑤ 期待値と分散
|
コマの展開方法
|
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
|
小テスト
|
「小テスト」については、毎回の授業終了時、manaba上において5問以上の、当該コマの小テスト(難易度表示付き)を実施します。
|
復習・予習課題
|
予習: 教科書の第4章(63~70ページ)を読んで、二項分布、多項分布、ポアソン分布について確認しておく。復習:二項分布、二項分布の期待値と分散、多項分布、ポアソン分布、ポアソン分布の期待値と分散、超幾何分布、超幾何分布の期待値と分散の定義と計算方法について理解しておき、もう一度授業中の例題を解いてみる。これらの分布の計算式がどの様な確率を求めたい場合に使われるのかをはっきりと理解しておくことが大切である。Manabaにこれらについての例題を数問ずつリストしてあるので、それを解いてみて理解度を確認する。Manabaの問題には、例えば「二項分布の計算式を使って解け」、などとは書いていないので、それを見分ける練習にもなる。もし分からない箇所があれば担当科目教員かクラスメイトに訊いて理解しておく。(予習・復習時間30分)
|
7
|
正規分布
|
科目の中での位置付け
|
このコマでは、連続的な確率分布の一つである連続型一様分布、連続的確率関数、正規分布、標準正規分布について学習する。連続型一様分布は、全ての連続的な値の確率が等しい 確率分布のこという。連続的確率関数とは、離散的な確率分布ではなく、値に小数点を含む実数のある分布を示すものであることを学習する。そして、二項分布の n が大きくなるに従って、平均値の周りに左右対称な吊鐘形をした正規分布になることを学習する。正規分布に、標準化変換を行うと、平均が0で標準偏差が1である分布(標準正規分布)に変換することができることを学ぶ。このコマでは、正規分布、標準正規分布という、今後の授業においても学んでいく統計の手法にとって重要な概念がでてくるため、正しく理解することが大切である。また、データに含まれている連続変数が正規分布を示している場合が多々あるため、実際にデータを扱った際には確認してみるといいかもしれない。
|
テキスト 統計学入門①71, 72 ②72~76 ③77~86、講義用パワーポイント
|
コマ主題細目
|
① 連続型一様分布 ② 連続的確率関数 ③ 正規分布
|
細目レベル
|
① 過去のコマでは離散的な確率分布を学習したが、このコマでは、連続的な確率分布を学習する。まずは、連続的な確率分布の一つである連続型一様分布を学習する。連続型一様分布では、全ての連続的な値の確率が等しい。例えば、一滴の雨粒がある地点からある地点までに落ちる確率を求めるときなどの場合に、連続一様分布が使われる。この様な場合、連続型の確率変数xに対して確率の大きさを表す関数である、確率密度関数は積分を使って求めることができることを理解する。これは、連続型一様分布の場合、縦の長さx横の長さで求めることができる。この授業では、積分を使って確率を求めることができるということを理解するために、積分が計算できるウェブサイトを紹介し、そのウェブサイトを使って実際に計算してみる。
|
② 連続的確率関数とは、離散的な確率分布ではなく、値に小数点を含む実数のある分布を示すものであることを学ぶ。これには例えば、体重、身長、血圧、インスリンの値などがある。このときの確率は、確率分布の中のf(x)のポイントのところまでの面積で表される値である、累積分布関数によって求めることができることを学ぶ。これも、連続型一様分布と同じで、積分を使って求めることができる。また、このコマでは、連続的確率関数の平均の計算方法を学び、全事象に対する確率の和が1になるという規格化条件が満たされているとき、それがμ(ミュー)であると学ぶ。連続的確率関数の分散の計算方法も同時に学習し、それがσ2であることを学ぶ。
|
③ この授業では、二項分布の n が大きくなるに従って、平均値の周りに左右対称な吊鐘形をした正規分布になることを学習する。さらに、正規分布の計算式を学び、平均と分散がそれぞれμ(ミュー)とσ2(シグマの2乗)であることを理解する。そしてこの正規分布が今後の様々な統計解析にとって重要な概念になっていることを学習する。そして、正規分布を標準正規分布へと変換する標準化変換の方法を学習する。標準化変換とは、正規分布上の値を平均が0で標準偏差が1である分布(標準正規分布)に変換することをいい、平均が0、標準偏差が1の分布となることを学ぶ。ここで、標準正規分布における確率を標準正規分布表を使って行う方法を学習し、実際に例題を解いてみる。最後に、離散的な確率分布を連続分布に置き換えて確率を求める方法である、半整数補正の方法を学習し、理解を深めるために、例題を解いてみる。
|
キーワード
|
① 連続型一様分布 ② 連続的確率関数 ③ 正規分布 ④ 標準正規分布 ⑤ 標準化変換
|
コマの展開方法
|
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
|
小テスト
|
「小テスト」については、毎回の授業終了時、manaba上において5問以上の、当該コマの小テスト(難易度表示付き)を実施します。
|
復習・予習課題
|
予習: 教科書の第5章(71~86ページ)を読んで、連続型一様分布、連続的確率関数、正規分布、標準正規分布について確認しておく。復習:連続型一様分布、連続的確率関数、確率密度関数、累積分布関数、連続的確率関数の平均、連続的確率関数の分散、正規分布、標準正規分布、標準化変換、半整数補正の概念と計算方法について理解しておき、もう一度授業中の例題を解いてみる。また、標準化変換後に標準正規分布表を使って確率を求める方法をしっかりと理解しておく。Manabaにこれらについての例題を数問ずつリストしてあるので、それを解いてみて理解度を確認する。もし分からない箇所があれば担当科目教員かクラスメイトに訊いて理解しておく。(予習・復習時間30分)
|
8
|
無作為抽出と標本分布
|
科目の中での位置付け
|
このコマでは、無作為標本抽出、標本の基本的な記述統計、そして正規母集団について学習する。この授業が、標本の統計から母集団の特徴を推測する推測統計の始まりであるため、このコマでその基礎をしっかり理解することが大切である。まず、無作為標本抽出とは、母集団は未知の母平均と母分散を持つ集合のことをいい、それをより小さな標本から知る方法であると学習する。そして、母集団と標本の概念について学ぶ。さらに、標本の基本的な記述統計(平均と分散)の概念と計算方法について学ぶ。これは、1コマ目でも学習したが、統計分布の概念や正規分布の概念を学習し終わったこの授業でもう一度記述統計について学習すると、理解が更に深まる。そして、このコマが復習にもなる。最後に、正規母集団の概念と、標本との関係性を学習する。このコマで学習することは、今後の推測統計の概念の基本になるため、推測統計では標本から得られる値によって母集団についての特徴を推測し、そのために様々な統計的手法を用いることを理解する。
|
テキスト 統計学入門①87~90 ②91~94 ③95~99、講義用パワーポイント
|
コマ主題細目
|
① 無作為標本抽出 ② 標本の統計 ③ 正規母集団
|
細目レベル
|
① ここでは、無作為標本抽出の概念とどのようにそれが行われるのかを学習する。無作為標本抽出とは、母集団は未知の母平均と母分散を持つ集合のことをいい、それをより小さな標本から知る方法である。母集団のどの要素についても同じ確率で標本として抜き取れるように、作為を交えずにそれぞれ選ぶ作業を行う。母集団とは、調査したい全てのサンプルを含む集合であることを学ぶ。そして、標本とは母集団からいくつかの要素を抜き取ったものの集合のことをいい、研究の中で主にデータとして扱われるものであることを学ぶ。無作為抽出には、コンピュータを使って乱数表を作り、その乱数を使ってサンプルを取り出す方法がある。そして、無作為抽出には、復元抽出と非復元抽出の二種類があることを学ぶ。復元抽出では、母集団から同じ標本を繰り返して抽出できる。その反対に、非復元抽出では母集団から同じ標本を繰り返して抽出しない。さらに、無作為抽出がどのように行われるのかを体験するために、乱数表を用いて高校生の体重のリストからランダムに10人分の体重の抜き出してみる。
|
② 標本の基本的な記述統計(平均と分散)の概念と計算方法について学ぶ。これは、1コマ目でも学習したが、統計分布の概念や正規分布の概念を学習し終わったこの授業でもう一度記述統計について学習すると、理解が更に深まる。ここでは、標本平均、標本分散、標本標準偏差の計算方法を再び学習する。さらに、標本平均の分布について、標本平均などはnが大きくなればなるほど母数に近くなることを学ぶ。また、抽出された標本平均の分布の幅を示す値である、標本誤差の概念と計算方法を学ぶ。標本統計についての理解をより深めるために、例題として高校生の体重のサンプルを使って、標本平均、標本分散、標本標準偏差を計算してみる。最後に、標本分散の分布について学ぶ。
|
③ ③ 正規母集団の概念と、標本との関係性を学習する。正規母集団とは、正規分布に従う母集団のことであると学ぶ。母集団と標本平均の関係は、母集団が正規分布している場合、nの大きさに関わらず標本平均も正規分布に従い、母集団が正規分布していない場合は、nが大きいならば、標本平均は正規分布に従うことを学ぶ。さらに、標準化変換された標本平均の分布では、標本平均は平均𝝁と分散𝝈2/nを持つ正規分布に従うことを学び、標準化変換の計算方法を学習する。母分散が分からないときの標本平均の分布では、標本サイズが大きい場合と小さい場合とでは、記述統計の計算方法が異なることを学習する。標本サイズが小さい場合はt-分布に従うことを学ぶ。最後に、標準正規分布の特徴について学習する。
|
キーワード
|
① 無作為標本抽出 ② 標本平均 ③ 標本分散 ④ 標本標準偏差 ⑤ 正規母集団
|
コマの展開方法
|
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
|
小テスト
|
「小テスト」については、毎回の授業終了時、manaba上において5問以上の、当該コマの小テスト(難易度表示付き)を実施します。
|
復習・予習課題
|
予習: 教科書の第6章(87~105ページ)を読んで、無作為標本抽出、標本の基本的な記述統計、正規母集団について確認しておく。復習:無作為標本抽出、母集団、標本、復元抽出、非復元抽出、乱数表、標本の基本的な記述統計(平均と分散)、標本平均、標本分散、標本標準偏差、標本誤差、正規母集団、標準化変換された標本平均の分布、母分散が分からないときの標本平均の分布の概念と計算方法について理解しておき、もう一度授業中の例題を解いてみる。特に、母分散が分からないときの標本平均の分布の計算においては、標本サイズが大きい場合と小さい場合とでは、記述統計の計算方法が異なるため、注意が必要になる。Manabaにこれらについての例題を数問ずつリストしてあるので、それを解いてみて理解度を確認する。もし分からない箇所があれば担当科目教員かクラスメイトに訊いて理解しておく。(予習・復習時間30分)
|
9
|
推定
|
科目の中での位置付け
|
このコマで学習する内容は、推定統計の始まりである。まず、推定統計とは、標本から計算した平均や分散などから母集団の平均や分散などを推測することであることを学習する。まず、基本的な推定統計には、点推定と区間推定があり、それが標本平均を信頼区間であることを学び、それぞれの計算方法を学習する。このあとに出てくる10コマ目のχ2検定、11コマ目のt検定、12コマ目の相関などは推定検定である。推定検定の概念と理解の仕方を理解することは今後の講義内容の全てに適用できるので、このコマの講義内容は大切である。また、信頼区間という概念も、統計に不確定性を含むことができるという点で、13コマ目と14コマ目のベイズ定理の内容と重なる。ただ、ここで出てくる信頼区間とベイズ定理で使われる確定区間とでは使い方と解釈が異なるために注意が必要となってくる。
|
テキスト 統計学入門①107~110 ②111 ③112~119、講義用パワーポイント
|
コマ主題細目
|
① 点推定と区間推定 ② 母分散が知られている母平均 ③ 母分散が知られていないぼ平均
|
細目レベル
|
① ここでは、推測統計の点推定と区間推定について学ぶ。点推定とは、誤差を許容しつつ一点の値で示す推であり、点推定量とは、一点で示された値のことをいう。また、区間推定とは、幅をもたせて示す推定であり、区間推定量とは、幅をもたせて示された推定結果であることを学ぶ。区間推定量は信頼区間とも呼ばれる。研究の世界では、解釈容易さから点推定のほうがより頻繁に使われて来た。しかし、母集団の統計値がはっきりと分かっていることは稀であるので、母集団の統計を推測するという意味では、誤差を含んで結果を報告できる信頼区間を使ったほうがより正確であるといえる。この授業ではさらに、標準正規分布において、そのパーセント点から信頼区間を求める方法を学習する。例題として、正規分布表から90パーセント点のzを求め、さらに95パーセント点の両端のzを求める。
|
② 更にこのコマでは、不偏推定量の概念と計算方法、母平均と信頼区間の求め方について学習する。不偏推定量は、母集団の統計量が標本統計量の期待値として推定される値のことであると学ぶ。母平均𝛍の不偏推定量は標本平均であり、母分散の不偏推定量は標本不偏分散となる。信頼区間を使った母平均の推定は母分散が知られているときと知られていないときでは計算方法が異なることを学ぶ。まずは、母分散が知られている場合には、まずはその場合のzを求める計算式を用いて母平均を計算し、その母分散と標準正規分布表を使い信頼区間を求めることができる。これらのことについて理解を深めるために、例題を一緒に解いて計算方法や結果の解釈を確認する。
|
③ 次に、母分散が知られていない場合には、更に大標本であった場合と小標本であった場合の2通りに分けられる。まずは、大標本であった場合には、その場合に用いられるz値を求める計算式を使い、z値を計算する(z=(sqrt(n-1)*(x-u))/s)。そして、この場合も特有の信頼区間を求める式を使い、標準正規分布表を使い信頼区間を求める。母分散が知られていない場合には、まずはt値を計算し、t値の自由度n-1を使い、t分布表の中からパーセント点を見つけて信頼区間を求める。これらの理解をより深めるために、卵のサイズに関する問題と高校生の体重に関する問題を例題として解く。母分散が知られている場合と知られていない場合、大標本なのか小標本なのかで計算方法が変わるので、注意する。
|
キーワード
|
① 点推定 ② 信頼区間 ③ 不偏推定量 ④ z値 ⑤ t値
|
コマの展開方法
|
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
|
小テスト
|
「小テスト」については、毎回の授業終了時、manaba上において5問以上の、当該コマの小テスト(難易度表示付き)を実施します。
|
復習・予習課題
|
予習: 教科書の第6章(107~112ページ)を読んで、点推定、点推定量、区間推定、信頼区間、不偏推定量、標本平均、標本不偏分散、母平均の計算について確認しておく。 復習:点推定、点推定量、区間推定、信頼区間、不偏推定量、標本平均、標本不偏分散、母平均の計算について理解しておき、もう一度授業中の例題を解いてみる。とくに、母平均の計算では、墓分散が分かっているかいないか、大標本か小標本かで計算方法が異なるので注意が必要。さらに、Manabaにこれらについての例題を数問ずつリストしてあるので、それを解いてみて理解度を確認する。もし分からない箇所があれば担当科目教員かクラスメイトに訊いて理解しておく。(予習・復習時間30分)
|
10
|
カイ2乗検定
|
科目の中での位置付け
|
このコマでは、カイ2乗検定とそのpost-hoc test、Rを用いたカイ2乗検定の方法について学習する。カイ2乗検定は比較的簡単に計算でき、頻繁に使用される検定なので、その用法と計算を理解することが大切である。カイ2乗検定は、2つ以上のカテゴリ変数があるときに、期待値(全体の総数から計算される)に対する、観測された値(出来事が起こる頻度)について検証することができる検定であることを学ぶ。Post-hoc testはカイ2乗検定で有意差があると確認できたときのみ行うもので、複数ある、観測された出来事の頻度の間でどこに統計的な差があるのかを確認するために行う。このコマではpost-hoc test として標準残差の計算方法と解釈の方法を学ぶ。これらのことを使って、例題を解き、理解を深める。最後に、カイ2乗検定の課題として、この学期の最初の方で回答したサーベイによるデータを使い、Rを使ってカイ2乗検定を行う。その結果をRアウトプットにして、結果に対する解釈を行った後に、Manabaにアップロードすることによって提出する。
|
講義用パワーポイント
|
コマ主題細目
|
① カイ2乗の計算 ② Post-hoc test ③ Rによる課題
|
細目レベル
|
① ここでは、カイ2乗検定の基本的な使い方と計算方法について学習する。カイ2乗検定は、2つ以上のカテゴリ変数があるときに、期待値(全体の総数から計算される)に対する、観測された値(出来事が起こる頻度)について検証することができる検定である。ここでは、カイ2乗検定の計算方法(期待値から測定値を引いたものを2乗し、それをさらに期待値で割ったものの和)を学習する。さらに、サイコロをふったときの目の頻度に関する例題を、帰無仮説と対立仮説を立てるところから始め、カイ2乗検定の公式を使って解く。そして、カイ2乗分布表を使い、計算で出た結果が棄却値よりも高いかどうか確認し、p値についても確認する。最後に、結果について、仮説に対してどのように解釈できるかを学習する。
|
② この授業では、カイ2乗検定のpost-hoc testについて学習する。post-hoc testはカイ2乗検定で有意差があると確認できたときのみ行うもので、複数ある、観測された出来事の頻度の間でどこに統計的な差があるのかを確認するために行う。カイ2乗検定のpost-hoc testはさまざまあるが、ここでは標準残差をつかった検証を学習する。標準残差の計算方法(測定値から期待値を引いたものを期待値で割る)を学び、標準残差±2以上が測定された値と期待値との間に差があることを意味することを学ぶ。このことをより深く理解するために、食事法と健康に関する例題を、仮説を立てるところから始め、カイ2乗を計算し、有意差があることを確認したのち、標準残差を計算してどこに統計的な有意差があるのかを検証する。
|
③ 更にこのコマでは、統計ソフトであるRを使ってカイ2乗検定を行う方法を学習する。この学期の最初の方に学習者が回答したサーベイによるデータを用いて、Rを使ってカイ2乗検定を行い、Rのアウトプットを出す。さらに、そのアウトプットの解釈の仕方と、結果の帰無仮説と対立仮説に対しての解釈のし形を学習する。カイ2乗検定を行うため、まず、tbl = table(x, y)、として、さらに、chisq.test(tbl)、というコマンドを使う。tableのコマンドで頻度分布表を作ることができ、作った分布表(tbl)を使いchisq.testのコマンドでカイ2乗検定を行うことができる。カイ2乗検定を行った結果とその解釈をManabaにアップロードすることで提出する。
|
キーワード
|
① カイ2乗 ② 測定値と期待値 ③ Post-hoc test ④ 標準偏差 ⑤ Rによる解析
|
コマの展開方法
|
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
|
小テスト
|
「小テスト」については、毎回の授業終了時、manaba上において5問以上の、当該コマの小テスト(難易度表示付き)を実施します。
|
復習・予習課題
|
予習: 教科書の第8章(130~133ページ)を読んで、カイ2乗検定について確認しておく。復習:カイ2乗検定の用法と計算方法、post-hoc test の概念と標準残差の計算の仕方、Rの使い方、Rを用いたカイ2乗検定の計算方法について理解しておく。さらに、授業中の例題再度自分自身で解いてみて、理解度を確認しておく。カイ2乗検定は期末テストで出題されるかもしれないので、計算方法を間違いのないように理解しておく。とくに、カイ2乗検定の計算結果を、どのように解釈するのかが重要。p値、有意確率、臨界値などの解釈の仕方は今後も重要になってくるので、間違いのないように理解しておきましょう。もし分からない箇所があれば担当科目教員かクラスメイトに訊いて理解しておく。(予習・復習時間30分)
|
11
|
t-検定
|
科目の中での位置付け
|
このコマでは、1標本t検定、対応ありt検定、独立標本t検定の概念とその計算方法について学習する。t-検定は比較的簡単に計算でき、頻繁に使用される検定なので、その用法と計算を理解することが大切である。t-検定は基本的に、2つの平均を比べるときに使われる検定である。1標本t検定とは、真の平均値が特定の値(多くの場合「ゼロ」)に等しいという帰無仮説についての検定のことをいうしかし、母平均が分かっているということが少ないため、現実社会において1標本t検定を使うことは稀である。独立標本t検定とは、「2つの標本の平均値が同じである」という帰無仮説についての検定のことをいう。そして、独立標本t検定とは、「2つの標本の平均値が同じである」という帰無仮説についての検定のことをいう。この授業では、それぞれのt-検定について例題を解き、理解を深める。最後に、 この講義の課題として、この学期の最初に回答したサーベイによるデータを使い、Rを使ってそれぞれのt-検定を行う。その結果をRアウトプットにして、結果に対する解釈を行った後に、Manabaにアップロードすることによって提出する。
|
講義用パワーポイント
|
コマ主題細目
|
① 1標本t検定 ② 対応ありt検定 ③ 独立標本t検定 ④ Rによる解析
|
細目レベル
|
① ここでは、1標本t検定の基本的な使い方と計算方法について学習する。1標本t検定とは、真の平均値が特定の値(多くの場合「ゼロ」)に等しいという帰無仮説についての検定のことをいう。ここでは、1標本t検定の計算方法(標本平均から母平均を引いたものを標準誤差で割る)を学習する。さらに、患者の血圧に関する例題を、帰無仮説と対立仮説を立てるところから始め、1標本t検定の公式を使って解く。そして、t-分布表と自由度(標本サイズ-1)を使い、計算で出た結果が棄却値よりも高いかどうか確認し、p値についても確認する。そして、Cohen's d を計算し効果量を求め、効果量について何がいえるのかを解釈する。最後に、結果について、仮説に対してどのように解釈できるかを学習する。
|
② この授業では、対応ありt検定の基本的な使い方と計算方法について学習する。対応ありt検定とは、「ペアとなる測定値の差がゼロに等しい」という帰無仮説についての検定のことをいう。ここでは、対応ありt検定の計算方法(二つの標本平均の差を差の標準平均の標準偏差を標本サイズの平方根で割った値でさらに割る)を学習する。さらに、患者の血圧に関する例題を、帰無仮説と対立仮説を立てるところから始め、対応ありt検定の公式を使って解く。そして、t-分布表と自由度(標本サイズ-1)を使い、計算で出た結果が棄却値よりも高いかどうか確認し、p値についても確認する。そして、Cohen's d を計算し効果量を求め、二つの標本平均の差について何がいえるのかを解釈する。最後に、結果について、仮説に対してどのように解釈できるかを学習する。
|
③ 最後に、独立標本t検定の基本的な使い方と計算方法について学習する。独立標本t検定とは、「2つの標本の平均値が同じである」という帰無仮説についての検定のことをいう。ここでは、独立標本t検定の計算方法は3つのパターンがあることを学ぶ。まず、サンプルの大きさと分散が標本間において同じ場合、分散の値が標本間において近い場合、そして、分散の値が標本間において離れている場合である。例題として、降圧剤の効果に関する問題を、帰無仮説と対立仮説を立てるところから始め、独立標本t検定の公式を使って解く。そして、t-分布表と自由度を使い、計算で出た結果が棄却値よりも高いかどうか確認し、p値についても確認する。そして、Cohen's d を計算し効果量を求め、標本間における標本平均の差について何がいえるのかを解釈する。最後に、結果について、仮説に対してどのように解釈できるかを学習する。
|
④ 更にこのコマでは、統計ソフトであるRを使って1標本t検定を行う方法を学習する。この学期の最初の方に学習者が回答したサーベイによるデータを用いて、Rを使ってt検定を行い、アウトプットを出す。さらに、Cohen's d と信頼区間を計算する。1標本t検定のRコマンドは、t.test(x, mu = 0)、である。xはデータ中にある検証したい連続変数で、muは人口の平均でxと比べたい値となる。muの値は0とは限らず、その都度適切な値を入力する必要がある。Cohen's dのRコマンドは、cohensD(x, mu=0)となる。Rによるt検定の結果が出たらその結果を仮説に対して解釈し、Manabaにアップロードすることで提出する。
|
キーワード
|
① 1標本t検定 ② 対応ありt検定 ③ 独立標本t検定 ④ Cohen's d ⑤ Rによる解析
|
コマの展開方法
|
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
|
小テスト
|
「小テスト」については、毎回の授業終了時、manaba上において5問以上の、当該コマの小テスト(難易度表示付き)を実施します。
|
復習・予習課題
|
予習: 授業用のパワーポイントスライドを見てt-検定とは何かを確認しておく。復習:1標本t検定、対応ありt検定、独立標本t検定の用法と計算方法、Cohen's d と信頼区間の計算の仕方、Rの使い方、Rを用いたt検定の計算方法について理解しておく。さらに、授業中の例題を再度自分自身で解いてみて、理解度を確認しておく。とくに、t-検定の計算結果を、どのように解釈するのかが重要。1標本t検定の問題は期末テストに出される可能性があるので、その計算方法と解釈を理解しておきましょう。とくに、結果に関連した帰無仮説、対立仮説、p値、臨界値の解釈の仕方を間違いのないように学習しておきましょう。もし分からない箇所があれば担当科目教員かクラスメイトに訊いて理解しておく。(予習・復習時間30分)
|
12
|
相関
|
科目の中での位置付け
|
このコマでは、ピアソンの積率相関係数の概念とその計算方法について学習する。ピアソンの積率相関係数は比較的簡単に計算でき、頻繁に使用される検定なので、その用法と計算を理解することが大切である。ピアソンの積率相関係数とは、2つの連続変数がどのように関係しているかを表す値である。rがマイナスの場合は、一つの変数の値が上がると、もう一つの変数の値が下がることを意味し、rがプラスの場合は、一つの変数の値が上がると、もう一つの変数の値も上がることを意味する。さらに、ピアソンの積率相関係数は効果量としても用いられ、2つの連続変数の関係の大きさを表す使用になると学ぶ。この授業では後半に、この学期の最初の方で回答したサーベイによるデータを使い、Rを使ってピアソン積率相関係数の計算を行う。その結果をアウトプットにして、結果に対する解釈を行った後に、Manabaにアップロードすることによって提出する。このとき、帰無仮説、対立仮説、p値、臨界値などの概念を間違いの内容に学習しましょう。
|
講義用パワーポイント
|
コマ主題細目
|
① ピアソンの積率相関係数 ② ピアソンの積率相関係数の計算 ③ Rによる解析
|
細目レベル
|
① この授業では、ピアソンの積率相この授業では、ピアソンの積率相関係数の基本的な使い方と計算方法について学習する。ピアソンの積率相関係数 (r)とは、2つの連続変数がどのように関係しているかを表す値である。rの範囲は、−1〜1である。rがマイナスの場合は、一つの変数の値が上がると、もう一つの変数の値が下がることを意味し、rがプラスの場合は、一つの変数の値が上がると、もう一つの変数の値も上がることを意味する。この講義では、散布図を見ながら相関の方向と強さによってデータの散布の仕方が異なることを学習する。さらに、ピアソン積率相関には効果量の役割を果たす事もできる。この場合、絶対数が.1~.3だと、効果が小さいことを意味し、.3~.5であると効果が中程度、.5~であると大きな効果があるということを意味する。関係数の基本的な使い方と計算方法について学習する。ピアソンの積率相関係数 (r)とは、2つの連続変数がどのように関係しているかを表す値である。rの範囲は、−1〜1となる。rがマイナスの場合は、一つの変数の値が上がると、もう一つの変数の値が下がることを意味し、rがプラスの場合は、一つの変数の値が上がると、もう一つの変数の値も上がることを意味する。ここでは、ピアソンの積率相関係数の計算方法を学習し、年齢と血糖値の関係についての例題を解いて、計算方法を練習し、理解を深める。例題では、帰無仮説と対立仮説を立てるところから始め、ピアソンの積率相関係数の公式を使って解く。そして、ピアソンの積率相関係数表と自由度(標本サイズ-2)を使い、計算で出た結果が棄却値よりも高いかどうか確認し、p値についても確認する。そして、効果料としてのピアソンの積率相関係数について学習し、2つの変数の関係について何がいえるのかを解釈する。最後に、結果について、仮説に対してどのように解釈できるかを学習する。
|
② 次に事講義では、ピアソンの積率相関係数の計算方法を学習し、年齢と血糖値の関係についての例題を解いて、計算方法を練習し、理解を深める。例題では、帰無仮説と対立仮説を立てるところから始め、ピアソンの積率相関係数の公式を使って解く。そして、ピアソンの積率相関係数表と自由度(標本サイズ-2)を使い、計算で出た結果が臨界値よりも高いかどうか確認し、p値についても確認する。そして、効果量としてのピアソンの積率相関係数について学習し、2つの変数の関係について何がいえるのかを解釈する。最後に、結果について、仮説に対してどのように解釈できるかを学習する。ピアソン積率相関係数の計算は、2つの変数の平均値から計算することから始まって、いくつかの段階を経なければならないため、練習問題を解くことでなれておきましょう。
|
③ 更にこのコマでは、統計ソフトであるRを使ってピアソン積率相関係数の計算を行う方法を学習する。この学期の最初の方に学習者が回答したサーベイによるデータを用いて、Rを使って講義で学習したピアソン積率相関係数を行い、アウトプットを出す。ピアソン積率相関係数を計算するためのRコマンドはcor.test(x, y)を使う。xとyはそれぞれ連続変数である。出てきたアウトプットのピアソン積率相関係数(方向と強さ)、自由度、p値などを確認し、どのように解釈するのかを学習する。このとき、帰無仮説と対立仮説を立て、それに対する解釈もできるようにしておきましょう。その結果を仮説に対して解釈し、Manabaにアップロードすることで提出する。
|
キーワード
|
① ピアソンの積率相関係数の概念 ② ピアソンの積率相関係数の計算 ③ 散布図 ④ 効果量 ⑤ Rを使った解析
|
コマの展開方法
|
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
|
小テスト
|
「小テスト」については、毎回の授業終了時、manaba上において5問以上の、当該コマの小テスト(難易度表示付き)を実施します。
|
復習・予習課題
|
予習: 授業用のパワーポイントスライドを見てピアソンの積率相関係数とは何かを確認しておく。また、教教科書の第9章(141~148ページ)を読んで、ピアソン積率相関の概念について確認しておく。復習:ピアソンの積率相関係数の用法と計算方法、効果量としてのピアソンの積率相関係数、Rの使い方、Rを用いたピアソン積率相関係数の計算方法について理解しておく。さらに、授業中の例題を再度自分自身で解いてみて、理解度を確認しておく。とくに、ピアソンの積率相関係数の計算結果を、どのように解釈するのかが重要。臨界値、p値、自由度の解釈の仕方とともに、計算結果の解釈の仕方も間違いのないように理解しておきましょう。もし分からない箇所があれば担当科目教員かクラスメイトに訊いて理解しておく。(予習・復習時間30分)
|
13
|
ベイズ定理1
|
科目の中での位置付け
|
このコマでは、ベイズ定理の概念、ベイズ定理の公式、医療と統計について学習する。ここで学習するベイズ定理は確率の考え方の一種で、事前に知っている情報が確率に影響するというものです。ベイズ定理の基本的な公式は、P(A|B) = [P(B|A) x P(A)] / P(B)です。P(A|B)とP(B|A)というのは、以前確率の講義で学習したとおり、条件付き確率です。P(B|A)は、P(B∩A) / P(A)で求めることができます。P(A)とP(B)はそれぞれ周辺平均値です。このように、確率1と確率2で学習した内容が再び出てくるので、確率の講義を再度復習しておくといいでしょう。それにより、これまで学習した確率とベイズ定理による確率の考え方の違いも理解しやすくなると思います。更にここでは、医療と確率統計について学習します。有病率、感度、特異度など、医療の中でも大切な概念を学習します。確率の講義のオッズ比でも医療について扱いましたが、それをさらにもう一つ違う角度から学んでいきましょう。
|
テキスト 統計学入門③39~48、講義用パワーポイント
|
コマ主題細目
|
① ベイズ定理公式 ② モルトン趾と利き目 ③ 医療と確率統計
|
細目レベル
|
① まずこの講義では、ベイズ定理の基本的な公式を、利き目とモルトン趾の例を使いながら学習します。ここで学習するベイズ定理は確率の考え方の一種で、事前に知っている情報が確率に影響するというものです。ベイズ定理の基本的な公式は、P(A|B) = [P(B|A) x P(A)] / P(B)です。P(A|B)とP(B|A)というのは、以前確率の講義で学習したとおり、条件付き確率です。P(B|A)は、P(B∩A) / P(A)で求めることができます。P(A)とP(B)はそれぞれ周辺平均値です。この講義では、ある人がモルトン趾であった場合利き目が左である確率と、利き目が左であった場合モルトン趾である確率が異なるのかを検証します。
|
② 次にこの授業では、モルトン趾と利き目の例題を実際に解いていきます。モルトン趾を持っている人とそうでない人、利き目が右の人と左の人の割合を頻度分布表の上で見ながら、ある人がモルトン趾であった場合利き目が左である確率と、利き目が左であった場合モルトン趾である確率が異なるのかを検証します。まず、ベイズ定理の公式である、P(A|B) = [P(B|A) x P(A)] / P(B)に数値を当てはめていきます。P(B|A)の部分は、P(B∩A) / P(A)で求めることができます。P(A)とP(B)は既に問題中に表記してあるのんで、その数値を使います。P(A|B) = [P(B|A) x P(A)] / P(B)とP(B|A) = [P(A|B) x P(B)] / P(A)、それぞれを解くと2つの確率が異なっていると言う結論になります。
|
③ 次にこの授業では、ベイズ定理が医療の中で様々な事象を考えるときに役に立つことを学習します。まず、Evidence-based medicineは根拠に基づく医療という概念で、公正な方法で集められたデータを統計処理することによって得られる結果に基づいて、治療方法や薬の効果を検証する作業のことを言います。さらに、有病率、感度、特異度、陽性的中率、陰性的中率の概念と計算方法を学習します。最後に、マンモグラムの例題の中で、ベイズ定理を使いながら、有病率と医療検査の感度と特異度がどのように関係して、ある人が検査で陽性となったときに実際に病気である確率を求めます。この例題では、頻度分布表の中の限られた数値のみ判明している状態なので、いくつかの値は既に分かっている値を使って計算していきます。
|
キーワード
|
① ベイズ定理 ② ベイズ定理公式 ③ 確率 ④ 医療と統計 ⑤ Evidence-Based Medicine
|
コマの展開方法
|
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
|
小テスト
|
「小テスト」については、毎回の授業終了時、manaba上において5問以上の、当該コマの小テスト(難易度表示付き)を実施します。
|
復習・予習課題
|
予習: 教科書の第2章(35~48ページ)を読んで、ベイズ定理の概念、ベイズ定理の公式、医療と確率統計について確認しておきましょう。復習:ベイズ定理の概念、ベイズ定理の基本的な公式、医療と確率統計(有病率、感度、特異度、陽性的中率、陰性的中率)の概念、と計算方法について理解しておき、もう一度授業中の例題を解いてみましょう。また、最後に、出てきた推定にも役立つベイズ定理の式も理解しておき、その式を使って例題を解いてみましょう。Manabaにこれらについての例題を数問ずつリストしてあるので、それを解いてみて理解度を確認しておきましょう。もし分からない箇所があれば担当科目教員かクラスメイトに訊いて理解しておきましょう。(予習・復習時間30分)
|
14
|
ベイズ定理2
|
科目の中での位置付け
|
この講義では、推定に便利なベイズ理論の公式を詳しく学習します。推定の時に便利なベイズ定理の公式は、P(A|B) = [P(B|A) x P(A)] / [P(B|A) x P(A) + P(B|~A) x P(~A)]となります。~Aとは、余事象のことで、ここではA以外という意味です。P(A|B)はBであるときの仮説Aの事後確率、P(B|A)は仮説AであるときのデータBの尤度、P(A)は仮説Aの事前確率、P(B|~A)は仮説~AであるときのデータBの尤度、そして、P(~A)は仮説~Aの事前確率となります。尤度とは、想定するパラメーターがある値をとる場合に観測している事柄や事象が起こりうる確率と定義されています。さらにこの講義では、ザ フェデラリストの特定の論文の著者を推定するという例題を、ベイズ定理を使って検証していきます。ここでは、二つの仮説を立てて検証を行います。これまでに推定の講義以降に学習した推定統計の講義では、帰無仮説と対立仮説を立ててから解析を行いました。ベイズ定理の中での仮説はすべて、これまでの対立仮説のような扱いをします。この違いも理解しておきましょう。
|
講義用パワーポイント
|
コマ主題細目
|
① ベイズ定理の式 ② 尤度 ③ 仮説検証
|
細目レベル
|
① まずこの講義では、推定に便利なベイズ理論の公式を詳しく学習します。推定の時に便利なベイズ定理の公式は、P(A|B) = [P(B|A) x P(A)] / [P(B|A) x P(A) + P(B|~A) x P(~A)]となります。~Aとは、余事象のことで、ここではA以外という意味です。P(A|B)はBであるときの仮説Aの事後確率、P(B|A)は仮説AであるときのデータBの尤度、P(A)は仮説Aの事前確率、P(B|~A)は仮説~AであるときのデータBの尤度、そして、P(~A)は仮説~Aの事前確率となります。尤度とは、想定するパラメーターがある値をとる場合に観測している事柄や事象が起こりうる確率と定義されています。
|
② 次にこの講義では、ベイズ定理にとって重要な概念である、尤度が何を指しているのかを詳しく学習します。尤度とは、想定するパラメーターがある値をとる場合に観測している事柄や事象が起こりうる確率などと定義されています。ここでいう想定するパラメーターとは、例えばデータが正規分布しているときの平均値と標準偏差値のことなどです。データが正規分布しているときは、分布の形はこの平均値と標準偏差値によって変化します。いくつかのデータがサンプルから収集され、母集団の平均値と標準偏差値が分かっていないとき、特定の正規分布の形(例えば平均値=10、標準偏差値=3のような)がそのデータにフィットする確率のことを、尤度といいます。
|
③ 次にこの講義では、ベイズ定理を仮説検証に役立てる方法を学習します。ここでは、例題としてアメリカのザ フェデラリストと呼ばれる連作論文のうちの一つを執筆したのがアレキサンダー ハミルトンなのか、ジェイムズ マディソンなのかを、ベイズ定理を使って検証します。ここでは、二つの仮説が成り立ちます。一つ目の仮説は、この論文をハミルトンが書いた、という仮説です。そしてもう一つは、この論文をマディソンが書いた、という仮説です。これらの二つの仮説を検証するため、これまで学習したベイズ定理の公式を少し変えた、P(Hi|data) = [P(data|Hi) x P(Hi)] / [ΣP(data|Hj) x P(Hj)]を使います。
|
キーワード
|
① ベイズ定理と推定 ② 事後確率 ③ 事前確率 ④ 尤度 ⑤ ベイズ定理と仮説検証
|
コマの展開方法
|
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
|
小テスト
|
「小テスト」については、毎回の授業終了時、manaba上において5問以上の、当該コマの小テスト(難易度表示付き)を実施します。
|
復習・予習課題
|
予習: 講義用パワーポイントを読んで、ベイズ定理の概念、ベイズ定理の公式、仮説検証について確認しておきましょう。復習:講義用パワーポイントを再度見直して、ベイズ定理の概念、ベイズ定理の式、仮説検証について理解しておき、もう一度授業中にやったザ フェデラリストの著者を検証する例題を解いてみましょう。この講義では、仮説検証に役立つベイズ定理の式を学習しましたが、基本的にはこれまで学習した式と同じであることを理解しておきましょう。Manabaにこれらについての例題を数問ずつリストしてあるので、それを解いてみて理解度を確認しておきましょう。もし分からない箇所があれば担当科目教員かクラスメイトに訊いて理解しておきましょう。(予習・復習時間30分)
|
15
|
統計の間違った使い方ガイド
|
科目の中での位置付け
|
このコマでは、p値の間違った解釈のしかた、間違ったグラフの作り方、疑似反復について学習する。これらの問題は、抱負な経験を持つ研究者であっても、間違いやすい問題なので、このコマでしっかりと学習することによって、社会に出て何かの研究についてのニュースを目にしたり、論文を読むような機会などに役に立つ。p値の棄却値は比較的適当に決められた0.05を習慣的に、そして自動的に使うようになった。そのようなp値の使い方が統計解析を解釈する上で足かせになっていたり、間違った解釈に導くことになっていることを学ぶ。グラフは正しく使われると、効果的にそして視覚的に情報を相手に伝えることができる。しかし、使い方を間違えれば誤解を招くような情報や間違った情報を相手に与えることになってしまう。また、研究の中での疑似反復とは、同じデータ元から複数回データをとることによって、データに含まれる値の数だけは多くのサンプルから取ったデータと同じようにすることである。疑似反復をすることによって研究結果から個人差というものを排除することが困難になる。
|
講義用パワーポイント
|
コマ主題細目
|
① p値 ② グラフ ③ 疑似反復
|
細目レベル
|
① ここでは、p値の間違った解釈のしかたについて学習する。p値の棄却値は比較的適当に決められた0.05を習慣的に、そして自動的に使うようになった。そのようなp値の使い方が統計解析を解釈する上で足かせになっていたり、間違った解釈に導くことになっていることを学ぶ。p値が非常に小さい値であった時(例:p = .0000001)、よくなされる間違った解釈としては、結果は超重要、現実社会においても大切な結果、次に同じデータを取ったときにも同じ確率で同じ結果になる、といったことが挙げられる。また、「p値が 0.0001だったので、この結果は1万分の1の確率でしか統計的なまぐれ当りではない。」と言った解釈がなされることもあるが、p値はテストしている何かが効果的である確率を表すものではない。過誤である確率は更に高いことが多い。更に、.05以下のp値をさがすためになされるフィシングの概念とその問題点について学習する。
|
② この授業では、間違ったグラフの作り方について学習する。グラフは正しく使われると、効果的にそして視覚的に情報を相手に伝えることができる。しかし、使い方を間違えれば誤解を招くような情報や間違った情報を相手に与えることになってしまう。その例として、y軸の幅のとり方の問題がある。棒グラフやヒストグラムのy軸の幅を極端に狭めることで、本来なら小さな差が大きな差に見えてしまう。専門家なら気がつくかもしれないが、瞬間的に棒グラフの差だけを見たり、研究者としての訓練を受けていない人であったりすると、誤解してしまうかもしれない。似たような間違いに、x軸を極端に狭めることがある。折れ線グラフでx軸を極端に狭めてしまうと、これもごく小さな差が大きく見えてしまう。これらの、例を学ぶことによって、正しいグラフの作成方法や研究結果の見方を理解する。
|
③ 更にこのコマでは、疑似反復の問題について学習する。研究の中での疑似反復とは、同じデータ元から複数回データをとることによって、データに含まれる値の数だけは多くのサンプルから取ったデータと同じようにすることである。例えば、1000人からデータを取る代わりに、10人から100回データを取る。2匹のネズミから採取した大量の脳神経細胞。同じ培養物から取り出した大量の細胞などがある。ランダムに選ばれた多くの対象からデータを取れば、個人差を考慮することなく結論を主張できるが、同じ対象から多くのデータをとることで個人差によって統計解析の結果が変わってしまうということが起こる。また、周期的に起こる出来事が同期する場合の問題や、基礎比率の無視で起こる問題についても学習する。
|
キーワード
|
① p値 ② フィッシング ③ グラフ ④ 疑似反復 ⑤ 基礎比率の無視
|
コマの展開方法
|
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
|
小テスト
|
「小テスト」については、毎回の授業終了時、manaba上において5問以上の、当該コマの小テスト(難易度表示付き)を実施します。
|
復習・予習課題
|
予習: 授業用のパワーポイントスライドを見て様々な統計の間違った使い方について確認しておく。復習:p値の間違った解釈のしかた、フィッシング、基礎比率の無視、大量の比較、偽陽性率、間違ったグラフの作り方、疑似反復、周期的に起こる出来事の同期について理解しておく。とくに、p値の間違った解釈は頻繁に起こるため、p値の正しい解釈とともに覚えておく。さらに、間違ったグラフの使い方も、研究結果を報告するときだけでなく、広告や宣伝など社会のあらゆるところで目にすることがあることなので、しっかりと理解しておくことが大切である。これらのことで、もし分からない箇所があれば担当科目教員かクラスメイトに訊いて理解しておく。(予習・復習時間30分)
|