区分 フィールド生態科目 フィールド生態共通科目
ディプロマ・ポリシーとの関係
専門性 理解力 実践力
カリキュラム・ポリシーとの関係
専門知識 教養知識 思考力
実行力
カリキュラム全体の中でのこの科目の位置づけ
個人・社会・自然が直面する課題に対して専門的な理解を深めると共に、学際的な柔軟性を有し、実践的な能力を有する。
科目の目的
 卒業研究のみならず、情報が重要視される社会の中では、データを適切に取り扱い、正しく解釈するための能力が必要である。その際に、得たデータに対して、主観を除いて客観的に分析するための知識が求められる。本科目では、前提とする科目である基礎数学で習得した知識をベースとし、統計解析の基本的な考え方を身に付けるとともに、解析を実行するための手法を学ぶ。本講義によって、統計データの意味を読み取る力をつけるとともに、データの収集方法、データの集計方法、データの分析・解析方法を習得することとする。なお、全授業終了時には、統計検定3級程度のデータ分析能力が獲得できていることが望まれる。
到達目標
 統計解析の基礎となる概念、意義について理解し、解析を実行できる能力を身につけることを目標とする。具体的には、確率分布と期待値、標準偏差の関係、母集団と標本の関係を理解し、標本の解析から母集団の推測、検定を行うことの意義と限界を理解する。また、様々な解析方法の中から、それぞれに適した解析手法を実行できるようになることで、データを正しく解釈できるようになる。さらには、卒業研究を実施する際に求められる実験デザインを組み立てられるようになる。
科目の概要
 本講義では、最初に統計解析の基本部分を次の順序学ぶ:①データを集計したときに示される基本統計量とは何か理解する。②統計解析を実施するために欠かすことのできない確率分布や確率変数について理解する。③得られたデータからどんなことが予測されるかなど、推定や検定の基本理論を理解する。④検定方法をいくつか紹介し、どういった場合にどの検定方法を利用すべきなのか理解できるようになる。⑤あるデータAと別のデータBとの関係性について理解する。⑥あるデータAから別のデータBを予測するための回帰分析について理解する。
 統計解析の基本を学んだのちに、卒業研究等で実践できる統計解析手法について次の順序で学ぶ:⑧統計モデリングとは何か理解する。⑨統計ソフトRを用いて特定の確率分布を仮定した解析方法の理論と、一般化線形モデルとの繋がりを理解する。⑩統計ソフトRを用いて一般化線形モデルの組み立てを理解する。⑪一般化線形モデルの解析結果について理解する。⑫一般化線形モデルによる様々な解析事例を理解する。⑬一般化線形モデルのカテゴリカル変数が有意になったのちに行う多重比較について理解する。⑭統計解析を実行するために必要な調査・実験デザインについて理解する。
 なお、7回目、15回目の講義は、これまでの復習回とし、実践問題の練習を行うこととする。一連の講義を通して、卒業研究などで統計解析を実行するための実践的な知識・技術を身につけることができる。

科目のキーワード
確率分布、推定、検定、相関、回帰、一般化線形モデル、モデル選択、多重比較、実験計画法、R
授業の展開方法
 講義では、教員が作成した資料を利用し、その配布資料等を用いる。配布資料は、ワード、エクセル、パワーポイントによって作成された資料等で、教員がスクリーンに投影しながら解説する。場合によっては黒板への板書も併用する。授業中には、それぞれのパソコンを利用し、統計解析手法を提示する。また、予習・復習課題の中で数多くの練習問題にも取り組む。取り組んだ練習問題は、授業の中で解説する。講義、パソコン操作による実習、練習問題を通して、卒業研究の実施時や社会人になってからも十分活用できる統計解析技術を身につける。
オフィス・アワー
【月曜日】昼休み(前期のみ)、【水曜日】1時限目(後期のみ)、【木曜日】昼休み
科目コード ENS218
学年・期 2年・後期
科目名 統計処理法
単位数 4
授業形態 講義
必修・選択 必修
学習時間 【授業】90分×15 【予習】90分以上×15 【復習】90分以上×15
前提とする科目 基礎数学、統計プログラミング実習
展開科目 なし
関連資格 なし
担当教員名 立脇隆文
主題コマシラバス項目内容教材・教具
1 基本統計量 科目の中での位置付け  本講義では、最初に統計解析の基本部分を次の順序学ぶ:①データを集計したときに示される基本統計量とは何か理解する。②統計解析を実施するために欠かすことのできない確率分布や確率変数について理解する。③得られたデータからどんなことが予測されるかなど、推定や検定の基本理論を理解する。④検定方法をいくつか紹介し、どういった場合にどの検定方法を利用すべきなのか理解できるようになる。⑤あるデータAと別のデータBとの関係性について理解する。⑥あるデータAから別のデータBを予測するための回帰分析について理解する。統計解析の基本を学んだのちに、卒業研究等で実践できる統計解析手法について次の順序で学ぶ:⑧統計モデリングとは何か理解する。⑨統計ソフトRを用いて特定の確率分布を仮定した解析方法の理論と、一般化線形モデルとの繋がりを理解する。⑩統計ソフトRを用いて一般化線形モデルの組み立てを理解する。⑪一般化線形モデルの解析結果について理解する。⑫一般化線形モデルによる様々な解析事例を理解する。⑬一般化線形モデルのカテゴリカル変数が有意になったのちに行う多重比較について理解する。⑭統計解析を実行するために必要な調査・実験デザインについて理解する。なお、7回目、15回目の講義は、これまでの復習回とし、実践問題の練習を行うこととする。一連の講義を通して、卒業研究などで統計解析を実行するための実践的な知識・技術を身につけることができる。
 1回目の講義では、基本統計量について理解することを目的とし、最初に、I. データの代表値 II. データのばらつき III. データ計算 について講義を行う。その後、学んだことについて、統計解析の演習並びに問題の解説を行う。


I.データの代表値
高橋一雄『語りかける高校数学』、ベレ出版、2013年、p. 614-616. 
芳沢光雄『新体系・高校数学の教科書 上』、講談社、2010年、p. 70-74.)
II.データのばらつき
日本統計学会編『改訂版 日本統計学会公式認定 統計検定3級対応 データの分析』、東京図書株式会社、2020年、p. 55-58,
日本統計学会編『改訂版 日本統計学会公式認定 統計検定3級対応 データの分析』、東京図書株式会社、2020年、p. 31-34.,
III.データ計算
高橋一雄『語りかける高校数学』、ベレ出版、2013年、p. 613-614
鳥居泰彦『はじめての統計学』日本経済新聞出版社、1994年、p. 8-9, 33-36.
櫻井広幸・神宮英雄「使える統計学」ナカニシヤ出版、2003年、p29-53

②授業配布プリント、各自のパソコン

③授業配布プリント、各自のパソコン
コマ主題細目 ① 基本統計量 ② 統計解析の演習 ③ 統計演習の解説
細目レベル ① 基本統計量について理解する。
I. データの代表値
データを集計した場合、何らかの代表値を用いてそのデータを表現することは多い。代表的なものに平均値がある。データの合計値からデータ数を割った「相加平均」が一般的であるが、そのほかにもデータをすべて掛け合わせてデータ数乗根(例えば、データが2,3,5とすると、2×3×5の三乗根)をとる「相乗平均」というものもある。その他の代表値としては、最大値、最小値、中央値、最頻値などがよく知られている。

II. データのばらつき
 データのばらつきは、データ全体の特徴を知るために非常に大事な指標である。もっとも一般的なものは、平均値の差(=偏差)を二乗してその平均をとる「分散」と、分散の平方根である「標準偏差」である。なお、偏差はすべて合計すると0になる特徴を持つ。ばらつきの計算は複雑な部分もあるため、練習問題を繰り返すことで意味や仕組みの理解を深める。

III. データ計算
 上述のデータの代表値やデータのばらつきは、一つ一つ手計算で求めると非常に労力がかかる。そこで表計算ソフト(主にエクセル)を利用して算出する方法を学ぶ。具体的には、エクセルの関数を覚えることで数値を出せるようになることを目標とする。覚えるべき関数は、平均(average)、最大値(max)、最小値(min)、中央値(median)、最頻値(mode)、分散(var.p)、標準偏差(stdev.p)である。これらを問題なく使えるようになることを目標とする。

② 講義で学んだ統計解析手法の実践を行う
 卒業研究などでデータ解析が必要な場合、統計学の講義で学んだ知識を自分の研究に応用することが求められる。しかしながら、特に研究経験の浅い卒論生の場合、学んだ知識をどのように活用すればよいか困惑することが多い。
 主要な困惑事項として、①適切に解析を実行するためにはどのようにデータをエクセル等に集計すべきなのか、②数多い解析方法がある中で自身の調査にはどの手法を選択すればよいのか、③アプリケーションでその解析を実行するためにはどのような操作が必要か、といったことが挙げられる。
 本項では、担当教員が出す様々な実践的な課題の問題演習を繰り返しながら、上述の①~③について解決を図る。なお本項目では、各自がパソコンを持参し、それぞれが確実に解析作業を実践できるようになることを目指す。


③ 実践問題の解答確認及び問題解説から、解析技術を定着させる
 前項で、担当教員の出した統計解析の問題を各自取り組むこととした。しかしながら、初めての解析作業では、操作方法などでトラブルの発生も予想され、学生間で習得状況の差異が発生することも懸念される。
 そこで本項では、全員が確実に解析できるようになることを目指すため、グループワークも取り入れることとする。グループメンバー同士が助け合いながら、与えられた課題の解決を図り、解析技術を習得できる展開とする。解析方法を実施できたメンバーは、解析で困っている他のメンバーにアドバイスすることで、お互いの解析技術の向上に役立てる。
 最後に、与えられた統計課題について、担当教員が解説を行う。求める課題解決のためには、①どのようにデータをまとめるべきだったか、②どのような解析手法を選択する必要があったのか、③その手法を実施するためにはどのような操作が必要か、これらを確認してもらいたい。①~③について、自身(グループ)で考えた方法と教員が示した方法とを比較することで解析技術を定着させる。

 

キーワード ① 代表値 ② ばらつき ③ データ ④ 問題演習 ⑤ 問題解説
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 【復習】今回のコマシラバスの細目レベルをあらためて熟読し、知識を深める。特に担当教員から学んだ「細目レベル①」の項目については、今回の授業のベースとなる部分なので、細かい部分まで理解しておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。また、講義の中で配布された資料についても見直しておく。コマシラバスや授業資料の一連の見直しが終わった段階で、授業中に配布された課題プリントに取り組む。課題プリントは本講義で学んだ内容に関する、基礎から応用にわたる練習問題である。最初は何も参考にせずに課題プリントに取組み、分からない部分があったらコマシラバスや授業資料を参考して解けるようにしてほしい。課題プリントの答え合わせ及び解説は次回の授業の中で行う。

【予習】次回のコマシラバス「細目レベル①」を熟読し、次回の授業で実施する項目について準備をしておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。

2 確率論の基礎 科目の中での位置付け  本講義では、最初に統計解析の基本部分を次の順序学ぶ:①データを集計したときに示される基本統計量とは何か理解する。②統計解析を実施するために欠かすことのできない確率分布や確率変数について理解する。③得られたデータからどんなことが予測されるかなど、推定や検定の基本理論を理解する。④検定方法をいくつか紹介し、どういった場合にどの検定方法を利用すべきなのか理解できるようになる。⑤あるデータAと別のデータBとの関係性について理解する。⑥あるデータAから別のデータBを予測するための回帰分析について理解する。統計解析の基本を学んだのちに、卒業研究等で実践できる統計解析手法について次の順序で学ぶ:⑧統計モデリングとは何か理解する。⑨統計ソフトRを用いて特定の確率分布を仮定した解析方法の理論と、一般化線形モデルとの繋がりを理解する。⑩統計ソフトRを用いて一般化線形モデルの組み立てを理解する。⑪一般化線形モデルの解析結果について理解する。⑫一般化線形モデルによる様々な解析事例を理解する。⑬一般化線形モデルのカテゴリカル変数が有意になったのちに行う多重比較について理解する。⑭統計解析を実行するために必要な調査・実験デザインについて理解する。なお、7回目、15回目の講義は、これまでの復習回とし、実践問題の練習を行うこととする。一連の講義を通して、卒業研究などで統計解析を実行するための実践的な知識・技術を身につけることができる。
 2回目の講義では、統計解析を実行する際に欠かすことのできない確率に着目し、最初に、I. 確率の意味 II. 確率変数 III. 確率密度分布 について講義を行う。その後、学んだことについて、統計解析の演習並びに問題の解説を行う。


I.確率の意味
本丸諒『文系のための統計学の教科書』ソシム株式会社、2019年、P20-31
II.確率変数
日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P.137-139.
III.確率密度分布
本丸諒『文系のための統計学の教科書』ソシム株式会社、2019年、P86-118
  永野裕之『統計学見るだけノート』宝島社、2018年、P60-63
櫻井広幸・神宮英雄「使える統計学」ナカニシヤ出版、2003年、p55-76

②授業配布プリント、各自のパソコン

③授業配布プリント、各自のパソコン
コマ主題細目 ① 確率論 ② 統計解析の演習 ③ 統計演習の解説
細目レベル ① 確率論について、以下の内容を理解する。

I.確率の意味
 確率とは、不確定な事象の起こる程度を表すために、事象に 0 以上 1 以下の数を対応させたものである。つまり、ある事柄がどれくらい確かに起こりうるのかを、割合で表したものである。ある事柄Aとある事柄Bが同時に起こる確率を算出する場合、Aの起こる確率とBの起こる確率の積をとって示す。また、起こりうるすべて事柄の確率を合計すると1になる。

II.確率変数
 ここで、3つの事柄A,B,Cあり、Aになると0点、Bになると1点、Cになる2点を取るゲームを行うとする。Aの起こる確率(0点になる確率)は5/10、Bの起こる確率(1点になる確率)は3/10、Cの起こる確率(2点になる確率)は2/10であると仮定する。確率をP,点数をXとおくと、上記の内容は、P(X=0)=5/10、P(X=1)=3/10、P(X=3)=2/10と表すことができる。このとき、変数X(今回の場合は点数のこと)を、確率変数という。確率変数には、整数のみをとるもの(離散型 例えば年齢、人数)、小数も含まれるもの(離散型 例えば身長、体重)がある。

III.確率密度分布
 ここで、確率変数ごとの確率のヒストグラムを作成してみる。-5点から5点までのカードから1枚引くゲームを行う(実験1)。5000回繰り返しゲームを起こったとして、各点数を引いた回数のヒストグラムを作成してみると、どの点数もおおよそ500回程度の値をとるだろう。引いた回数を試行回数の5000回で割ると、各得点の確率が計算でき、おおよそ1/10であることが確認できる。
 つぎに、3回カードをひいてその平均値を得点とするゲームをしたとする(実験2)。すなわち、3回とも5点のカードを引けば5点となり、1点,2点,3点のカードを引けば2点となるゲームである。先ほどと同様に点数のヒストグラムを作成すると、今度は0点になる回数が最も多く、-5点や5点になる回数は最も小さくなるだろう。試行回数で割ると同様にそれぞれの確率を算出することができる。
 試行回数を繰り返し、ヒストグラフの頭を折れ線でつないでいくと、実験1では一直線のグラフが、実験2では釣鐘型のグラフができる。これらの線が表す形を確率分布、線の数式を確率密度関数という。代表的な確率分布には、正規分布、一様分布、ポアソン分布などが挙げられる。正規分布については、データの平均値と標準偏差を利用することで、確率密度関数を作成することができる。

② 講義で学んだ統計解析手法の実践を行う
 卒業研究などでデータ解析が必要な場合、統計学の講義で学んだ知識を自分の研究に応用することが求められる。しかしながら、特に研究経験の浅い卒論生の場合、学んだ知識をどのように活用すればよいか困惑することが多い。
 主要な困惑事項として、①適切に解析を実行するためにはどのようにデータをエクセル等に集計すべきなのか、②数多い解析方法がある中で自身の調査にはどの手法を選択すればよいのか、③アプリケーションでその解析を実行するためにはどのような操作が必要か、といったことが挙げられる。
 本項では、担当教員が出す様々な実践的な課題の問題演習を繰り返しながら、上述の①~③について解決を図る。なお本項目では、各自がパソコンを持参し、それぞれが確実に解析作業を実践できるようになることを目指す。


③ 実践問題の解答確認及び問題解説から、解析技術を定着させる
 前項で、担当教員の出した統計解析の問題を各自取り組むこととした。しかしながら、初めての解析作業では、操作方法などでトラブルの発生も予想され、学生間で習得状況の差異が発生することも懸念される。
 そこで本項では、全員が確実に解析できるようになることを目指すため、グループワークも取り入れることとする。グループメンバー同士が助け合いながら、与えられた課題の解決を図り、解析技術を習得できる展開とする。解析方法を実施できたメンバーは、解析で困っている他のメンバーにアドバイスすることで、お互いの解析技術の向上に役立てる。
 最後に、与えられた統計課題について、担当教員が解説を行う。求める課題解決のためには、①どのようにデータをまとめるべきだったか、②どのような解析手法を選択する必要があったのか、③その手法を実施するためにはどのような操作が必要か、これらを確認してもらいたい。①~③について、自身(グループ)で考えた方法と教員が示した方法とを比較することで解析技術を定着させる。

 

キーワード ① 確率 ② 確率変数 ③ 確率密度分布 ④ 問題演習 ⑤ 問題解説
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 【復習】今回のコマシラバスの細目レベルをあらためて熟読し、知識を深める。特に担当教員から学んだ「細目レベル①」の項目については、今回の授業のベースとなる部分なので、細かい部分まで理解しておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。また、講義の中で配布された資料についても見直しておく。コマシラバスや授業資料の一連の見直しが終わった段階で、授業中に配布された課題プリントに取り組む。課題プリントは本講義で学んだ内容に関する、基礎から応用にわたる練習問題である。最初は何も参考にせずに課題プリントに取組み、分からない部分があったらコマシラバスや授業資料を参考して解けるようにしてほしい。課題プリントの答え合わせ及び解説は次回の授業の中で行う。

【予習】次回のコマシラバス「細目レベル①」を熟読し、次回の授業で実施する項目について準備をしておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。

3 推定・検定理論 科目の中での位置付け  本講義では、最初に統計解析の基本部分を次の順序学ぶ:①データを集計したときに示される基本統計量とは何か理解する。②統計解析を実施するために欠かすことのできない確率分布や確率変数について理解する。③得られたデータからどんなことが予測されるかなど、推定や検定の基本理論を理解する。④検定方法をいくつか紹介し、どういった場合にどの検定方法を利用すべきなのか理解できるようになる。⑤あるデータAと別のデータBとの関係性について理解する。⑥あるデータAから別のデータBを予測するための回帰分析について理解する。統計解析の基本を学んだのちに、卒業研究等で実践できる統計解析手法について次の順序で学ぶ:⑧統計モデリングとは何か理解する。⑨統計ソフトRを用いて特定の確率分布を仮定した解析方法の理論と、一般化線形モデルとの繋がりを理解する。⑩統計ソフトRを用いて一般化線形モデルの組み立てを理解する。⑪一般化線形モデルの解析結果について理解する。⑫一般化線形モデルによる様々な解析事例を理解する。⑬一般化線形モデルのカテゴリカル変数が有意になったのちに行う多重比較について理解する。⑭統計解析を実行するために必要な調査・実験デザインについて理解する。なお、7回目、15回目の講義は、これまでの復習回とし、実践問題の練習を行うこととする。一連の講義を通して、卒業研究などで統計解析を実行するための実践的な知識・技術を身につけることができる。
 3回目の講義では、データ解析をすすめるうえで必須となる推定や検定の基本理論を理解することを目的とし、最初に、I.データからの推定 II.検定の理論 III.平均値の差の検定(t検定)について講義を行う。その後、学んだことについて、統計解析の演習並びに問題の解説を行う。


I.データからの推定
本丸諒『文系のための統計学の教科書』ソシム株式会社、2019年、P192-204
永野裕之『統計学見るだけノート』宝島社、2018年、P150-153
櫻井広幸・神宮英雄「使える統計学」ナカニシヤ出版、2003年、p85-87
II.検定の理論
永野裕之『統計学見るだけノート』宝島社、2018年、P164-165
櫻井広幸・神宮英雄「使える統計学」ナカニシヤ出版、2003年、p88-89
III.平均値の差の検定(t検定)
向後千春・冨永敦子「統計学がわかる」技術評論社、2007年、第4章,pp173
http://kogolab.chillout.jp/elearn/hamburger/chap4/sec1.html
櫻井広幸・神宮英雄「使える統計学」ナカニシヤ出版、2003年、p94-99

②授業配布プリント、各自のパソコン

③授業配布プリント、各自のパソコン
コマ主題細目 ① 推定と検定 ② 統計解析の演習 ③ 統計演習の解説
細目レベル ① 推定や検定について、以下の内容を理解する。

I.データからの推定
 今回はハンバーガーショップでのアルバイトの事例を考えてみる。お客様から、自分のポテトの本数が少なかったと苦情があった。そこで、大量に作られるポテトを10個選び平均と標準偏差を調べてみた。その結果をお客様に伝えたところ、10個程度の結果は信頼できないといわれた。
 このように、サンプルの平均(標本平均)とばらつき(標本分散等)を調べたところで、全体(母数)の平均(母平均)とばらつき(母分散等)はわからない。平均に着目すると、標本データから確率分布を作成することで、母平均を推定することができる。このとき、母平均は点で推定するのではなく、区間で推定する。通常、作成した確率分布の上限2.5%、下限2.5%の区域を除いて、95%信頼区間という形で母平均を推定する。

II.検定の理論
 別のお客様から、うちのショップのポテトは、隣町のショップのポテトよりを量が少ないのではないか、という苦情があった。そこで、ポテトの重さを比較することとした。両ショップのポテトを1つずつ買ってきて、その重さの差を調べ、ヒストグラム①を作成する。両ショップのポテトに差がなければ、作成したヒストグラムは0をピークとした形になるはずである。しかし、両者の差(隣町のポテトの重さ―うちのポテト重さ)が、ヒストグラム①の端のほうに位置した。この場合、両ショップのポテトの重さに差がない、という条件下では、めったに起きないことが生じたわけである。
 このようにめったに起きないことが起きた場合、そもそもの前提が誤っているのではないかと考える。すなわち、「両ショップのポテトに差がない」という仮説は誤りで、「両ショップのポテトに差がある」という仮説のほうが正しいのではないか、ということである。
 統計学的には、前者の仮説を「帰無仮説」、後者の仮説を「対立仮説」という。めったに起きない確率の基準は「有意水準」と呼ばれ、通常5%に設定される。この事例の場合、両ポテトの重さの差が、確率分布の5%未満の箇所(すなわちヒストグラムの端の方)に位置したため、帰無仮説(両ショップのポテトに差がない)を棄却して、対立仮説(両ショップのポテトに差がある)を採択した。この一連の作業を検定と呼ぶ。

III.平均値の差の検定(t検定)
 ここで問題となるのは、検定を行う際にどのような確率分布を利用すればよいのか、ということである。この事例のように、平均値の差を検定する場合、t分布という確率分布を利用することが一般的である。t分布とは、自由度(データ数とほぼ同義)によって形が決まる分布であり、自由度が大きくなると標準正規分布(平均0、標準偏差1の正規分布)に近似される特徴を持つ。t分布を使って両者の差の有無を検定することをt検定という。

② 講義で学んだ統計解析手法の実践を行う
 卒業研究などでデータ解析が必要な場合、統計学の講義で学んだ知識を自分の研究に応用することが求められる。しかしながら、特に研究経験の浅い卒論生の場合、学んだ知識をどのように活用すればよいか困惑することが多い。
 主要な困惑事項として、①適切に解析を実行するためにはどのようにデータをエクセル等に集計すべきなのか、②数多い解析方法がある中で自身の調査にはどの手法を選択すればよいのか、③アプリケーションでその解析を実行するためにはどのような操作が必要か、といったことが挙げられる。
 本項では、担当教員が出す様々な実践的な課題の問題演習を繰り返しながら、上述の①~③について解決を図る。なお本項目では、各自がパソコンを持参し、それぞれが確実に解析作業を実践できるようになることを目指す。


③ 実践問題の解答確認及び問題解説から、解析技術を定着させる
 前項で、担当教員の出した統計解析の問題を各自取り組むこととした。しかしながら、初めての解析作業では、操作方法などでトラブルの発生も予想され、学生間で習得状況の差異が発生することも懸念される。
 そこで本項では、全員が確実に解析できるようになることを目指すため、グループワークも取り入れることとする。グループメンバー同士が助け合いながら、与えられた課題の解決を図り、解析技術を習得できる展開とする。解析方法を実施できたメンバーは、解析で困っている他のメンバーにアドバイスすることで、お互いの解析技術の向上に役立てる。
 最後に、与えられた統計課題について、担当教員が解説を行う。求める課題解決のためには、①どのようにデータをまとめるべきだったか、②どのような解析手法を選択する必要があったのか、③その手法を実施するためにはどのような操作が必要か、これらを確認してもらいたい。①~③について、自身(グループ)で考えた方法と教員が示した方法とを比較することで解析技術を定着させる。

 

キーワード ① 推定 ② 検定 ③ t検定 ④ 問題演習 ⑤ 問題解説
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 【復習】今回のコマシラバスの細目レベルをあらためて熟読し、知識を深める。特に担当教員から学んだ「細目レベル①」の項目については、今回の授業のベースとなる部分なので、細かい部分まで理解しておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。また、講義の中で配布された資料についても見直しておく。コマシラバスや授業資料の一連の見直しが終わった段階で、授業中に配布された課題プリントに取り組む。課題プリントは本講義で学んだ内容に関する、基礎から応用にわたる練習問題である。最初は何も参考にせずに課題プリントに取組み、分からない部分があったらコマシラバスや授業資料を参考して解けるようにしてほしい。課題プリントの答え合わせ及び解説は次回の授業の中で行う。

【予習】次回のコマシラバス「細目レベル①」を熟読し、次回の授業で実施する項目について準備をしておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。

4 基本的な検定 科目の中での位置付け  本講義では、最初に統計解析の基本部分を次の順序学ぶ:①データを集計したときに示される基本統計量とは何か理解する。②統計解析を実施するために欠かすことのできない確率分布や確率変数について理解する。③得られたデータからどんなことが予測されるかなど、推定や検定の基本理論を理解する。④検定方法をいくつか紹介し、どういった場合にどの検定方法を利用すべきなのか理解できるようになる。⑤あるデータAと別のデータBとの関係性について理解する。⑥あるデータAから別のデータBを予測するための回帰分析について理解する。統計解析の基本を学んだのちに、卒業研究等で実践できる統計解析手法について次の順序で学ぶ:⑧統計モデリングとは何か理解する。⑨統計ソフトRを用いて特定の確率分布を仮定した解析方法の理論と、一般化線形モデルとの繋がりを理解する。⑩統計ソフトRを用いて一般化線形モデルの組み立てを理解する。⑪一般化線形モデルの解析結果について理解する。⑫一般化線形モデルによる様々な解析事例を理解する。⑬一般化線形モデルのカテゴリカル変数が有意になったのちに行う多重比較について理解する。⑭統計解析を実行するために必要な調査・実験デザインについて理解する。なお、7回目、15回目の講義は、これまでの復習回とし、実践問題の練習を行うこととする。一連の講義を通して、卒業研究などで統計解析を実行するための実践的な知識・技術を身につけることができる。
 4回目の講義では、検定方法をいくつか紹介し、どういった場合にどの検定方法を利用すべきなのか理解できるようになることを目的とし、最初に、I.パラメトリックとノンパラメトリック II.比率の差の検定(独立性の検定)(X2検定) III.検定方法の検討(マンホイットニー) について講義を行う。その後、学んだことについて、統計解析の演習並びに問題の解説を行う。


I.パラメトリックとノンパラメトリック
石村貞夫『統計解析のはなし』東京図書,1989年,p257
櫻井広幸・神宮英雄「使える統計学」ナカニシヤ出版、2003年、p141-142
II.比率の差の検定(独立性の検定)(X2検定)
石村貞夫『統計解析のはなし』東京図書,1989年,p247-250
向後千春・冨永敦子「統計学がわかる」技術評論社、2007年、第3章,pp173
http://kogolab.chillout.jp/elearn/hamburger/chap3/sec0.html
櫻井広幸・神宮英雄「使える統計学」ナカニシヤ出版、2003年、p146-162
永野裕之『統計学見るだけノート』宝島社、2018年、P182-183
III.検定方法の検討(マンホイットニー)
石村貞夫『統計解析のはなし』東京図書,1989年,p258-265

②授業配布プリント、各自のパソコン

③授業配布プリント、各自のパソコン
コマ主題細目 ① 検定方法 ② 統計解析の演習 ③ 統計演習の解説
細目レベル ① 様々な検定方法ついて理解する

I.パラメトリックとノンパラメトリック
 前回の授業で、検定の理論について学んだ。前回見た検定とは、確率分布を利用して帰無仮説を棄却するかどうかで判断するものだった。帰無仮説を棄却する基準として、確率分布のめったに起きない端の箇所(有意水準5%未満)にデータが位置するか判断することが求められる。しかしながら、どちらの端が基準になるのかは示されていないため、解析者本人が設定することとなる。5%位置を両端に設定する検定(すなわち確率分布の左から2.5%位置と右から2.5%位置を基準とする検定)を両側検定と呼び、片端に設定する検定(すなわち確率分布の左から5%位置、もしくは右から5%位置を基準にする検定)を片側検定と呼ぶ。
 また、これまで見てきた検定には確率分布が必要であったが、データによっては確率分布を設定することができないものもある。例えば、好き嫌い、というデータはその典型である。このように確率分布を書くことのできないデータは別の方法によって検定をする。確率分布を用いずに検定するものをノンパラメトリック検定、確率分布を用いるものをパラメトリック検定と呼ぶ。
 
II.比率の差の検定(独立性の検定)(X2検定)
 ノンパラメトリック検定の例を確認する。今度の事例もハンバーガーショップを対象とし、自分のショップと隣町のショップでポテトとチキン販売割合を比較するものである。
 このような解析を行う際には、クロス集計表を利用する。自分のショップと隣町のショップの、ポテトとチキンの販売個数をクロス集計表にまとめる。このデータを観測度数と呼ぶ。
 続いて、自分のショップと隣町のショップで、ポテトとチキンに販売割合が同じとしたときの販売個数をまとめる。こちらも先ほどと同様にクロス集計表にまとめる。このデータを期待度数と呼び、これが帰無仮説を評価するものとのなる。
 2種類のクロス集計表が完成したら、両者の違いを検定する。ここで利用するのは「カイ二乗値」というものであり、(観測度数-期待度数)^2/期待度数の総和である。観測度数と期待度数の値が近い場合はカイ二乗値が0に近くなり、値が離れている場合はカイ二乗値が大きくなる。どれくらい大きければ両者に違いが認められるかは、カイ二乗分布を利用して判断する。カイ二乗分布のグラフから、得られた値が5%未満の部分に該当すれば、両者の間に差があると判断する。

III.検定方法の検討(マンホイットニー)
 パラメトリック検定とノンパラメトリック検定について学んだが、データの種類によって正しい検定を実施しないことには適切な結果が得られない。例えば、2種類の職業間で、コーヒーの好きな程度(1~5のランクで答えるようなデータ)に違いがあるか、t検定で分析しても正しい結果は得られない。2つの条件に違いがあるか検定する際、パラメトリックデータの場合はt検定を利用すればよいが、ノンパラメトリックデータの場合は別の方法を利用する。この場合、マンホイットニーのU検定などを利用するのがよい。

② 講義で学んだ統計解析手法の実践を行う
 卒業研究などでデータ解析が必要な場合、統計学の講義で学んだ知識を自分の研究に応用することが求められる。しかしながら、特に研究経験の浅い卒論生の場合、学んだ知識をどのように活用すればよいか困惑することが多い。
 主要な困惑事項として、①適切に解析を実行するためにはどのようにデータをエクセル等に集計すべきなのか、②数多い解析方法がある中で自身の調査にはどの手法を選択すればよいのか、③アプリケーションでその解析を実行するためにはどのような操作が必要か、といったことが挙げられる。
 本項では、担当教員が出す様々な実践的な課題の問題演習を繰り返しながら、上述の①~③について解決を図る。なお本項目では、各自がパソコンを持参し、それぞれが確実に解析作業を実践できるようになることを目指す。


③ 実践問題の解答確認及び問題解説から、解析技術を定着させる
 前項で、担当教員の出した統計解析の問題を各自取り組むこととした。しかしながら、初めての解析作業では、操作方法などでトラブルの発生も予想され、学生間で習得状況の差異が発生することも懸念される。
 そこで本項では、全員が確実に解析できるようになることを目指すため、グループワークも取り入れることとする。グループメンバー同士が助け合いながら、与えられた課題の解決を図り、解析技術を習得できる展開とする。解析方法を実施できたメンバーは、解析で困っている他のメンバーにアドバイスすることで、お互いの解析技術の向上に役立てる。
 最後に、与えられた統計課題について、担当教員が解説を行う。求める課題解決のためには、①どのようにデータをまとめるべきだったか、②どのような解析手法を選択する必要があったのか、③その手法を実施するためにはどのような操作が必要か、これらを確認してもらいたい。①~③について、自身(グループ)で考えた方法と教員が示した方法とを比較することで解析技術を定着させる。

 

キーワード ① パラメトリックとノンパラメトリック ② カイ二乗検定 ③ マンホイットニー検定 ④ 問題演習 ⑤ 問題解説
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 【復習】今回のコマシラバスの細目レベルをあらためて熟読し、知識を深める。特に担当教員から学んだ「細目レベル①」の項目については、今回の授業のベースとなる部分なので、細かい部分まで理解しておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。また、講義の中で配布された資料についても見直しておく。コマシラバスや授業資料の一連の見直しが終わった段階で、授業中に配布された課題プリントに取り組む。課題プリントは本講義で学んだ内容に関する、基礎から応用にわたる練習問題である。最初は何も参考にせずに課題プリントに取組み、分からない部分があったらコマシラバスや授業資料を参考して解けるようにしてほしい。課題プリントの答え合わせ及び解説は次回の授業の中で行う。

【予習】次回のコマシラバス「細目レベル①」を熟読し、次回の授業で実施する項目について準備をしておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。

5 相関 科目の中での位置付け  本講義では、最初に統計解析の基本部分を次の順序学ぶ:①データを集計したときに示される基本統計量とは何か理解する。②統計解析を実施するために欠かすことのできない確率分布や確率変数について理解する。③得られたデータからどんなことが予測されるかなど、推定や検定の基本理論を理解する。④検定方法をいくつか紹介し、どういった場合にどの検定方法を利用すべきなのか理解できるようになる。⑤あるデータAと別のデータBとの関係性について理解する。⑥あるデータAから別のデータBを予測するための回帰分析について理解する。統計解析の基本を学んだのちに、卒業研究等で実践できる統計解析手法について次の順序で学ぶ:⑧統計モデリングとは何か理解する。⑨統計ソフトRを用いて特定の確率分布を仮定した解析方法の理論と、一般化線形モデルとの繋がりを理解する。⑩統計ソフトRを用いて一般化線形モデルの組み立てを理解する。⑪一般化線形モデルの解析結果について理解する。⑫一般化線形モデルによる様々な解析事例を理解する。⑬一般化線形モデルのカテゴリカル変数が有意になったのちに行う多重比較について理解する。⑭統計解析を実行するために必要な調査・実験デザインについて理解する。なお、7回目、15回目の講義は、これまでの復習回とし、実践問題の練習を行うこととする。一連の講義を通して、卒業研究などで統計解析を実行するための実践的な知識・技術を身につけることができる。
 5回目の講義では、データとデータの関係性について理解することを目的とし、最初に、I.正の相関,負の相関,無相関 II.相関係数 III.無相関検定 について講義を行う。その後、学んだことについて、統計解析の演習並びに問題の解説を行う。


I.正の相関,負の相関,無相関
鳥居泰彦『はじめての統計学』日本経済新聞出版社、1994年、p.213-215.
日本統計学会編『改訂版 日本統計学会公式認定 統計検定3級対応 データの分析』、東京図書株式会社、2020年、p. 81-86.
II.相関係数
鳥居泰彦『はじめての統計学』日本経済新聞出版社、1994年、p.216-218.
日本統計学会編『改訂版 日本統計学会公式認定 統計検定3級対応 データの分析』、東京図書株式会社、2020年、p. 86-91.
III.無相関検定
張南『統計学の基礎と応用』中央経済社,1999年,p.190-195.

②授業配布プリント、各自のパソコン

③授業配布プリント、各自のパソコン
コマ主題細目 ① 相関 ② 統計解析の演習 ③ 統計演習の解説
細目レベル ① 二つのデータの関係について理解する。

I.正の相関,負の相関,無相関
 相関とは、二つの連続データ同士に関係があるか調べるものである。通常は散布図を使って判断する。あるデータをx、もう一つのデータをyとして散布図を描いた時、右上がりの関係が認められそうな場合は正の相関が、右下がりの関係が認められそうな場合は負の相関が、片方が変化してももう片方が変化しない場合は相関がない、といえる。

II.相関係数
 相関の有無の判断として、相関係数を利用したものが挙げられる。相関係数は-1から1の範囲をとり、プラスならば正の相関が、マイナスなら負の相関があると判断する。相関係数が-0.2~0.2の場合はほとんど相関関係がないと判断でき、1に近づくほど正の相関が、-1に近づくほど負の相関が強くなる。相関係数は、分子にxyの共分散を、分母にxとyの標準偏差の積を取ったものとして計算できる。xyの共分散とは、xの偏差×yの偏差の平均である。
 
III.無相関検定
 一方、有意水準を使って相関の有無を判断する方法もある。これを無相関検定という。無相関検定でも、扱うデータがパラメトリックかノンパラメトリックかで方法が異なる。パラメトリックデータ同士の無相関検定には、ピアソンの積率相関を用いる。一方、ノンパラメトリックデータを含む場合には、スピアマンの順位相関を用いる。

② 講義で学んだ統計解析手法の実践を行う
 卒業研究などでデータ解析が必要な場合、統計学の講義で学んだ知識を自分の研究に応用することが求められる。しかしながら、特に研究経験の浅い卒論生の場合、学んだ知識をどのように活用すればよいか困惑することが多い。
 主要な困惑事項として、①適切に解析を実行するためにはどのようにデータをエクセル等に集計すべきなのか、②数多い解析方法がある中で自身の調査にはどの手法を選択すればよいのか、③アプリケーションでその解析を実行するためにはどのような操作が必要か、といったことが挙げられる。
 本項では、担当教員が出す様々な実践的な課題の問題演習を繰り返しながら、上述の①~③について解決を図る。なお本項目では、各自がパソコンを持参し、それぞれが確実に解析作業を実践できるようになることを目指す。


③ 実践問題の解答確認及び問題解説から、解析技術を定着させる
 前項で、担当教員の出した統計解析の問題を各自取り組むこととした。しかしながら、初めての解析作業では、操作方法などでトラブルの発生も予想され、学生間で習得状況の差異が発生することも懸念される。
 そこで本項では、全員が確実に解析できるようになることを目指すため、グループワークも取り入れることとする。グループメンバー同士が助け合いながら、与えられた課題の解決を図り、解析技術を習得できる展開とする。解析方法を実施できたメンバーは、解析で困っている他のメンバーにアドバイスすることで、お互いの解析技術の向上に役立てる。
 最後に、与えられた統計課題について、担当教員が解説を行う。求める課題解決のためには、①どのようにデータをまとめるべきだったか、②どのような解析手法を選択する必要があったのか、③その手法を実施するためにはどのような操作が必要か、これらを確認してもらいたい。①~③について、自身(グループ)で考えた方法と教員が示した方法とを比較することで解析技術を定着させる。

 

キーワード ① 相関 ② 相関係数 ③ 無相関検定 ④ 問題演習 ⑤ 問題解説
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 【復習】今回のコマシラバスの細目レベルをあらためて熟読し、知識を深める。特に担当教員から学んだ「細目レベル①」の項目については、今回の授業のベースとなる部分なので、細かい部分まで理解しておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。また、講義の中で配布された資料についても見直しておく。コマシラバスや授業資料の一連の見直しが終わった段階で、授業中に配布された課題プリントに取り組む。課題プリントは本講義で学んだ内容に関する、基礎から応用にわたる練習問題である。最初は何も参考にせずに課題プリントに取組み、分からない部分があったらコマシラバスや授業資料を参考して解けるようにしてほしい。課題プリントの答え合わせ及び解説は次回の授業の中で行う。

【予習】次回のコマシラバス「細目レベル①」を熟読し、次回の授業で実施する項目について準備をしておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。

6 回帰分析 科目の中での位置付け  本講義では、最初に統計解析の基本部分を次の順序学ぶ:①データを集計したときに示される基本統計量とは何か理解する。②統計解析を実施するために欠かすことのできない確率分布や確率変数について理解する。③得られたデータからどんなことが予測されるかなど、推定や検定の基本理論を理解する。④検定方法をいくつか紹介し、どういった場合にどの検定方法を利用すべきなのか理解できるようになる。⑤あるデータAと別のデータBとの関係性について理解する。⑥あるデータAから別のデータBを予測するための回帰分析について理解する。統計解析の基本を学んだのちに、卒業研究等で実践できる統計解析手法について次の順序で学ぶ:⑧統計モデリングとは何か理解する。⑨統計ソフトRを用いて特定の確率分布を仮定した解析方法の理論と、一般化線形モデルとの繋がりを理解する。⑩統計ソフトRを用いて一般化線形モデルの組み立てを理解する。⑪一般化線形モデルの解析結果について理解する。⑫一般化線形モデルによる様々な解析事例を理解する。⑬一般化線形モデルのカテゴリカル変数が有意になったのちに行う多重比較について理解する。⑭統計解析を実行するために必要な調査・実験デザインについて理解する。なお、7回目、15回目の講義は、これまでの復習回とし、実践問題の練習を行うこととする。一連の講義を通して、卒業研究などで統計解析を実行するための実践的な知識・技術を身につけることができる。
 6回目の講義では、あるデータAから別のデータBを予測するための回帰分析について理解することを目的とし、最初に、I.最小二乗法と近似直線 II.近似式による予測 III.回帰直線を得ることの目的 について講義を行う。その後、学んだことについて、統計解析の演習並びに問題の解説を行う。


I.最小二乗法と近似直線
鳥居泰彦『はじめての統計学』日本経済新聞出版社、1994年、p.239-241.
II.近似式による予測
鳥居泰彦『はじめての統計学』日本経済新聞出版社、1994年、p.236-238.
III.回帰直線を得ることの目的
鳥居泰彦『はじめての統計学』日本経済新聞出版社、1994年、p.242-243.

②授業配布プリント、各自のパソコン

③授業配布プリント、各自のパソコン
コマ主題細目 ① 回帰 ② 統計解析の演習 ③ 統計演習の解説
細目レベル ① あるデータAから別のデータBを予測するための回帰分析について理解する。

I.最小二乗法と近似直線
 今回は、アイスクリームを売るコンビニ店員の事例で考えてみる。店長から、気温が高いため、今日はアイスがどれくらい売れるのか予想してほしいと頼まれた。過去のデータから、日中の最高気温と前日とのアイス売上差をプロットしたところ、正の相関が考えらえた。そこで、最高気温からアイスがどれだけ売れるか予想することを考える。
 散布図に右上がりの近似直線を引き、その近似直線の数式を利用すればアイス売上を予想できそうに感じる。しかしながら、問題はどのような直線式を利用すればよいかという点である。そこで、y=ax+bという近似直線を作成する際の、aとbの決定方法について考える。
 作成する直線は、プロットとの距離がもっとも小さくなるように設定するのがよいと考えられる。すなわち、プロットと直線の残差の2乗の合計値が、最も小さくなるようにすればよい。この方法を「最小二乗法」と呼ぶ。

II.近似式による予測
 近似直線のaとbの値は、xの標準偏差、yの標準偏差、xyの相関係数、yの平均、xの平均を利用することで算出することができる。

III.回帰直線を得ることの目的
 以上のようにして求めた近似直線を、回帰直線という。回帰直線を利用することで、次のようなメリットがある。①yの動きの特徴が分かる。②yの動きの法則が分かる。③yの動きを予測できる。④yの動きの理由や原因を推測することができる。

② 講義で学んだ統計解析手法の実践を行う
 卒業研究などでデータ解析が必要な場合、統計学の講義で学んだ知識を自分の研究に応用することが求められる。しかしながら、特に研究経験の浅い卒論生の場合、学んだ知識をどのように活用すればよいか困惑することが多い。
 主要な困惑事項として、①適切に解析を実行するためにはどのようにデータをエクセル等に集計すべきなのか、②数多い解析方法がある中で自身の調査にはどの手法を選択すればよいのか、③アプリケーションでその解析を実行するためにはどのような操作が必要か、といったことが挙げられる。
 本項では、担当教員が出す様々な実践的な課題の問題演習を繰り返しながら、上述の①~③について解決を図る。なお本項目では、各自がパソコンを持参し、それぞれが確実に解析作業を実践できるようになることを目指す。


③ 実践問題の解答確認及び問題解説から、解析技術を定着させる
 前項で、担当教員の出した統計解析の問題を各自取り組むこととした。しかしながら、初めての解析作業では、操作方法などでトラブルの発生も予想され、学生間で習得状況の差異が発生することも懸念される。
 そこで本項では、全員が確実に解析できるようになることを目指すため、グループワークも取り入れることとする。グループメンバー同士が助け合いながら、与えられた課題の解決を図り、解析技術を習得できる展開とする。解析方法を実施できたメンバーは、解析で困っている他のメンバーにアドバイスすることで、お互いの解析技術の向上に役立てる。
 最後に、与えられた統計課題について、担当教員が解説を行う。求める課題解決のためには、①どのようにデータをまとめるべきだったか、②どのような解析手法を選択する必要があったのか、③その手法を実施するためにはどのような操作が必要か、これらを確認してもらいたい。①~③について、自身(グループ)で考えた方法と教員が示した方法とを比較することで解析技術を定着させる。

 

キーワード ① 最小二乗法 ② 近似直線 ③ 回帰 ④ 問題演習 ⑤ 問題解説
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 【復習】今回のコマシラバスの細目レベルをあらためて熟読し、知識を深める。特に担当教員から学んだ「細目レベル①」の項目については、今回の授業のベースとなる部分なので、細かい部分まで理解しておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。また、講義の中で配布された資料についても見直しておく。コマシラバスや授業資料の一連の見直しが終わった段階で、授業中に配布された課題プリントに取り組む。課題プリントは本講義で学んだ内容に関する、基礎から応用にわたる練習問題である。最初は何も参考にせずに課題プリントに取組み、分からない部分があったらコマシラバスや授業資料を参考して解けるようにしてほしい。課題プリントの答え合わせ及び解説は次回の授業の中で行う。

【予習】次回のコマシラバス「細目レベル①」を熟読し、次回の授業で実施する項目について準備をしておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。

7 前半復習 科目の中での位置付け  本講義では、最初に統計解析の基本部分を次の順序学ぶ:①データを集計したときに示される基本統計量とは何か理解する。②統計解析を実施するために欠かすことのできない確率分布や確率変数について理解する。③得られたデータからどんなことが予測されるかなど、推定や検定の基本理論を理解する。④検定方法をいくつか紹介し、どういった場合にどの検定方法を利用すべきなのか理解できるようになる。⑤あるデータAと別のデータBとの関係性について理解する。⑥あるデータAから別のデータBを予測するための回帰分析について理解する。統計解析の基本を学んだのちに、卒業研究等で実践できる統計解析手法について次の順序で学ぶ:⑧統計モデリングとは何か理解する。⑨統計ソフトRを用いて特定の確率分布を仮定した解析方法の理論と、一般化線形モデルとの繋がりを理解する。⑩統計ソフトRを用いて一般化線形モデルの組み立てを理解する。⑪一般化線形モデルの解析結果について理解する。⑫一般化線形モデルによる様々な解析事例を理解する。⑬一般化線形モデルのカテゴリカル変数が有意になったのちに行う多重比較について理解する。⑭統計解析を実行するために必要な調査・実験デザインについて理解する。なお、7回目、15回目の講義は、これまでの復習回とし、実践問題の練習を行うこととする。一連の講義を通して、卒業研究などで統計解析を実行するための実践的な知識・技術を身につけることができる。
 7回目の講義では、これまでに学んだことの総復習を行って理解の定着を測ることを目的とし、最初に、I.統計量と確率 II.推定と検定 III.相関と回帰 について展開する。その後、学んだことについて、統計解析の演習並びに問題の解説を行う。

①これまでの課題学習プリント

②授業配布プリント、各自のパソコン

③授業配布プリント、各自のパソコン
コマ主題細目 ① 前半のおさらい ② 統計解析の演習 ③ 統計演習の解説
細目レベル ① これまでに学んできたことを、練習問題を交えて復習していく。

I.統計量と確率
 様々な統計量を理解できているか復習する。平均値や中央値は基本であるが、データの数が偶数個の場合の中央値の算出方法について理解できているか確認する。また、分散の算出方法、標準偏差を算出するときのエクセル関数も確認する。
 確率については、まずは簡単な確率計算の練習を行い、その後、確率の特徴、連続型・離散型の確率変数の違い、正規分布の確率密度関数に必要なパラメータについて復習する。

II.推定と検定
 推定と検定の理論は統計解析を行う際の基本であることから、確実に身に付けることができるように復習する。まずは95%信頼区間を算出する際のエクセル関数について確認する。検定の理論や、t検定の意味、カイ二乗検定の結果の見方についても確認する。パラメトリックデータとノンパラメトリックデータの違い、クロス集計表の作成方法ついても復習する。

III.相関と回帰
 2種類のデータの特徴を知ることは、8回目以降の統計解析の基本となる。そこで、まずは相関とは何かを復習する。次に、相関係数の算出方法について確認し、無相関検定の方法についても復習する。続いて、回帰直線を決定するための係数の算出方法について練習問題で確認する。


② 講義で学んだ統計解析手法の実践を行う
 卒業研究などでデータ解析が必要な場合、統計学の講義で学んだ知識を自分の研究に応用することが求められる。しかしながら、特に研究経験の浅い卒論生の場合、学んだ知識をどのように活用すればよいか困惑することが多い。
 主要な困惑事項として、①適切に解析を実行するためにはどのようにデータをエクセル等に集計すべきなのか、②数多い解析方法がある中で自身の調査にはどの手法を選択すればよいのか、③アプリケーションでその解析を実行するためにはどのような操作が必要か、といったことが挙げられる。
 本項では、担当教員が出す様々な実践的な課題の問題演習を繰り返しながら、上述の①~③について解決を図る。なお本項目では、各自がパソコンを持参し、それぞれが確実に解析作業を実践できるようになることを目指す。


③ 実践問題の解答確認及び問題解説から、解析技術を定着させる
 前項で、担当教員の出した統計解析の問題を各自取り組むこととした。しかしながら、初めての解析作業では、操作方法などでトラブルの発生も予想され、学生間で習得状況の差異が発生することも懸念される。
 そこで本項では、全員が確実に解析できるようになることを目指すため、グループワークも取り入れることとする。グループメンバー同士が助け合いながら、与えられた課題の解決を図り、解析技術を習得できる展開とする。解析方法を実施できたメンバーは、解析で困っている他のメンバーにアドバイスすることで、お互いの解析技術の向上に役立てる。
 最後に、与えられた統計課題について、担当教員が解説を行う。求める課題解決のためには、①どのようにデータをまとめるべきだったか、②どのような解析手法を選択する必要があったのか、③その手法を実施するためにはどのような操作が必要か、これらを確認してもらいたい。①~③について、自身(グループ)で考えた方法と教員が示した方法とを比較することで解析技術を定着させる。

 

キーワード ① 確率 ② 推定・検定 ③ 相関・回帰 ④ 問題演習 ⑤ 問題解説
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 【復習】今回のコマシラバスの細目レベルをあらためて熟読し、知識を深める。特に担当教員から学んだ「細目レベル①」の項目については、今回の授業のベースとなる部分なので、細かい部分まで理解しておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。また、講義の中で配布された資料についても見直しておく。コマシラバスや授業資料の一連の見直しが終わった段階で、授業中に配布された課題プリントに取り組む。課題プリントは本講義で学んだ内容に関する、基礎から応用にわたる練習問題である。最初は何も参考にせずに課題プリントに取組み、分からない部分があったらコマシラバスや授業資料を参考して解けるようにしてほしい。課題プリントの答え合わせ及び解説は次回の授業の中で行う。

【予習】次回のコマシラバス「細目レベル①」を熟読し、次回の授業で実施する項目について準備をしておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。

8 統計モデリング入門 科目の中での位置付け  本講義では、最初に統計解析の基本部分を次の順序学ぶ:①データを集計したときに示される基本統計量とは何か理解する。②統計解析を実施するために欠かすことのできない確率分布や確率変数について理解する。③得られたデータからどんなことが予測されるかなど、推定や検定の基本理論を理解する。④検定方法をいくつか紹介し、どういった場合にどの検定方法を利用すべきなのか理解できるようになる。⑤あるデータAと別のデータBとの関係性について理解する。⑥あるデータAから別のデータBを予測するための回帰分析について理解する。統計解析の基本を学んだのちに、卒業研究等で実践できる統計解析手法について次の順序で学ぶ:⑧統計モデリングとは何か理解する。⑨統計ソフトRを用いて特定の確率分布を仮定した解析方法の理論と、一般化線形モデルとの繋がりを理解する。⑩統計ソフトRを用いて一般化線形モデルの組み立てを理解する。⑪一般化線形モデルの解析結果について理解する。⑫一般化線形モデルによる様々な解析事例を理解する。⑬一般化線形モデルのカテゴリカル変数が有意になったのちに行う多重比較について理解する。⑭統計解析を実行するために必要な調査・実験デザインについて理解する。なお、7回目、15回目の講義は、これまでの復習回とし、実践問題の練習を行うこととする。一連の講義を通して、卒業研究などで統計解析を実行するための実践的な知識・技術を身につけることができる。
 8回目の講義では、統計モデリングの意味を理解することを目的とし、最初に、I 統計モデルとはなにか、II 線形モデルの導入、III 線形モデルからの拡張 について講義を行う。その後、学んだことについて、統計解析の演習並びに問題の解説を行う。


I 久保拓弥『データ解析のための統計モデリング入門』、岩波書店、2012年、p. 2-4.
II 久保拓弥『データ解析のための統計モデリング入門』、岩波書店、2012年、p. 4-6.
  平田昌彦編『生物・農学系のための統計学』、朝倉書店、2017年、p.115, 172-176
III 久保拓弥『データ解析のための統計モデリング入門』、岩波書店、2012年、p. 7-9.

②授業配布プリント、各自のパソコン

③授業配布プリント、各自のパソコン
コマ主題細目 ① 統計モデリング ② 統計解析の演習 ③ 統計演習の解説
細目レベル ① 統計モデルとは何か、理解できるようになる。

I 統計モデルとは?
 統計モデルとは、(1)観察によってデータ化された現象を説明するために作られる、(2)確率分布が基本的な部品であり、これはデータに見られるばらつきを表現する手段である、(3)データとモデルとを対応づける手続きが準備されていて、モデルがデータにどれだけ当てはまっているかを定量的に評価できる、といった特徴を持つ数理モデルである。
 我々が調査や実験を行う場合、①まず自然全体が持つ膨大な情報の中から観測データを得る。②その後、その観測データを整理することで、調査者が明らかにしたいものを主張する。統計モデルとは②を行うためのものである。

II 線形モデルの導入
 世の中には数多くの統計モデルが存在している。その中で我々が勉強していく統計モデルは、「一般化線形モデル(generalized liner model, GLM)」とする。GLMを用いることで、我々が実施する調査・実験データの多くを解析できるだけでなく、応用範囲が広く、統計モデリング(統計モデルを構築すること)を実施するための基本的な考え方が多く詰まっているためである。
 前項で学んだ回帰分析は、一般化線形モデルの中でもっともシンプルな形で「線形モデル」といわれる。回帰分析の項目で学んだ例は、最高気温からアイスクリームの売り上げ(過去5日平均との売上差)を「y=ax+b」という形で予想するものであった(xが最高気温、yが過去5日平均との売上差)。この、y=ax+bのような形の統計モデルを線形モデルという。例えば、このモデルが「y=2x」となった場合、最高気温が1度上がると、売上(過去5日平均との売上差)は2倍になると予測できる。
 また、xの数を増やすことも可能である。同様にアイスの売り上げyを最高気温x1と最高湿度x2で説明するモデルを考えると、「y=ax1+bx2+c」という形になる。例えば、このモデルが「y=2x1-2x2+1」となったする。この場合、最高気温が1度上がると、売上(過去5日平均との売上差)は2倍になり、最高湿度が1%上がると売り上げは2倍減ると予想できる。なお、xが2つ以上の解析は、一般的に重回帰分析と呼ばれる。
 さらに、xは温度や湿度などの連続値でなくてもよい。同様に、アイスの売り上げyを天気x(「雨」、「雨以外」の2区分)で説明するモデルを考える。モデルの形は、これまでと同様、「y=ax+b」である。ただし解析結果が異なり、例えば「雨の場合はax=0, 雨以外の場合はax=2」というように結果が示される。つまり、雨以外の場合は、雨よりも売上(y)の値が2大きいということが分かる。なお、xが連続値でないものの解析は、一般的に分散分析、さらには今回のようにxが2区分の場合は特にt検定と呼ばれる。
 以上をまとめると、線形モデルとはy=a0+a1x1+a2x2・・・(a0は切片、a1はx1の傾き、a2はx2の傾き…)の形で示されるモデルものである。xが複数あっても利用可能という点、xが連続値でもそうでなくても対応可能など、活用範囲が広い。また、重回帰分析や分散分析など数多くの解析手法を含むため、線形モデルを理解することで、他の解析の理解にもつながる。
 
III 線形モデルからの拡張
 それでは、一般化線形モデルとはなにか。前項で説明した線形モデルとは、一般化線形モデルのうち、yの確率分布が正規分布であるものに限定されている。すなわち、yの値に上限下限のないもの、正負両方の値を取りうるもの、連続値を取るものに限って、線形モデルで解析することができる。なお、線形モデルは、最小二乗法によって解析が可能なものである。
 では、yの確率分布が正規分布でないものはどのように解析すればよいのか。つまり、前項の例では、yの値を「アイスの過去5日平均との売上差」としていたが、「当日のアイスの売上個数(=連続値でないもの)」や「当日のアイスの売り上げ(=負の値を示さないもの)」はどうすればよいのだろうか。これらを正規分布のもとで解析すると、例えば当日の売り上げが-3000円など、不適切な値で予想されてしまうこともある。
 正規分布以外の確率分布で解析したい場合、線形モデルを拡張した一般化線形モデルというもので解析すればよい。なお、一般化線形モデルは、最尤推定法によって解析が可能なものである。また、最小二乗法は最尤推定法の一部である。
 

② 講義で学んだ統計解析手法の実践を行う
 卒業研究などでデータ解析が必要な場合、統計学の講義で学んだ知識を自分の研究に応用することが求められる。しかしながら、特に研究経験の浅い卒論生の場合、学んだ知識をどのように活用すればよいか困惑することが多い。
 主要な困惑事項として、①適切に解析を実行するためにはどのようにデータをエクセル等に集計すべきなのか、②数多い解析方法がある中で自身の調査にはどの手法を選択すればよいのか、③アプリケーションでその解析を実行するためにはどのような操作が必要か、といったことが挙げられる。
 本項では、担当教員が出す様々な実践的な課題の問題演習を繰り返しながら、上述の①~③について解決を図る。なお本項目では、各自がパソコンを持参し、それぞれが確実に解析作業を実践できるようになることを目指す。


③ 実践問題の解答確認及び問題解説から、解析技術を定着させる
 前項で、担当教員の出した統計解析の問題を各自取り組むこととした。しかしながら、初めての解析作業では、操作方法などでトラブルの発生も予想され、学生間で習得状況の差異が発生することも懸念される。
 そこで本項では、全員が確実に解析できるようになることを目指すため、グループワークも取り入れることとする。グループメンバー同士が助け合いながら、与えられた課題の解決を図り、解析技術を習得できる展開とする。解析方法を実施できたメンバーは、解析で困っている他のメンバーにアドバイスすることで、お互いの解析技術の向上に役立てる。
 最後に、与えられた統計課題について、担当教員が解説を行う。求める課題解決のためには、①どのようにデータをまとめるべきだったか、②どのような解析手法を選択する必要があったのか、③その手法を実施するためにはどのような操作が必要か、これらを確認してもらいたい。①~③について、自身(グループ)で考えた方法と教員が示した方法とを比較することで解析技術を定着させる。

 

キーワード ① 統計モデル ② GLM ③ 線形モデル ④ 問題演習 ⑤ 問題解説
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 【復習】今回のコマシラバスの細目レベルをあらためて熟読し、知識を深める。特に担当教員から学んだ「細目レベル①」の項目については、今回の授業のベースとなる部分なので、細かい部分まで理解しておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。また、講義の中で配布された資料についても見直しておく。コマシラバスや授業資料の一連の見直しが終わった段階で、授業中に配布された課題プリントに取り組む。課題プリントは本講義で学んだ内容に関する、基礎から応用にわたる練習問題である。最初は何も参考にせずに課題プリントに取組み、分からない部分があったらコマシラバスや授業資料を参考して解けるようにしてほしい。課題プリントの答え合わせ及び解説は次回の授業の中で行う。

【予習】次回のコマシラバス「細目レベル①」を熟読し、次回の授業で実施する項目について準備をしておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。

9 確率分布と最尤推定 科目の中での位置付け  本講義では、最初に統計解析の基本部分を次の順序学ぶ:①データを集計したときに示される基本統計量とは何か理解する。②統計解析を実施するために欠かすことのできない確率分布や確率変数について理解する。③得られたデータからどんなことが予測されるかなど、推定や検定の基本理論を理解する。④検定方法をいくつか紹介し、どういった場合にどの検定方法を利用すべきなのか理解できるようになる。⑤あるデータAと別のデータBとの関係性について理解する。⑥あるデータAから別のデータBを予測するための回帰分析について理解する。統計解析の基本を学んだのちに、卒業研究等で実践できる統計解析手法について次の順序で学ぶ:⑧統計モデリングとは何か理解する。⑨統計ソフトRを用いて特定の確率分布を仮定した解析方法の理論と、一般化線形モデルとの繋がりを理解する。⑩統計ソフトRを用いて一般化線形モデルの組み立てを理解する。⑪一般化線形モデルの解析結果について理解する。⑫一般化線形モデルによる様々な解析事例を理解する。⑬一般化線形モデルのカテゴリカル変数が有意になったのちに行う多重比較について理解する。⑭統計解析を実行するために必要な調査・実験デザインについて理解する。なお、7回目、15回目の講義は、これまでの復習回とし、実践問題の練習を行うこととする。一連の講義を通して、卒業研究などで統計解析を実行するための実践的な知識・技術を身につけることができる。
 9回目の講義では、統計ソフトRを用いて特定の確率分布を仮定した解析方法の理論と、一般化線形モデルとの繋がりを理解することを目的とし、最初に、I 確率分布の選択 II ポアソン分布 III 最尤推定 について講義を行う。その後、学んだことについて、統計解析の演習並びに問題の解説を行う。


I 久保拓弥『データ解析のための統計モデリング入門』、岩波書店、2012年、p. 18-21, 34-35.
II 久保拓弥『データ解析のための統計モデリング入門』、岩波書店、2012年、p. 21-24.
III 久保拓弥『データ解析のための統計モデリング入門』、岩波書店、2012年、p. 24-28

②授業配布プリント、各自のパソコン

③授業配布プリント、各自のパソコン
コマ主題細目 ① 確率分布と最尤推定 ② 統計解析の演習 ③ 統計演習の解説 ④ ⑤
細目レベル ① 確率分布と最尤推定の意味について、具体例を交えながら理解する。

I 確率分布の選択
 確率分布とは、確率変数の値とそれが出現する確率を対応させたものである。簡単にいうと、調べたyの値をヒストグラムにすると、どのような形になるか、といったことである。前項で、一般化線形モデルを構築するためには確率分布を決めなければならないことを理解した。実際、ある観測データを解析する統計モデリングにおいて最初に考えるべき点は、「この現象がどのような確率分布で説明できそうか」ということである。
 確率分布は無数にあり、いったいどれを選択すればよいか混乱するだろう。ただし、我々の分野で頻繁に使う分布はそれほど多くなく、つぎの4つを理解していれば解析できる場合が多い。この4つとは、ポアソン分布、二項分布、正規分布、ガンマ分布である。自身のデータがどれに当てはまるか、この中から選択する。選択の基準は以下のとおりである。
①説明したい量は離散(1,2,3…)か?連続(1.3, 2.2, 3,6…)か
②説明したい量の範囲は、正か、負か、両方か、上限下限があるか、
 各確率分布の特徴は、以下のとおりである。
・ポアソン分布:データが離散値、ゼロ以上の範囲、上限特になし
・二項分布:データが離散値、0~1の割合で示される
・正規分布:データが連続値、範囲が-∞~+∞
・ガンマ分布:データが連続値、範囲が0~+∞
得られたデータの形(ヒストグラムを作成した場合の形)と、選択した確率分布の形とが大きく異なることもあるだろう。この場合、様々な要因(個体差、場所差などの誤差)が組み合わさることで、確率分布との形と異なっていることが考えられる。まずは、上記の基準でデータの確率分布を仮定するとよい。今回は、ポアソン分布の事例で説明する。

II ポアソン分布~ある植物の種の数は?~
 今回の事例では、ある植物を対象に、1個体あたり種子をどれだけ持っているのか予測するモデルを作る。データの特徴は次の通りである。
・種のデータは、1個、2個…と数えられるカウントデータ
・50個体調べたところ、1個体あたりの種子数の平均(標本平均)は3.56個
・個体ごとに種子数にばらつきがあり、ヒストグラムを核とひと山の分布である
 上記の判断基準から、確率分布を考えてみる。この事例では、①種子の数yが(0,1,2,…)といった非負の整数(カウントデータ:離散値)であること、②yに下限(ゼロ)があるが、上限はよく分からないこと、から、このデータの確率分布はポアソン分布であると仮定できる。ポアソン分布は平均値のみで形が決まる特徴を持つ。
 この場合、平均値が3.56であることから、この植物は3~4個の種子を持っている!と判断しては危険である。この平均の3.56は標本平均である。つまり、たまたまサンプリングした個体の平均であって、母平均を示しているものではない。知りたいことは、母平均である。母平均をλとすると、次のようになる。
 ・個体1の種子数は平均λのポアソン分布に従う→観測された種子数は2だった。
 ・個体2の種子数は平均λのポアソン分布に従う→観測された種子数は2だった。
 ・個体3の種子数は平均λのポアソン分布に従う→観測された種子数は4だった。
 …
 ・個体50の種子数は平均λのポアソン分布に従う→観測された種子数は3だった。
 観測値を平均すると3.56なのだが、どのようにλを推定すればよいか。ここで利用するのが最尤推定法である。

III 最尤推定~最も尤度を高める種の数~
 最尤推定法とは、どのような確率分布(ポアソン分布でも正規分布でも…)を使った統計モデルにも利用できるパラメータ推定方法である。なお、回帰分析のパラメータ推定には最小二乗法を使ったが、正規分布版の最尤推定法が最小二乗法という認識で間違いはない。
 では、どうやってパラメータを推定するのか。最尤推定法は尤度という「当てはまりの良さ」をあらわす統計量を最大にするパラメータ推定方法である。今回のパラメータはλであるが、この場合の最尤推定とは「尤度を最大にするλはいくつなのか」を決める方法であるといえる。
 尤度は次の通り計算できる。
 平均種子数λの個体1の種子数y1が2の確率×平均種子数λの個体2の種子数y2が2の確率×…×平均種子数λの個体y50の種子数が3の確率
 この計算値を最大とするλを算出すればよい。実際のデータ解析では、パソコンソフトを使って計算を行う。

② 講義で学んだ統計解析手法の実践を行う
 卒業研究などでデータ解析が必要な場合、統計学の講義で学んだ知識を自分の研究に応用することが求められる。しかしながら、特に研究経験の浅い卒論生の場合、学んだ知識をどのように活用すればよいか困惑することが多い。
 主要な困惑事項として、①適切に解析を実行するためにはどのようにデータをエクセル等に集計すべきなのか、②数多い解析方法がある中で自身の調査にはどの手法を選択すればよいのか、③アプリケーションでその解析を実行するためにはどのような操作が必要か、といったことが挙げられる。
 本項では、担当教員が出す様々な実践的な課題の問題演習を繰り返しながら、上述の①~③について解決を図る。なお本項目では、各自がパソコンを持参し、それぞれが確実に解析作業を実践できるようになることを目指す。


③ 実践問題の解答確認及び問題解説から、解析技術を定着させる
 前項で、担当教員の出した統計解析の問題を各自取り組むこととした。しかしながら、初めての解析作業では、操作方法などでトラブルの発生も予想され、学生間で習得状況の差異が発生することも懸念される。
 そこで本項では、全員が確実に解析できるようになることを目指すため、グループワークも取り入れることとする。グループメンバー同士が助け合いながら、与えられた課題の解決を図り、解析技術を習得できる展開とする。解析方法を実施できたメンバーは、解析で困っている他のメンバーにアドバイスすることで、お互いの解析技術の向上に役立てる。
 最後に、与えられた統計課題について、担当教員が解説を行う。求める課題解決のためには、①どのようにデータをまとめるべきだったか、②どのような解析手法を選択する必要があったのか、③その手法を実施するためにはどのような操作が必要か、これらを確認してもらいたい。①~③について、自身(グループ)で考えた方法と教員が示した方法とを比較することで解析技術を定着させる。

 



キーワード ① 確率分布 ② ポアソン分布 ③ 最尤推定 ④ 問題演習 ⑤ 問題解説
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 【復習】今回のコマシラバスの細目レベルをあらためて熟読し、知識を深める。特に担当教員から学んだ「細目レベル①」の項目については、今回の授業のベースとなる部分なので、細かい部分まで理解しておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。また、講義の中で配布された資料についても見直しておく。コマシラバスや授業資料の一連の見直しが終わった段階で、授業中に配布された課題プリントに取り組む。課題プリントは本講義で学んだ内容に関する、基礎から応用にわたる練習問題である。最初は何も参考にせずに課題プリントに取組み、分からない部分があったらコマシラバスや授業資料を参考して解けるようにしてほしい。課題プリントの答え合わせ及び解説は次回の授業の中で行う。

【予習】次回のコマシラバス「細目レベル①」を熟読し、次回の授業で実施する項目について準備をしておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。

10 一般化線形モデル 科目の中での位置付け  本講義では、最初に統計解析の基本部分を次の順序学ぶ:①データを集計したときに示される基本統計量とは何か理解する。②統計解析を実施するために欠かすことのできない確率分布や確率変数について理解する。③得られたデータからどんなことが予測されるかなど、推定や検定の基本理論を理解する。④検定方法をいくつか紹介し、どういった場合にどの検定方法を利用すべきなのか理解できるようになる。⑤あるデータAと別のデータBとの関係性について理解する。⑥あるデータAから別のデータBを予測するための回帰分析について理解する。統計解析の基本を学んだのちに、卒業研究等で実践できる統計解析手法について次の順序で学ぶ:⑧統計モデリングとは何か理解する。⑨統計ソフトRを用いて特定の確率分布を仮定した解析方法の理論と、一般化線形モデルとの繋がりを理解する。⑩統計ソフトRを用いて一般化線形モデルの組み立てを理解する。⑪一般化線形モデルの解析結果について理解する。⑫一般化線形モデルによる様々な解析事例を理解する。⑬一般化線形モデルのカテゴリカル変数が有意になったのちに行う多重比較について理解する。⑭統計解析を実行するために必要な調査・実験デザインについて理解する。なお、7回目、15回目の講義は、これまでの復習回とし、実践問題の練習を行うこととする。一連の講義を通して、卒業研究などで統計解析を実行するための実践的な知識・技術を身につけることができる。
 10回目の講義では、統計ソフトRを用いて一般化線形モデルの組み立てを理解することを目的とし、最初に、I データの概要 II 統計モデル III 説明変数の構造 について講義を行う。その後、学んだことについて、統計解析の演習並びに問題の解説を行う。


I 久保拓弥『データ解析のための統計モデリング入門』、岩波書店、2012年、p. 40-44.
II 久保拓弥『データ解析のための統計モデリング入門』、岩波書店、2012年、p. 45-49.
III 久保拓弥『データ解析のための統計モデリング入門』、岩波書店、2012年、p. 54-61

②授業配布プリント、各自のパソコン

③授業配布プリント、各自のパソコン
コマ主題細目 ① 一般化線形モデル ② 統計解析の演習 ③ 統計演習の解説 ④ ⑤
細目レベル ① 一般化線形モデル(GLM)を構築できるようになる。

I データの概要
 これまでの事例では、ある植物1個体あたりの種子数を推定するといったことに取り組んだ。ここでは、実際の調査・実験のように、ある処理を与えたとき、もしくはある条件のもとで、種子数がどう変わるかについて、解析方法を考えていく。
 今回扱うのは、ある植物100個体の調査データである。個体ごとに種子数のデータがあり、個体iの種子数をy[i]と表すこととする。また、個体ごとの体サイズデータも取得し、個体iの体サイズをx[i]と表すこととする。さらに、全個体のうち50個体には施肥処理f(T:施肥あり)を行い、残りの50個体は対照(C:施肥なし)とする。なお、体サイズxと施肥処理fは無関係に行われたとする。
 データの収集が完了したのちにまず行わなければならないことは、データの図示である。データの図示でよく使われるのは、散布図と箱ひげ図である。今回はyとxの関係を散布図で(xが連続データのため)、yとfの関係を箱ひげ図で(fが因子のため)示すとよい。図にすることで、データの特徴をつかむことが大切である。

II 統計モデル
 それでは、カウントデータである種子数をうまく表現できそうな統計モデルを作っていく。今回は、種子数y(平均λ)が、体サイズxや施肥処理fに影響されるようなモデルを設計する。なお、求めたい変数(今回はy)のことを応答変数、応答変数に影響を与えると予想した変数(今回はxとf)を説明変数という。
 ここでは分かりやすく、体サイズxだけに依存する統計モデルを考えていく。つまり、説明変数xと応答変数yの関係を調べる。回帰分析と同様に考えると、
λ[i]=β1+β2x[i] (β1は切片、β2はxの傾き)
という形が想定される。もしβ2>0と推定された場合は体サイズxが大きくなると種子数が増える、もしβ2<0と推定された場合は体サイズxが大きくなると種子数が減る、といったことが分かるモデルである。
 しかし、このモデルには大きな欠点がある。それは、体サイズx[i]の値によっては種子数の平均λ[i]がマイナスになってしまう可能性があることだ。そこで、以下のとおり数式を変形する。
λ[i]=exp(β1+β2x[i]) exp(X)はe^Xのこと
 このように変形することで、右辺は確実に正の値になり、種子数の平均λ[i]がマイナスになってしまうことを防ぐことができる。ただし、このままではパラメータ推定の計算をしづらいため、両辺対数(底はe)をとって、
log(λ[i])=β1+β2x[i]
とする。左辺の関数(今回の場合は対数)をリンク関数と呼ぶ。また、右辺を線形予測子と呼ぶ。
 いよいよ、パラメータの推定である。統計ソフトRのGLMを用いて、線形予測子、データ、確率分布、リンク関数を指定して解析すると、β1とβ2の最尤推定値を推定することができる。

III 説明変数の構造
 次は、施肥効果fを説明変数として組み込んだモデルも検討する。施肥効果は因子(TとC)なのだが、モデルの作り方は体サイズのときと全く同じように
log(λ[i])=β1+β3d[i]
とすることができる。ここでβ1は切片、β3は施肥効果を示している。d[i]は、施肥効果がTとCのままでは計算できないため、代わりの数値(ダミー変数)に置き換えたものである。f[i]=Tのときはd[i]=1, f[i]=Cのときはd[i]=0 としている。統計ソフトRのGLMを用いて、線形予測子、データ、確率分布、リンク関数を指定して解析すると、β1とβ3の最尤推定値を簡単に推定することができる。ただし、施肥効果の結果は体サイズ(連続値)の場合とは異なり、基準値(今回はf=C)を0とした場合の処理による効果(f=T)が示される。
 最後に、体サイズxと施肥効果fを同時に組み込んだモデルも考えてみる。モデルの作り方は、説明変数を増やすだけで、
log(λ[i])=β1+β2x[i]+β3d[i]
とすることができる。ここでβ1は切片、β2は体サイズの効果、β3は施肥効果を示している。統計ソフトRのGLMを用いて、線形予測子、データ、確率分布、リンク関数を指定して解析すると、β1、β2、β3の最尤推定値を推定することができる。
 

② 講義で学んだ統計解析手法の実践を行う
 卒業研究などでデータ解析が必要な場合、統計学の講義で学んだ知識を自分の研究に応用することが求められる。しかしながら、特に研究経験の浅い卒論生の場合、学んだ知識をどのように活用すればよいか困惑することが多い。
 主要な困惑事項として、①適切に解析を実行するためにはどのようにデータをエクセル等に集計すべきなのか、②数多い解析方法がある中で自身の調査にはどの手法を選択すればよいのか、③アプリケーションでその解析を実行するためにはどのような操作が必要か、といったことが挙げられる。
 本項では、担当教員が出す様々な実践的な課題の問題演習を繰り返しながら、上述の①~③について解決を図る。なお本項目では、各自がパソコンを持参し、それぞれが確実に解析作業を実践できるようになることを目指す。


③ 実践問題の解答確認及び問題解説から、解析技術を定着させる
 前項で、担当教員の出した統計解析の問題を各自取り組むこととした。しかしながら、初めての解析作業では、操作方法などでトラブルの発生も予想され、学生間で習得状況の差異が発生することも懸念される。
 そこで本項では、全員が確実に解析できるようになることを目指すため、グループワークも取り入れることとする。グループメンバー同士が助け合いながら、与えられた課題の解決を図り、解析技術を習得できる展開とする。解析方法を実施できたメンバーは、解析で困っている他のメンバーにアドバイスすることで、お互いの解析技術の向上に役立てる。
 最後に、与えられた統計課題について、担当教員が解説を行う。求める課題解決のためには、①どのようにデータをまとめるべきだったか、②どのような解析手法を選択する必要があったのか、③その手法を実施するためにはどのような操作が必要か、これらを確認してもらいたい。①~③について、自身(グループ)で考えた方法と教員が示した方法とを比較することで解析技術を定着させる。

 



キーワード ① データの特徴 ② 統計モデル ③ 説明変数 ④ 問題演習 ⑤ 問題解説
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 【復習】今回のコマシラバスの細目レベルをあらためて熟読し、知識を深める。特に担当教員から学んだ「細目レベル①」の項目については、今回の授業のベースとなる部分なので、細かい部分まで理解しておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。また、講義の中で配布された資料についても見直しておく。コマシラバスや授業資料の一連の見直しが終わった段階で、授業中に配布された課題プリントに取り組む。課題プリントは本講義で学んだ内容に関する、基礎から応用にわたる練習問題である。最初は何も参考にせずに課題プリントに取組み、分からない部分があったらコマシラバスや授業資料を参考して解けるようにしてほしい。課題プリントの答え合わせ及び解説は次回の授業の中で行う。

【予習】次回のコマシラバス「細目レベル①」を熟読し、次回の授業で実施する項目について準備をしておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。

11 検定とモデル選択 科目の中での位置付け  本講義では、最初に統計解析の基本部分を次の順序学ぶ:①データを集計したときに示される基本統計量とは何か理解する。②統計解析を実施するために欠かすことのできない確率分布や確率変数について理解する。③得られたデータからどんなことが予測されるかなど、推定や検定の基本理論を理解する。④検定方法をいくつか紹介し、どういった場合にどの検定方法を利用すべきなのか理解できるようになる。⑤あるデータAと別のデータBとの関係性について理解する。⑥あるデータAから別のデータBを予測するための回帰分析について理解する。統計解析の基本を学んだのちに、卒業研究等で実践できる統計解析手法について次の順序で学ぶ:⑧統計モデリングとは何か理解する。⑨統計ソフトRを用いて特定の確率分布を仮定した解析方法の理論と、一般化線形モデルとの繋がりを理解する。⑩統計ソフトRを用いて一般化線形モデルの組み立てを理解する。⑪一般化線形モデルの解析結果について理解する。⑫一般化線形モデルによる様々な解析事例を理解する。⑬一般化線形モデルのカテゴリカル変数が有意になったのちに行う多重比較について理解する。⑭統計解析を実行するために必要な調査・実験デザインについて理解する。なお、7回目、15回目の講義は、これまでの復習回とし、実践問題の練習を行うこととする。一連の講義を通して、卒業研究などで統計解析を実行するための実践的な知識・技術を身につけることができる。
 11回目の講義では、一般化線形モデルの解析結果について理解することを目的とし、最初に、I モデルの比較 II AICによるモデル選択 III 尤度比検定 について講義を行う。その後、学んだことについて、統計解析の演習並びに問題の解説を行う。


I 久保拓弥『データ解析のための統計モデリング入門』、岩波書店、2012年、p.68-71.
II 久保拓弥『データ解析のための統計モデリング入門』、岩波書店、2012年、p. 71-76.
III 久保拓弥『データ解析のための統計モデリング入門』、岩波書店、2012年、p. 97-99,106-108

②授業配布プリント、各自のパソコン

③授業配布プリント、各自のパソコン
コマ主題細目 ① 検定とモデル選択 ② 統計解析の演習 ③ 統計演習の解説 ④ ⑤
細目レベル ① 作成したモデルの中で妥当なものを選ぶことができる。

I モデルの比較
 複数の統計モデルが作れるようになったとき、どの統計モデルが最適なのか考える必要がある。前回の例では、種子の数を①体サイズのみから説明するモデル、②施肥効果のみから説明するモデル、③体サイズと施肥効果から説明するモデル、の3種類を構築した。実はもう一種類モデルあって、④体サイズも施肥効果も使わないモデル(=切片だけのモデル)というものも存在する。この4種類のなかでどれが最適なのか考えていく。
 複数の統計モデルの中から、何らかの意味で「良い」モデルを選ぶことを「モデル選択」という。モデル選択にはいろいろな方法があるが、ここではAICによるモデル選択基準について説明する。

II AICによるモデル選択
 どのモデルがもっともよいかを考える際、「データの当てはまりのいいモデル」が良いモデルと考えるのが普通と思われる。しかし、既存のデータに当てはまったからといって、新たにとったデータに当てはまる保証はない。大切なのは、新たにとったデータにも当てはまるような「よい予想をするモデル」が良いモデルなのである。
 既存のデータに当てはまりのよいモデルを作ることは簡単である。それは、説明変数の数を膨大に増やせばよいのである。例えばアイスクリームの売り上げを予測する際に、最高気温のみから予測できれば、今後の活用が便利であるし、最高気温の影響について解釈することも容易である。一方、アイスクリームの売り上げ予測に、「最高気温、湿度、天気、曜日、季節、・・・」という説明変数を用いたモデルを作ったする。既存データへの当てはまりは、最高気温のみのモデルよりも高いかもしれないが、売り上げ予測に活用するには不便であるし、最高気温の効果を考える際にも他の要因の影響を一つずつ考えていかなければならない。このように、説明変数が多いと予測することが困難になってしまう。
 つまり「よい予測をするモデル」とは、①データへの当てはまりがよい、かつ、②使う説明変数の数が少ない、モデルといえる。この基準でもっともよく使われている基準の一つがAIC(赤池情報量基準)と呼ばれるものである。AICは次のように計算される
 AIC=-2×(最大対数尤度-最尤推定したパラメータ数)
最大対数尤度とはモデルの当てはまりのよさである。複数のモデル間でAIC比較したときに、もっともAICが小さなモデルが最適モデルとされる。最適モデルに含まれた説明変数の係数を見ることで、その説明変数がどのような効果をもたらすのか考えることができる。
具体例を挙げると、例えば最適モデルの中に「体サイズ」が残った場合、最適モデルの中の「体サイズ」の係数を見る。係数が正ならば、体サイズが大きいほど種子数は増えるといえる。係数が負ならば、体サイズが大きいほど種子数が少なくなるといえる。
モデル選択の方法は、統計ソフトRのstepAICによって実行できる。

III 尤度比検定
 AICによるモデル選択で確認できることは、複数のモデルの中でもっとも最適なものはどれか、といったことである。有意水準を用いた検定によって、各説明変数の効果を調べたものではない。一方、尤度を用いた検定方法も存在する。ここでは、一般化線形モデルの各説明変数の効果を検定によって評価する方法を理解する。
 尤度を用いた検定は、尤度比検定といわれる。t検定の場合はt分布を、カイ二乗検定の場合はカイ二乗分布を利用したが、尤度比検定で利用する分布もカイ二乗分布である。尤度比検定の方法は、統計ソフトRのAnovaによって実行できる。結果のP値を確認して、有意水準(通常は0.05)未満の場合、その説明変数の効果が有意であると判断できる。
 尤度比検定は「帰無仮説を棄却するかどうか判断すること」が目的とされる。尤度比検定によって有意でなかった説明変数について、「効果がない」と判断しては不適切であり、「効果があるかどうか判断できない」という判断が妥当である。
 最適モデルを選ぶ際に、モデル選択をするのか、尤度比検定をするのかは、研究目的によって自ら考えることが必要といえる。

② 講義で学んだ統計解析手法の実践を行う
 卒業研究などでデータ解析が必要な場合、統計学の講義で学んだ知識を自分の研究に応用することが求められる。しかしながら、特に研究経験の浅い卒論生の場合、学んだ知識をどのように活用すればよいか困惑することが多い。
 主要な困惑事項として、①適切に解析を実行するためにはどのようにデータをエクセル等に集計すべきなのか、②数多い解析方法がある中で自身の調査にはどの手法を選択すればよいのか、③アプリケーションでその解析を実行するためにはどのような操作が必要か、といったことが挙げられる。
 本項では、担当教員が出す様々な実践的な課題の問題演習を繰り返しながら、上述の①~③について解決を図る。なお本項目では、各自がパソコンを持参し、それぞれが確実に解析作業を実践できるようになることを目指す。


③ 実践問題の解答確認及び問題解説から、解析技術を定着させる
 前項で、担当教員の出した統計解析の問題を各自取り組むこととした。しかしながら、初めての解析作業では、操作方法などでトラブルの発生も予想され、学生間で習得状況の差異が発生することも懸念される。
 そこで本項では、全員が確実に解析できるようになることを目指すため、グループワークも取り入れることとする。グループメンバー同士が助け合いながら、与えられた課題の解決を図り、解析技術を習得できる展開とする。解析方法を実施できたメンバーは、解析で困っている他のメンバーにアドバイスすることで、お互いの解析技術の向上に役立てる。
 最後に、与えられた統計課題について、担当教員が解説を行う。求める課題解決のためには、①どのようにデータをまとめるべきだったか、②どのような解析手法を選択する必要があったのか、③その手法を実施するためにはどのような操作が必要か、これらを確認してもらいたい。①~③について、自身(グループ)で考えた方法と教員が示した方法とを比較することで解析技術を定着させる。

 



キーワード ① モデル選択 ② AIC ③ 尤度比検定 ④ 問題演習 ⑤ 問題解説
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 【復習】今回のコマシラバスの細目レベルをあらためて熟読し、知識を深める。特に担当教員から学んだ「細目レベル①」の項目については、今回の授業のベースとなる部分なので、細かい部分まで理解しておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。また、講義の中で配布された資料についても見直しておく。コマシラバスや授業資料の一連の見直しが終わった段階で、授業中に配布された課題プリントに取り組む。課題プリントは本講義で学んだ内容に関する、基礎から応用にわたる練習問題である。最初は何も参考にせずに課題プリントに取組み、分からない部分があったらコマシラバスや授業資料を参考して解けるようにしてほしい。課題プリントの答え合わせ及び解説は次回の授業の中で行う。

【予習】次回のコマシラバス「細目レベル①」を熟読し、次回の授業で実施する項目について準備をしておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。

12 一般化線形モデル展開 科目の中での位置付け  本講義では、最初に統計解析の基本部分を次の順序学ぶ:①データを集計したときに示される基本統計量とは何か理解する。②統計解析を実施するために欠かすことのできない確率分布や確率変数について理解する。③得られたデータからどんなことが予測されるかなど、推定や検定の基本理論を理解する。④検定方法をいくつか紹介し、どういった場合にどの検定方法を利用すべきなのか理解できるようになる。⑤あるデータAと別のデータBとの関係性について理解する。⑥あるデータAから別のデータBを予測するための回帰分析について理解する。統計解析の基本を学んだのちに、卒業研究等で実践できる統計解析手法について次の順序で学ぶ:⑧統計モデリングとは何か理解する。⑨統計ソフトRを用いて特定の確率分布を仮定した解析方法の理論と、一般化線形モデルとの繋がりを理解する。⑩統計ソフトRを用いて一般化線形モデルの組み立てを理解する。⑪一般化線形モデルの解析結果について理解する。⑫一般化線形モデルによる様々な解析事例を理解する。⑬一般化線形モデルのカテゴリカル変数が有意になったのちに行う多重比較について理解する。⑭統計解析を実行するために必要な調査・実験デザインについて理解する。なお、7回目、15回目の講義は、これまでの復習回とし、実践問題の練習を行うこととする。一連の講義を通して、卒業研究などで統計解析を実行するための実践的な知識・技術を身につけることができる。
 12回目の講義では、一般化線形モデルによる様々な解析事例を理解することを目的とし、最初に、I  二項分布 II 割り算値のモデリング III 正規分布とガンマ分布 について講義を行う。その後、学んだことについて、統計解析の演習並びに問題の解説を行う。


I 久保拓弥『データ解析のための統計モデリング入門』、岩波書店、2012年、p.118-127.
II 久保拓弥『データ解析のための統計モデリング入門』、岩波書店、2012年、p. 134-140.
III 久保拓弥『データ解析のための統計モデリング入門』、岩波書店、2012年、p. 130-134

②授業配布プリント、各自のパソコン

③授業配布プリント、各自のパソコン
コマ主題細目 ① モデルの展開 ② 統計解析の演習 ③ 統計演習の解説 ④ ⑤
細目レベル ① 様々なGLMを活用できるようになる。

I  二項分布
 これまではある種子の数について考えていたが、別の調査者が種子の生残率について調べたいと考えた。説明変数は、前項と同様に、体サイズxと施肥効果fである。この場合のGLMの構築方法について考えてみる。
 種子の生残調査をしたところ、すべての植物の種子数は8個(今回は分かりやすく8個で固定、本来は何個でも可能)であり、そのうちy個が生存していたというデータ(yの上限は8)を得られた。このように、〇個中△個のような割合データでは、二項分布を仮定したGLMを構築すればよい。
 ここで、前述のとおり、応答変数はy/8(0≦y≦8)であり、説明変数は体サイズxと施肥効果fである。iを個体番号とすると、線形予測子は
y[i]/8=β1+β2x[i]+β3d[i]
となると考えられる。ここでβ1は切片、β2は体サイズの効果、β3は施肥効果、dはダミー変数(f[i]=Tのときはd[i]=1, f[i]=Cのときはd[i]=0)を示している。しかし、この式の左辺は0~1の間の値をとるため、右辺も0~1の間のみの値になるように調整しなければならない。ここで利用するのが、ロジスティック関数である。ロジスティック関数を用いることで、どのような値でも0~1の間に調整することができる。すなわち、上記の式は、
y[i]/8=logistic(β1+β2x[i]+β3d[i])
とすればよい。しかしこのままでは推定計算ができないため、logisticsの中身を取り出す必要がある。すなわち、
関数A(y[i]/8)=β1+β2x[i]+β3d[i]
となる関数Aを考える必要がある。関数Aには、ロジスティック関数の逆関数である「ロジット関数」が該当する。すなわち、
logit(y[i]/8)=β1+β2x[i]+β3d[i]
とする。このロジット関数が、二項分布におけるリンク関数である。統計ソフトRのGLMを用いて、線形予測子、データ、確率分布、リンク関数を指定して解析すると、β1、β2、β3の最尤推定値を推定することができる。各説明変数の効果は、モデル選択もしくは尤度比検定により評価する。

II 割り算値のモデリング
 二項分布でのGLMの特徴は、データをデータで割った割り算値を使わずに、取得したデータをそのまま利用できる点にある。これは、同じ三割バッターでも、10打席3安打の打者と、1000打席300安打の打者とを、ひとくくりにせず違うものとして扱うことに似ている。
 ここでは、割り算値のもう一つのモデリング方法を紹介する。人口密度のように「単位面積当たりの個体数」といったものをモデリングしたいとして、以下の例を考える。
・森林内のいろいろな100箇所にプロット(i=1,2,…,100)を設置した。
・調査プロットごとにその面積A[i]は異なる
・調査プロットごとに明るさx[i]を測定している
・調査プロットごとに甲虫の数y[i]を調べた
・甲虫の個体数密度y[i]/A[i]が、明るさx[i]にどう影響されているか知りたい
このことをモデリングすると、次のように考えられる。
y[i]/A[i] = exp(β1+β2x[i]) (左辺が正なので、右辺も正になるように調整)
 右辺のexpを取るために、両辺に対数をとると、
log(y[i]/A[i])= β1+β2x[i]
log(y[i])-log(A[i]) = β1+β2x[i]
log(y[i]) = β1+β2x[i]+log(A[i])
 y[i]はカウントデータの個体数なので、ポアソン分布、β1+β2x[i]+log(A[i])を線形予測子、対数リンク関数のGLMを作成することができる。ここで注意すべきは、A[i]について、「係数=1であること」と「logがついていること」である。係数が1であるモデルを作る場合、Rではoffset項を利用する。
統計ソフトRのGLMを用いて、線形予測子、データ、確率分布、リンク関数、オフセット項を指定して解析すると、β1、β2の最尤推定値を簡単に推定することができる。各説明変数の効果は、モデル選択もしくは尤度比検定により評価する。

III 正規分布とガンマ分布
 これまでは離散型のデータを見てきたが、ここでは連続型のデータを統計モデルで扱うための確率分布を見てみる。代表的なものとして、正規分布とガンマ分布が挙げられる。
データが正負両方も取りうる場合は、正規分布として取り扱う。リンク関数は特になく、データをそのまま利用する。統計ソフトRのGLMを用いて、線形予測子、データ、確率分布を指定して解析すると、各説明変数の傾きを最尤推定法により推定することができる。各説明変数の効果は、モデル選択もしくは尤度比検定により評価する。正規分布を利用したGLMは、t検定(因子型の説明変数が1つ)、分散分析(因子型の説明変数が複数)、回帰分析(連続値型の説明変数が1つ)、重回帰分析(連続値型の説明変数が複数)と同じものといえる。
データが正の値のみを取る場合は、ガンマ分布として取り扱う。リンク関数はlogとするのがよい。これはポアソン分布のところで説明したのと同様、推定値を必ず正の値にしなければならないためである。統計ソフトRのGLMを用いて、線形予測子、データ、確率分布、リンク関数を指定して解析すると、各説明変数の傾きを最尤推定法により推定することができる。各説明変数の効果は、モデル選択もしくは尤度比検定により評価する。

② 講義で学んだ統計解析手法の実践を行う
 卒業研究などでデータ解析が必要な場合、統計学の講義で学んだ知識を自分の研究に応用することが求められる。しかしながら、特に研究経験の浅い卒論生の場合、学んだ知識をどのように活用すればよいか困惑することが多い。
 主要な困惑事項として、①適切に解析を実行するためにはどのようにデータをエクセル等に集計すべきなのか、②数多い解析方法がある中で自身の調査にはどの手法を選択すればよいのか、③アプリケーションでその解析を実行するためにはどのような操作が必要か、といったことが挙げられる。
 本項では、担当教員が出す様々な実践的な課題の問題演習を繰り返しながら、上述の①~③について解決を図る。なお本項目では、各自がパソコンを持参し、それぞれが確実に解析作業を実践できるようになることを目指す。


③ 実践問題の解答確認及び問題解説から、解析技術を定着させる
 前項で、担当教員の出した統計解析の問題を各自取り組むこととした。しかしながら、初めての解析作業では、操作方法などでトラブルの発生も予想され、学生間で習得状況の差異が発生することも懸念される。
 そこで本項では、全員が確実に解析できるようになることを目指すため、グループワークも取り入れることとする。グループメンバー同士が助け合いながら、与えられた課題の解決を図り、解析技術を習得できる展開とする。解析方法を実施できたメンバーは、解析で困っている他のメンバーにアドバイスすることで、お互いの解析技術の向上に役立てる。
 最後に、与えられた統計課題について、担当教員が解説を行う。求める課題解決のためには、①どのようにデータをまとめるべきだったか、②どのような解析手法を選択する必要があったのか、③その手法を実施するためにはどのような操作が必要か、これらを確認してもらいたい。①~③について、自身(グループ)で考えた方法と教員が示した方法とを比較することで解析技術を定着させる。

 



キーワード ① 二項分布 ② 正規分布 ③ ガンマ分布 ④ 問題演習 ⑤ 問題解説
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 【復習】今回のコマシラバスの細目レベルをあらためて熟読し、知識を深める。特に担当教員から学んだ「細目レベル①」の項目については、今回の授業のベースとなる部分なので、細かい部分まで理解しておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。また、講義の中で配布された資料についても見直しておく。コマシラバスや授業資料の一連の見直しが終わった段階で、授業中に配布された課題プリントに取り組む。課題プリントは本講義で学んだ内容に関する、基礎から応用にわたる練習問題である。最初は何も参考にせずに課題プリントに取組み、分からない部分があったらコマシラバスや授業資料を参考して解けるようにしてほしい。課題プリントの答え合わせ及び解説は次回の授業の中で行う。

【予習】次回のコマシラバス「細目レベル①」を熟読し、次回の授業で実施する項目について準備をしておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。

13 多重比較 科目の中での位置付け  本講義では、最初に統計解析の基本部分を次の順序学ぶ:①データを集計したときに示される基本統計量とは何か理解する。②統計解析を実施するために欠かすことのできない確率分布や確率変数について理解する。③得られたデータからどんなことが予測されるかなど、推定や検定の基本理論を理解する。④検定方法をいくつか紹介し、どういった場合にどの検定方法を利用すべきなのか理解できるようになる。⑤あるデータAと別のデータBとの関係性について理解する。⑥あるデータAから別のデータBを予測するための回帰分析について理解する。統計解析の基本を学んだのちに、卒業研究等で実践できる統計解析手法について次の順序で学ぶ:⑧統計モデリングとは何か理解する。⑨統計ソフトRを用いて特定の確率分布を仮定した解析方法の理論と、一般化線形モデルとの繋がりを理解する。⑩統計ソフトRを用いて一般化線形モデルの組み立てを理解する。⑪一般化線形モデルの解析結果について理解する。⑫一般化線形モデルによる様々な解析事例を理解する。⑬一般化線形モデルのカテゴリカル変数が有意になったのちに行う多重比較について理解する。⑭統計解析を実行するために必要な調査・実験デザインについて理解する。なお、7回目、15回目の講義は、これまでの復習回とし、実践問題の練習を行うこととする。一連の講義を通して、卒業研究などで統計解析を実行するための実践的な知識・技術を身につけることができる。
 13回目の講義では、一般化線形モデルのカテゴリカル変数が有意になったのちに行う多重比較について理解することを目的とし、最初に、I多重比較とは II 代表的な多重比較
III多重比較結果の表示方法 について講義を行う。その後、学んだことについて、統計解析の演習並びに問題の解説を行う。

I 粕谷英一『生物学を学ぶ人のための統計のはなし』、文一総合書店、1998年、p.177-180.
II 粕谷英一『生物学を学ぶ人のための統計のはなし』、文一総合書店、1998年、p.182.
平田昌彦編『生物・農学系のための統計学』、朝倉書店、2017年、p.136-137.
いちばんやさしい、医療統計HP ボンフェローニ法とは
  https://best-biostatistics.com/multiple/bonferroni.html
いちばんやさしい、医療統計HP テューキー検定とは
  https://best-biostatistics.com/multiple/tukey.html
いちばんやさしい、医療統計HP ダネット検定とは?
  https://best-biostatistics.com/multiple/dunnett.html
III 粕谷英一『生物学を学ぶ人のための統計のはなし』、文一総合書店、1998年、p.181-182.

②授業配布プリント、各自のパソコン

③授業配布プリント、各自のパソコン
コマ主題細目 ① 多重比較 ② 統計解析の演習 ③ 統計演習の解説 ④ ⑤
細目レベル ① 多重比較とは何か理解し、活用できるようになる。

I多重比較とは
 GLMを構築して、説明変数の効果を尤度比検定によって調べたとき、因子型の説明変数が有意になったとする。例えば、魚の産卵数yがエサf(因子型)によって違いが生じるか調べた際に、エサfの効果が有意になったような場合だ。エサ条件が2条件(エサなし、エサあり)であったならば、尤度比検定の結果と図示された結果を見ながら、「エサを与えたほうで産卵数が増えるね」、などと解釈することができる。
 問題は、エサ条件が3種類以上(例えば、エサA、エサB、エサなし)の場合だ。尤度比検定の結果から、エサによって産卵数が変化することは示された。しかしながら、それだけではどのエサが産卵数に効果的なのか、統計学的に示されたとは言えない。どのエサが産卵数にとって有意な違いをもたらすのか、その方法を考えていく。
 単純に考えると、(産卵数は正規分布を示すわけではないので、t検定ではなく)マンホイットニーのU検定を繰り返し行い、エサA-エサBで有意な差があるか、エサA-エサなしで有意な差があるか、エサB-エサなしで有意な差があるか、を調べればよいように考えらえる。この事例では、5%水準で合計3回検定を行うわけだが、まずは有意水準5%の意味について復習しよう。
 エサA-エサBの違いを5%水準で検定して有意になるということは、こういうことである。「エサAとエサBでの違いがないという前提のもと産卵数を調べたら、違いがない条件では5%以下の確率でしか起きないような結果になってしまった。こんなめったにないことが起きるなんて、きっとエサAとエサBに違いがないという前提が間違っていたんだ!」。ここで注意してほしいのは、本当は両者に違いがないのに、たまたまこの結果になる確率が5%ある、ということである。つまり、検定を行っても、5%の確率で間違えるということだ。
 ここで、①エサA-エサBで有意な差があるか、②エサA-エサなしで有意な差があるか、③エサB-エサなしで有意な差があるか、の3回検定繰り返すとどうなるだろう。①で間違えない確率が95%、②でも95%、③でも95%だから、①②③すべてで間違えない確率は0.95×0.95×0.95≒0.86。つまり、3回の検定で、1回以上間違える可能性14%もあるということだ。この問題を「検定の多重性の問題」というが、多重比較とは、このような問題を回避するために、全体の有意水準をあらかじめ設定している有意水準になるよう調整を行う検定方法を指す。
 
II 代表的な多重比較
 もっとも理解しやすい多重比較として、ボンフェローニの方法がある。これは、有意水準を組み合わせの数で割ったものを、新たな基準とするものである。今回の事例では、もともとの有意水準は0.05であり合計3つの組み合わせがあった。そこで、それぞれを比較する際の基準を0.05/3=0.017とする。つまり、①エサA-エサBの差の検定、②エサA-エサなしの差の検定、③エサB-エサなしの差の検定を、有意水準0.017により実施するものである。ボンフェローニの問題点として、組み合わせの数が多く多くなるほど、基準が厳しくなることが挙げられる。
 ボンフェローニの方法の問題点を解決するために、数多く方法が考案されている。ここではテューキーの方法と、比較する対象を限定するダネットの方法を紹介する。
 テューキーの方法は、すべての2群の組み合わせを、平均の差が大きいか否かで判断する。検出力が高いこと、各群のサンプル数が異なっても解析対応な方法があることなどから、多重比較の中でもっとも広く利用されている手法である。
 ダネットの方法は、基準となる1つの対照群と、複数の処置群を同時に比較する方法である。つまり今回の事例では、エサA-エサBの差の検定は行わず、②エサA-エサなしの差の検定、③エサB-エサなしの差の検定を行う。

III多重比較結果の表示方法
 多重比較によって各群間に差が認められたとする。この場合、どのように図表に表示すればよいのだろうか。多重比較以外の検定の多くは、図表内に*印を記載することで有意差の有無を標記することが一般的であるが(* P<0.05, ** P<0.01, *** P<0.001)、多重比較の場合にはアルファベットを利用して結果を示す。同じアルファベットが記載されていないものに有意差がある。
 具体例を挙げながら説明する。今回の事例では、①エサA処理、②エサB処理、③エサなし処理があった。
(1)①-②、①-③、②-③に有意差が認められた場合→①a ②b ③c
(2)①-②、①-③に有意差が認められ、②-③に有意差が認められなかった場合→①a ②b ③b
(3)①-②に有意差が認められ、①-③、②-③に有意差が認められなかった場合→①a ②b ③ab

② 講義で学んだ統計解析手法の実践を行う
 卒業研究などでデータ解析が必要な場合、統計学の講義で学んだ知識を自分の研究に応用することが求められる。しかしながら、特に研究経験の浅い卒論生の場合、学んだ知識をどのように活用すればよいか困惑することが多い。
 主要な困惑事項として、①適切に解析を実行するためにはどのようにデータをエクセル等に集計すべきなのか、②数多い解析方法がある中で自身の調査にはどの手法を選択すればよいのか、③アプリケーションでその解析を実行するためにはどのような操作が必要か、といったことが挙げられる。
 本項では、担当教員が出す様々な実践的な課題の問題演習を繰り返しながら、上述の①~③について解決を図る。なお本項目では、各自がパソコンを持参し、それぞれが確実に解析作業を実践できるようになることを目指す。


③ 実践問題の解答確認及び問題解説から、解析技術を定着させる
 前項で、担当教員の出した統計解析の問題を各自取り組むこととした。しかしながら、初めての解析作業では、操作方法などでトラブルの発生も予想され、学生間で習得状況の差異が発生することも懸念される。
 そこで本項では、全員が確実に解析できるようになることを目指すため、グループワークも取り入れることとする。グループメンバー同士が助け合いながら、与えられた課題の解決を図り、解析技術を習得できる展開とする。解析方法を実施できたメンバーは、解析で困っている他のメンバーにアドバイスすることで、お互いの解析技術の向上に役立てる。
 最後に、与えられた統計課題について、担当教員が解説を行う。求める課題解決のためには、①どのようにデータをまとめるべきだったか、②どのような解析手法を選択する必要があったのか、③その手法を実施するためにはどのような操作が必要か、これらを確認してもらいたい。①~③について、自身(グループ)で考えた方法と教員が示した方法とを比較することで解析技術を定着させる。

 



キーワード ① 検定 ② テューキー ③ ダネット ④ 問題演習 ⑤ 問題解説
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 【復習】今回のコマシラバスの細目レベルをあらためて熟読し、知識を深める。特に担当教員から学んだ「細目レベル①」の項目については、今回の授業のベースとなる部分なので、細かい部分まで理解しておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。また、講義の中で配布された資料についても見直しておく。コマシラバスや授業資料の一連の見直しが終わった段階で、授業中に配布された課題プリントに取り組む。課題プリントは本講義で学んだ内容に関する、基礎から応用にわたる練習問題である。最初は何も参考にせずに課題プリントに取組み、分からない部分があったらコマシラバスや授業資料を参考して解けるようにしてほしい。課題プリントの答え合わせ及び解説は次回の授業の中で行う。

【予習】次回のコマシラバス「細目レベル①」を熟読し、次回の授業で実施する項目について準備をしておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。

14 実験計画法 科目の中での位置付け  本講義では、最初に統計解析の基本部分を次の順序学ぶ:①データを集計したときに示される基本統計量とは何か理解する。②統計解析を実施するために欠かすことのできない確率分布や確率変数について理解する。③得られたデータからどんなことが予測されるかなど、推定や検定の基本理論を理解する。④検定方法をいくつか紹介し、どういった場合にどの検定方法を利用すべきなのか理解できるようになる。⑤あるデータAと別のデータBとの関係性について理解する。⑥あるデータAから別のデータBを予測するための回帰分析について理解する。統計解析の基本を学んだのちに、卒業研究等で実践できる統計解析手法について次の順序で学ぶ:⑧統計モデリングとは何か理解する。⑨統計ソフトRを用いて特定の確率分布を仮定した解析方法の理論と、一般化線形モデルとの繋がりを理解する。⑩統計ソフトRを用いて一般化線形モデルの組み立てを理解する。⑪一般化線形モデルの解析結果について理解する。⑫一般化線形モデルによる様々な解析事例を理解する。⑬一般化線形モデルのカテゴリカル変数が有意になったのちに行う多重比較について理解する。⑭統計解析を実行するために必要な調査・実験デザインについて理解する。なお、7回目、15回目の講義は、これまでの復習回とし、実践問題の練習を行うこととする。一連の講義を通して、卒業研究などで統計解析を実行するための実践的な知識・技術を身につけることができる。
 14回目の講義では、統計解析を実行するために必要な調査・実験デザインについて理解することを目的とし、最初に、I 実験計画法とは II 調査・実験計画の考え方 III 適切な計画設計 について講義を行う。その後、学んだことについて、統計解析の演習並びに問題の解説を行う。


I 平田昌彦編『生物・農学系のための統計学』、朝倉書店、2017年、p.112.
II 平田昌彦編『生物・農学系のための統計学』、朝倉書店、2017年、p.112-113.
III 平田昌彦編『生物・農学系のための統計学』、朝倉書店、2017年、p.113-126.

②授業配布プリント、各自のパソコン

③授業配布プリント、各自のパソコン
コマ主題細目 ① 実験計画 ② 統計解析の演習 ③ 統計演習の解説 ④ ⑤
細目レベル ① 調査実験の組み立て方、サンプリングの方法を理解する。

I 実験計画法とは
 実験とは「対象とする「事象」が特定の「条件」によって変化するか?」といった疑問を、仮説を立てて、その仮説を検証する作業を指す。具体例を挙げると、
〇疑問「魚の体重(事象)を増やすにはどんなこと(条件)をすればよいか」
〇仮説「エサの種類を変えることで、魚の体重が増える」
〇検証「魚を〇グループに分け、各グループに異なるエサを与え、各グループの体重の変化を調べる」
 このようにして実験を進めていくわけであるが、実験をスタートする前はまだ考えるべきことが多数ある。具体的には、どんな魚を対象にするか、魚を何グループに分けるか(=何種類のエサで比較するか)、各グループの水槽の数をいくつにするか、・・・。実験を行う際には、最小限の労力や費用で実験目的を達成できるように計画を耐える必要がある。このための手法が実験計画法である。

II 実験計画の考え方
 実験において、条件にあたるものが因子である。上記の例での因子は「エサ」である。因子の中での区分を水準と呼び、上記の例では「エサあり、エサなし」「エサA、エサB、エサC」「エサの頻度 1回/日, 2回/日, 4回/日」などが考えられる。同じ因子でも様々な水準が挙げられるため、自身の立てた仮説を検証するための適切な処理を考える必要がある。
 また、実験には必ず誤差が含まれる。誤差は大きく分けて3種類あり、測定ミスによる誤差(過誤)、日当たりの違いなど理由の分かる誤差(系統誤差)、原因のはっきりしない誤差(偶然誤差)がある。調査や実験で取得したデータに誤差が多く含まれると、本来は違いがあるべきなのに有意な差が認められない、といった結果になる恐れがある。そのため、可能な限り誤差を小さくしてデータを取得する必要がある。誤差の中で、「過誤」は測定者の注意によって、「系統誤差」は局所管理(適切な実験配置や調査方法を考えること)やデータの無作為抽出によって、最小限にすることができる。しかしながら、「偶然誤差」はコントロールすることができない。「偶然誤差」を最小限にするためには、調査や実験の反復を増やすことが重要といえる。
 以上から、適切な実験計画を組み立てるには、「局所管理」「無作為」「反復」の3つを意識することがポイントである。この3つは「フィッシャーの3原則」と呼ばれる。
 
III 適切な計画設計
 最初に局所管理について考える。局所管理を適切に行うためには、ある処理が別の処理に影響しないこと、処理以外の条件をそろえることが重要である。例えば、肥料の効果を調べる圃場実験では、施肥区から流出する雨水が、無施肥区に入り込まないような実験設計にしなければならない。施肥区と無施肥区の日当たりを同じ状態にしなければならない。施肥区と無施肥区のもともとの土壌水分量を同じにしなければならない。このような配慮によって、系統誤差を小さくすることができる。

 次に無作為について考える。肥料の効果を調べる圃場実験を行う場合、調べる個体を各処理区からランダムに抽出することが大切である。調査労力を減らすため、道路に近い個体ばかりで調べると、光条件や土壌水分条件に偏りが生じてしまう恐れがある。ランダムに抽出することで系統誤差を小さくすることができる。

 最後に反復について考える。実験回数や調査回数を繰り返すことで、処理の効果と偶然誤差を区分することができる。しかしながら、反復を増やせば増やすほど、労力も費用も増えてしまう。ではどれだけ反復する必要があるのか。一般的に「誤差の自由度」が6~20あればよいといわれている。
 自由度とは、「自由に決めることができる値の数」という意味である。例えば全体のデータが3つあり、その平均が5であったとする。このとき、データの1つ目と2つ目は自由に決めることができるが、データの3つ目は、3つの平均を5にするために、自由に決めることができない。すなわち、このデータの自由度は「2」である。通常、自由度は「全体数-1」と考えればよい。
 自由度は3種類あり、処理の自由度(要因の自由度)、誤差の自由度(残差の自由度)、全体の自由度がある。3種類の関係は、全体の自由度=処理の自由度+誤差の自由度 という関係になっている。ここで、全体の自由度は「全データ数-1」となり、処理の自由度は「全処理数-1」である。以上から、誤差の自由度が求められる。具体例を挙げて考える。エサ処理(エサA、エサB、エサなし)に伴う魚の産卵数の実験(調査したのは20個体)をした場合、全体の自由度は「20-1=19」、処理の自由度は「3-1=2」となる。ゆえに、この場合の誤差の自由度は「19-2=17」である。前述のとおり、一般的に「誤差の自由度」は6~20あればよいため、調査の反復はこれで問題はないといえる。なお、処理の自由度に関して、今回の事例のようにエサ処理ではなく、体サイズ(連続値)を利用した場合は、自由度1としてカウントする。

 実験計画の一つに乱塊法がある。乱塊法とは、試験区全体をいくつかのブロックに分け、各ブロック内に処理の一揃いを無作為に割り付ける方法である。乱塊法は、フィッシャーの3原則(「局所管理」「無作為」「反復」)を満たす最も基本的なデザインである。

② 講義で学んだ統計解析手法の実践を行う
 卒業研究などでデータ解析が必要な場合、統計学の講義で学んだ知識を自分の研究に応用することが求められる。しかしながら、特に研究経験の浅い卒論生の場合、学んだ知識をどのように活用すればよいか困惑することが多い。
 主要な困惑事項として、①適切に解析を実行するためにはどのようにデータをエクセル等に集計すべきなのか、②数多い解析方法がある中で自身の調査にはどの手法を選択すればよいのか、③アプリケーションでその解析を実行するためにはどのような操作が必要か、といったことが挙げられる。
 本項では、担当教員が出す様々な実践的な課題の問題演習を繰り返しながら、上述の①~③について解決を図る。なお本項目では、各自がパソコンを持参し、それぞれが確実に解析作業を実践できるようになることを目指す。


③ 実践問題の解答確認及び問題解説から、解析技術を定着させる
 前項で、担当教員の出した統計解析の問題を各自取り組むこととした。しかしながら、初めての解析作業では、操作方法などでトラブルの発生も予想され、学生間で習得状況の差異が発生することも懸念される。
 そこで本項では、全員が確実に解析できるようになることを目指すため、グループワークも取り入れることとする。グループメンバー同士が助け合いながら、与えられた課題の解決を図り、解析技術を習得できる展開とする。解析方法を実施できたメンバーは、解析で困っている他のメンバーにアドバイスすることで、お互いの解析技術の向上に役立てる。
 最後に、与えられた統計課題について、担当教員が解説を行う。求める課題解決のためには、①どのようにデータをまとめるべきだったか、②どのような解析手法を選択する必要があったのか、③その手法を実施するためにはどのような操作が必要か、これらを確認してもらいたい。①~③について、自身(グループ)で考えた方法と教員が示した方法とを比較することで解析技術を定着させる。

 



キーワード ① 反復 ② 無作為 ③ 自由度 ④ 問題演習 ⑤ 問題解説
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 【復習】今回のコマシラバスの細目レベルをあらためて熟読し、知識を深める。特に担当教員から学んだ「細目レベル①」の項目については、今回の授業のベースとなる部分なので、細かい部分まで理解しておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。また、講義の中で配布された資料についても見直しておく。コマシラバスや授業資料の一連の見直しが終わった段階で、授業中に配布された課題プリントに取り組む。課題プリントは本講義で学んだ内容に関する、基礎から応用にわたる練習問題である。最初は何も参考にせずに課題プリントに取組み、分からない部分があったらコマシラバスや授業資料を参考して解けるようにしてほしい。課題プリントの答え合わせ及び解説は次回の授業の中で行う。

【予習】次回のコマシラバス「細目レベル①」を熟読し、次回の授業で実施する項目について準備をしておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。

15 全体復習 科目の中での位置付け  本講義では、最初に統計解析の基本部分を次の順序学ぶ:①データを集計したときに示される基本統計量とは何か理解する。②統計解析を実施するために欠かすことのできない確率分布や確率変数について理解する。③得られたデータからどんなことが予測されるかなど、推定や検定の基本理論を理解する。④検定方法をいくつか紹介し、どういった場合にどの検定方法を利用すべきなのか理解できるようになる。⑤あるデータAと別のデータBとの関係性について理解する。⑥あるデータAから別のデータBを予測するための回帰分析について理解する。統計解析の基本を学んだのちに、卒業研究等で実践できる統計解析手法について次の順序で学ぶ:⑧統計モデリングとは何か理解する。⑨統計ソフトRを用いて特定の確率分布を仮定した解析方法の理論と、一般化線形モデルとの繋がりを理解する。⑩統計ソフトRを用いて一般化線形モデルの組み立てを理解する。⑪一般化線形モデルの解析結果について理解する。⑫一般化線形モデルによる様々な解析事例を理解する。⑬一般化線形モデルのカテゴリカル変数が有意になったのちに行う多重比較について理解する。⑭統計解析を実行するために必要な調査・実験デザインについて理解する。なお、7回目、15回目の講義は、これまでの復習回とし、実践問題の練習を行うこととする。一連の講義を通して、卒業研究などで統計解析を実行するための実践的な知識・技術を身につけることができる。
 15回目の講義では、これまでに学んだことの総復習を行って理解の定着を測ることを目的とし、最初に、I.統計学の基本(1-6回目まで)の復習 II.統計の活用(8-13回目)の復習 III.実験計画の構築(14回目)の復習 について展開する。その後、学んだことについて、統計解析の演習並びに問題の解説を行う。

①これまでの課題学習プリント、1回目から14回目まで利用した参考資料(各回の参考資料を参照)

②授業配布プリント、各自のパソコン

③授業配布プリント、各自のパソコン
コマ主題細目 ① 全体復習 ② 統計解析の演習 ③ 統計演習の解説 ④ ⑤
細目レベル ① これまでに学んできたことを、練習問題を交えて復習していく。

I.統計学の基本
 講義1回目から6回目の項目の総復習を行う。すなわち、①基本統計量について、②確率論の基礎について、③推定や検定の理論と実施方法について、④基本的な検定方法について、⑤相関関係の意味と解析方法について、⑥回帰分析の意味と解析方法について、これらに関する練習問題に取り組み、その後解説を交えた説明することで、知識の定着を図る。

II.統計学の活用
 講義8回目から13回目の項目の総復習を行う。すなわち、⑧統計モデリングの意味について、⑨確率分布と最尤推定について、⑩応答変数の確率分布がポアソン分布に属するばあいの一般化線形モデルについて、⑪最適モデルの選び方、説明変数の効果の検定について、⑫応答変数の確率分布が二項分布、正規分布、ガンマ分布に属する場合の一般化線形モデルについて、オフセット項の利用について、⑬多重比較について、これらに関する練習問題に取り組み、その後解説を交えた説明することで、知識の定着を図る。

III.実験計画の構築
 講義14回目で学んだ実験計画法の復習を行う。卒業研究を実施する際には、適切な調査・実験デザインを考えることが必須といえる。適切な調査・実験デザインを構築できなければ、得られたデータの統計解析に支障をきたし、適切な結論を導くことができないためだ。そこで、実験計画を構築するための練習問題に取り組み、その後解説を交えた説明することで、知識の定着を図る。

② 講義で学んだ統計解析手法の実践を行う
 卒業研究などでデータ解析が必要な場合、統計学の講義で学んだ知識を自分の研究に応用することが求められる。しかしながら、特に研究経験の浅い卒論生の場合、学んだ知識をどのように活用すればよいか困惑することが多い。
 主要な困惑事項として、①適切に解析を実行するためにはどのようにデータをエクセル等に集計すべきなのか、②数多い解析方法がある中で自身の調査にはどの手法を選択すればよいのか、③アプリケーションでその解析を実行するためにはどのような操作が必要か、といったことが挙げられる。
 本項では、担当教員が出す様々な実践的な課題の問題演習を繰り返しながら、上述の①~③について解決を図る。なお本項目では、各自がパソコンを持参し、それぞれが確実に解析作業を実践できるようになることを目指す。


③ 実践問題の解答確認及び問題解説から、解析技術を定着させる
 前項で、担当教員の出した統計解析の問題を各自取り組むこととした。しかしながら、初めての解析作業では、操作方法などでトラブルの発生も予想され、学生間で習得状況の差異が発生することも懸念される。
 そこで本項では、全員が確実に解析できるようになることを目指すため、グループワークも取り入れることとする。グループメンバー同士が助け合いながら、与えられた課題の解決を図り、解析技術を習得できる展開とする。解析方法を実施できたメンバーは、解析で困っている他のメンバーにアドバイスすることで、お互いの解析技術の向上に役立てる。
 最後に、与えられた統計課題について、担当教員が解説を行う。求める課題解決のためには、①どのようにデータをまとめるべきだったか、②どのような解析手法を選択する必要があったのか、③その手法を実施するためにはどのような操作が必要か、これらを確認してもらいたい。①~③について、自身(グループ)で考えた方法と教員が示した方法とを比較することで解析技術を定着させる。

 



キーワード ① 統計理論 ② GLM ③ 実験計画 ④ 問題演習 ⑤ 問題解説
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 【復習】今回のコマシラバスの細目レベルをあらためて熟読し、知識を深める。特に担当教員から学んだ「細目レベル①」の項目については、今回の授業のベースとなる部分なので、細かい部分まで理解しておく。その際、参考資料の中の当該項目も参照しながら理解を深めておくことが望ましい。また、講義の中で配布された資料についても見直しておく。コマシラバスや授業資料の一連の見直しが終わった段階で、授業中に配布された課題プリントに取り組む。課題プリントは本講義で学んだ内容に関する、基礎から応用にわたる練習問題である。最初は何も参考にせずに課題プリントに取組み、分からない部分があったらコマシラバスや授業資料を参考して解けるようにしてほしい。課題プリントを確実に解けるようになることが、定期試験対策にもつながる。

【予習】試験対策として、コマシラバス全体を熟読するとともに、これまでの課題プリントを確実に解けることのできるようにしておく。

履修判定指標
履修指標履修指標の水準キーワード配点関連回
統計解析の基本  平均や中央値などデータの代表値、分散や標準偏差などデータのばらつきについて理解し、それぞれの計算を行うことができる。確率を適切に算出でき、確率変数や確率密度分布について意味を理解している。統計量の推定について理解し、95%信頼区間を定めることができる。検定の理論や意味、実施方法について理解し、帰無仮説や対立仮説の意味、有意水準(p値)の意味、パラメトリックやノンパラメトリックの違い、t検定、U検定、カイ二乗検定等を説明でき、解析を適切に行うことができる。これらの理解を確認するため、試験は上述の内容からいくつかピックアップして出題する。 基本統計量、確率論、推定、検定 20 1,2,3,4,7,15
相関と回帰  2つのデータの関係を見て、正の相関、負の相関、無相関のいずれの関係があるのか判断することができる。相関関係を評価するために必要な相関係数を、平均値、標準偏差、共分散を用いて算出することができ、2つのデータの相関の強さについて判断することができる。2つのデータ間に相関関係があるかどうかを、適切な無相関検定法により検定することができる。最小二乗法の意味を理解して、回帰直線の切片と傾きを適切に定めることができる。回帰直線を見て、その直線が何を示しているのか理解することができる。これらの理解を確認するため、試験は上述の内容からいくつかピックアップして出題する。 相関の有無、共分散、ピアソン、スピアマン、傾き、切片 20 5,6,7,15
統計モデリング  線形モデルとはどのような統計モデルなのか理解している。線形モデルと一般化線形モデルの違いを理解し、どのような場合に一般化線形モデルを利用すべきか判断することができる。確率分布の意味を理解し、データに合わせてどの確率分布に当てはめるべきか検討することができる。最尤推定の意味と、どのような場面で実施するのか理解している。説明変数、応答変数、リンク関数それぞれについて理解し、それらを組み合わせて一般化線形モデルの構築方法を説明できる。これらの理解を確認するため、試験は上述の内容からいくつかピックアップして出題する。 GLM、確率分布、最尤推定、リンク関数、説明変数、応答変数 20 8,9,10,15
一般化線形モデルの展開  データの種類に応じて、確率分布やリンク関数を定め、それぞれ一般化線形モデルを構築することができる。割り算値が含まれる応答変数に関して、適切な処理をおこなって一般化線形モデル構築することができる。複数のモデルの中から、応答変数を適切に予測できるような最適モデルを選択することができる。一般化線形モデルに含まれる説明変数について、応答変数に与える影響が有意かどうか検定することができる。多重比較の意味について理解しており、適切な方法で多重比較を実施することができる。多重比較結果の表示方法を理解しており、正しく図表を読み取ることができる。これらの理解を確認するため、試験は上述の内容からいくつかピックアップして出題する。 オフセット、AIC、尤度比検定、テューキー、ダネット 20 11,12,13,15
実験計画法  実験とはどういう作業なのかを理解しており、実験計画の重要性について説明できる。実験計画を立てるうえで検討すべき系統誤差、偶然誤差について理解しており、さらにそれぞれの誤差を軽減化する方法について理解している。実験計画に重要なフィッシャーの3原則について説明できる。適切な「局所管理」を実行するための実験計画について検討することができる。「無作為」の重要性について理解しているとともに、どのように調査データを取得すれば無作為になるのかを理解している。「反復」の重要性について理解しており、自由度の概念を踏まえたうえで、どれくらいの調査データを取得すべきなのか判断することができる。実験計画法の理論を踏まえたうえで、適切な実験計画を組み立てることができる。これらの理解を確認するため、試験は上述の内容からいくつかピックアップして出題する。 系統誤差、偶然誤差、局所管理、無作為、反復、自由度 20 14,15
評価方法 最終試験(100%)により評価する。 *成績発表後、教務課にて試験・レポートに関する総評が閲覧できます。
評価基準 評語
    学習目標をほぼ完全に達成している・・・・・・・・・・・・・ S (100~90点)
    学習目標を相応に達成している・・・・・・・・・・・・・・・ A (89~80点)
    学習目標を相応に達成しているが不十分な点がある・・・・・・ B (79~70点)
    学習目標の最低限は満たしている・・・・・・・・・・・・・・ C (69~60点)
    学習目標の最低限を満たしていない・・・・・・・・・・・・・ D (60点未満)
教科書 指定しない
参考文献 文字数過多のため、参考文献は各コマの「教材・教具」欄を参照してください。
実験・実習・教材費 なし