区分 環境データサイエンス科目 環境情報科目 環境情報基本科目
ディプロマ・ポリシーとの関係
専門性 理解力 実践力
カリキュラム・ポリシーとの関係
専門知識 教養知識 思考力
実行力
カリキュラム全体の中でのこの科目の位置づけ
多様化する環境問題や地域社会の諸問題に関心を持ち、環境・情報・社会に関連する幅広い基礎知識と専門的な理解を深めると共に、学際的な柔軟性を有し、実践的な能力を有する。グローバルな視野と研究調査力を持ち、昨今の情報社会に貢献できる力を有する。企業・地域社会などのあらゆるコミュニティに寄与する組織的な活動能力を有する。
科目の目的
卒業研究のみならず、様々な講義やサークル活動においてデータを取り扱う場面は多くある。その際に、得たデータに対して、主観を除いて客観的に分析するための知識が求められる。本科目では、前提とする科目である基礎数学で習得した知識と方法を基礎とし、統計解析の基本的な考え方と応用法を理解する。それにより、統計データの意味を読み取る力をつけるとともに、今後自らが収集・測定することによって得たデータの整理、分析法を身につける。なお、全授業終了時には、統計検定3級程度のデータ分析能力が獲得できていることが望まれる。
到達目標
統計解析の基礎となる概念、意義について理解し、数値的な計算が行えるようになることを目標とする。特に、確率分布と期待値、標準偏差の関係、母集団と標本の関係を理解し、標本の解析から母集団の推測、検定を行うことの意義と限界を理解する。それらを、データを使って解析できるようになることを目標とする。
科目の概要
本科目では、統計処理法の基礎を、回を追って段階的に展開していく。第1回と第2回の講義では、統計解析の目的と概要を説明する。第3回と第4回の講義では、データの代表値とそれを計算する方法を学ぶ。第5回と第6回の講義では、分散と標準偏差の計算方法を学ぶ。第7回と第8回の講義では、確率変数と確率の意味、確率分布と相対度数分布を学ぶ。第9回と第10回の講義では、コイントスを例にとり、分布の中で代表的な二項分布を学ぶ。第11回と第12回の講義では、正規分布の基本的性質を知るところまでをおさえる。第13回と第14回の講義では、正規分布の標準化、標準正規分布の確率密度、累積分布を学ぶ。第15回と第16回の講義では、全数調査と標本調査の違いを学ぶ。第17回と第18回の講義では、標本分散と母分散の関係を学ぶ。第19回と第20回の講義では、母分散が不明の場合について、 母平均の区間推定の考え方を学ぶ。第21回と第22回の講義では、2群のデータの母平均の有意差を検定する方法を学ぶ。第23回と第24回の講義では、データが従う分布を仮定することが困難な際に用いられるノンパラメトリック検定を学ぶ。第25回と第26回の講義では、2つの分類基準の間に関係がある かないかを判定する独立性の検定を学ぶ。第27回と第28回の講義では、3 群以上からなるデータの母平均の有意差を検定する分散分析を学ぶ。第29回と第30回の講義では、全般にわたる演習問題を行い、理解を確実なものにする。これらは、第1回の講義から第8回までの講義を第一部とし、第9回の講義から第14回の講義を第二部とし、第15回の講義から第22回の講義を第三部とし、第23回の講義から第28回の講義を第四部と位置付ける。第29回と第30回の講義は学びの確認と位置付ける。
科目のキーワード
母集団、標本、確率、正規分布、区間推定、平均値の差の検定、相関、独立性の検定、分散分析、ノンパラメトリック検定
授業の展開方法
講義では、教員が作成した資料を配布し、その配布資料のみを用いる。すなわち、配布資料がテキストと問題集を兼ねている。配布資料は、ワードやパワーポイント、エクセルによって作成された資料で、教員がスクリーンに投影しながら解説する。また、黒板への板書も併用する。講義時間中に練習問題へも取り組む。練習問題を各自で解いた後に、すぐに教員から回答例や解説を受けることで、学生は当該箇所を確認しながら授業に参加し、理解を深めることができる。

【30回の授業内容】
1.統計解析の目的と概要
2.統計解析の利用
3.平均値とヒストグラム
4.5数要約
5.データのバラツキ
6.分散と標準偏差
7.データの分布_確率
8.データの分布_期待値
9.分布の形 (1) 二項分布
10.分布の形 (1) 二項分布_演習
11.分布の形 (2) 正規分布
12.分布の形 (2) 正規分布_演習
13.分布の形 (3) 正規分布の標準化
14.分布の形 (3) 正規分布の標準化_演習
15.推計統計学_概要
16.推計統計学_平均と分散
17.母平均の推定 (1) 基礎
18.母平均の推定 (1) 基礎_演習
19.母平均の推定 (2) t分布
20.母平均の推定 (2) t分布_演習
21.母平均の推定 (3) 2標本データの比較
22.母平均の推定 (3) 2標本データの比較_演習
23.ノンパラメトリック検定
24.ノンパラメトリック検定_演習
25.複数のデータの分析 (1) χ2分布
26.複数のデータの分析 (1) χ2分布_演習
27.複数のデータの分析 (2) 分散分析
28.複数のデータの分析 (2) 分散分析_演習
29.総合演習_1
30.総合演習_2

オフィス・アワー
【火曜日】昼休み・4時限目、【水曜日】1時限目、昼休み(会議日は除く)、【木曜日】1時限目、2時限目、昼休み、3時限目、4時限目、【金曜日】2時限目・昼休み、3時限目(後期のみ)
科目コード ENS502
学年・期 2年・前期
科目名 環境統計解析学基礎
単位数 4
授業形態 講義
必修・選択 選択
学習時間 【授業】90分×15 【予習】90分以上×15 【復習】90分以上×15
前提とする科目 基礎数学
展開科目 環境統計解析学応用、環境プログラミング基礎、地理空間情報学
関連資格 社会調査士
担当教員名 谷地俊二
主題コマシラバス項目内容教材・教具
1 統計解析の目的と概要 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第一部の基礎として、統計解析の目的と概要を説明する。
【教材】
(1)コマ用オリジナル資料ワード資料p.1-2. コマ用オリジナル資料パワーポイント資料スライド1-6.
(2)コマ用オリジナル資料ワード資料p.2-3. コマ用オリジナル資料パワーポイント資料スライド7-13.
(3)コマ用オリジナル資料ワード資料p.3-5. コマ用オリジナル資料パワーポイント資料スライド14-15.

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 6-7.
(2)栗原伸一・丸山敦史(2017)統計学図鑑,オーム社,P4, 42-57.
(3)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 15-32.

【参考とコマ主題細目との対応】
主題細目① 参考(1)「はじめての統計学」
主題細目② 参考(1)「はじめての統計学」
主題細目③ 参考(2)「統計学図鑑」、参考(3)「はじめての統計学」
コマ主題細目 ① 統計解析概要  ② 記述統計と推計統計 ③ 母集団と標本
細目レベル ① 「統計」とは、「集団における個々の要素の分布を調べ、その集団の傾向・性質などを数量的に統一的に明らかにすること。また、その結果として得られた数値」と、広辞苑に書かれている。テレビ、新聞、インターネットでは多くの数値データと統計解析結果、それらに基づく予測等が報道されている。年間交通事故死亡者数、年間晴天日数、最高・最低気温、年間来日観光客数などはデータそのものであり、その推移が論じられる。内閣支持率、平均寿命、降水確率、国内総生産(GDP)などはデータにある処理を加えて得られる解析結果であり、それらをもとに論議し、将来を予測し、生活の仕方を決めていく。大学・研究所などでは様々な調査、実験を行って多様なデータを得ている。気温、湿度などの気象データ、動物の生息数、農作物の収穫数、河川、湖沼の水質の地域分布や年次変化、他の人が調べ公表されたデータや自ら得たデータなどさまざまである。これらを漫然と並べ、眺めているだけでは新しい発見や今後の見通しを得ることはできない。そこで得られたデータを取捨選択し、整理してそこから何らかの普遍的な法則や指針を得る作業が大学・研究所等で行われる研究の大きな部分を占めている。ここでのポイントは、このように、多くのデータの集まりについて、規則性を探り、新たな法則を見出していくときに必要とされるのが統計処理であることをおさえることとする。
② 統計は、記述統計と推測統計に大別される。ある小学校の6年生男子250人について、身長を調べることとする。全員の身長を測定してその特徴を知ることを記述統計と呼ぶ。一方、対象となるグループのデータ全体を収集することが不可能、あるいは困難な場合がある。そのような場合には対象となるデータの一部を抽出して解析しその結果から元の全体のデータの特徴、傾向、性質を推測する。このような方法を推測統計と呼ぶ。例えば、内閣支持率のような場合、知りたいのは全有権者について調査した時に得られるであろう値、支持する人の数/全有権者数 である。しかし、全有権者にあたって調査することは事実上不可能である。そこで、有権者の中からランダムに対象者を抽出し、選び出した有権者について調査を実施する。その結果から全有権者についての支持率を推測する。このように、日頃から用いられている例を考えながら、違いをおさえる。ここでのポイントは、記述統計は知りたい対象すべてのデータを扱う方法であり、推計統計はデータの一部を用いて推計する方法であることを理解することとする。そして、卒業研究では、主に推計統計を扱うことになることも説明する。
③ コマ主題細目②で示した内閣支持率について、元の全有権者を母集団、選び出された有権者を標本という。つまり、本来の目的として知りたいと考えている集団全体のことが、「母集団」である。一方、「母集団」の情報を推測するために選ばれた集団のことを「標本」と呼ぶ。母集団と標本の関係性としては、母集団から一部のデータを抽出したものが標本であり、その標本をもとに母集団を推測することになる。ここで、母集団から一部を選んで標本とする操作を、「抽出」と呼ぶ。さらに、母集団から抽出された標本を用いて、母集団の性質を推測することが、「推計統計」となる。ここでのポイントは、母集団と標本といった用語の理解といえる。両者は、特に分散や標準偏差の計算が異なる。現段階では、母集団が全体で、標本が母集団の中から抜き出した一部であることを理解することが大切である。
キーワード ① 記述統計 ② 推計統計 ③ 母集団 ④ 標本 ⑤ 抽出
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、「標本」と「母集団」の違いをおさえることである。例えば、選挙における元の全有権者を母集団、選び出された有権者を標本という。具体的には、母集団が全体で、標本が母集団の中から抜き出した一部である。今回の課題は、以上を理解し、必要であればノートに違いをまとめることとする。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回は概念の理解が重要であり、特に、標本と母集団の違いを理解することが重要である。

【次コマの予習】
基礎数学の講義資料を見直し、特に、標準偏差の算出方法を確認する。

2 統計解析の利用 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第一部の基礎として、統計解析の利用を説明する。
【教材】
(1)コマ用オリジナル資料ワード資料p.6-8. コマ用オリジナル資料パワーポイント資料スライド16-18.
(2)コマ用オリジナル資料ワード資料p.9-10. コマ用オリジナル資料パワーポイント資料スライド19-20.
(3)コマ用オリジナル資料ワード資料p.11-14、コマ用オリジナル資料パワーポイント資料スライド21-26.

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 6-7.
(2)栗原伸一・丸山敦史(2017)統計学図鑑,オーム社,P4, 42-57.
(3)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 15-32.
(4)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 2-5, 158-168.

【参考とコマ主題細目との対応】
主題細目① 参考(1)「はじめての統計学」、参考(2)「統計学図鑑」
主題細目② 参考(3)「はじめての統計学」
主題細目③ 参考(4)「は改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」
コマ主題細目 ① 母平均推定 ② 実験研究と観察研究 ③ 統計グラフ
細目レベル ① 母集団の平均値を、母集団から無作為抽出して得た標本平均値から求めることも同様に推測統計である。例えばある小学校の男子生徒総数を250人とし、その平均身長を求める場合を考える。全員を調べずに例えば無作為抽出した30人のデータの平均値(標本平均値)から推定する。この時も、母集団の真の平均値(母平均値)は標本平均値とぴったり同じにはならず、標本平均値に近いある値になっていると推測される。ここで、母集団の平均値は、ある「確からしさ」を決めると真の平均値は 範囲に存在する、などという推定の仕方をする。これを区間推定という。この範囲を決めるためには、母集団や標本の平均値だけではなく、それぞれのデータの分布と、散らばり方の大小を示す数値として「分散」、あるいは「標準偏差」が必要になる。基礎数学において習得した知識も活用しながら基礎をおさえる。ここでのポイントは、母集団と標本において、それぞれ平均値、分散、標準偏差があり、扱い方が違うものであると同時に、計算においても異なる箇所があることを理解することが必要である。
② 統計学では、まず知見を得たい集団を明確に設定し、適切に計画された実験や調査によりデータを得ることから始まる。つまり、質的変数と量的変数の違いに分けることから始まり、量的変数においては「離散変数」と「連続変数」に分けて考えることから始まる。次に、得られたデータを、知見を得るために使用できるように少数個の数値や図にまとめ上げることによって、情報を抽出する。そして、データと情報をもとに最適な統計モデルを設定して推測を行い、集団や現象のメカニズムに関する知見を得ることになる。ここで重要なことは、最初の適切なデータ収集を行うことと言える。例えば、化学物質による生態影響を評価する際に、処理を施した(処理群)と、処理を施していない(対照群)を設置して結果を比較し、処理の影響(効果)を検討することになる。これは「実験研究」と呼ばれる。また、大学生への環境保全活動参加への興味を調査したい場合は、数多くの大学生に対してアンケート調査を実施し、どのような学問領域を学んでいるのかなどを調査し、その因果関係を考えることになる。これは「観察研究」と呼ばれる。どちらの研究においても重要なことは、計画の立案である。計画立案の時点で、すでにどのような統計処理を用いるべきかを考えていなければいけない。ここでのポイントは、データの状況から質的変数か量的変数かを分けることとする。統計処理においては、まず計画立案の段階でどのようなデータが得られるかを考える。その時点で、データが質的変数となるのか量的変数となるかを判断できる力が、卒業研究を遂行する上で必要となる。
③ 第一回講義の主題細目②で述べた通り、統計処理ではまず計画立案が重要である。そして、計画通りに研究を遂行するとデータが得られる。そのデータは、必要な情報を抽出することでデータを要約することができる。その際に、グラフ(図)を用いることで、データが示す意味を理解したり、説明したりすることができるようになりやすい。ここで作成するグラフを統計グラフと呼ぶ。しかし、研究テーマがさまざま存在するように、データもさまざまな目的によって得られることになる。つまり、目的に応じたさまざまな統計グラフも存在することになる。得られたデータに対して適切でない統計グラフを選択して作成した場合、グラフ側が持つ「グラフの特徴」がデータに適していないため、データを要約することはできない。ここでは、さまざまな統計グラフを紹介し、グラフの特徴を把握することを目的とする。ここでのポイントは、授業において紹介された統計グラフのすべてについて、どのようなデータに使用可能かを把握することとする。そのためにも、実際にグラフを描く練習が必要となる。
キーワード ① 母集団 ② 標本調査 ③ 区間推定 ④ 分散 ⑤ 標準偏差
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、「標本」と「母集団」の違いをおさえることである。例えば、選挙における元の全有権者を母集団、選び出された有権者を標本という。推測統計での概念は授業で説明した通りだが、ここでは、標準偏差の計算方法が少し異なることを忘れないでいただきたい。具体的には、標本は「自由度でわる」ことになる。今回の課題は、以上を理解し、必要であればノートに違いをまとめることとする。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回は概念の理解が重要であり、特に、標本と母集団の違いを理解することが重要である。

【次コマの予習】
基礎数学の講義資料を見直し、データの代表値の算出方法を確認する。

3 平均値とヒストグラム 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第一部の基礎として、データの代表値とそれを整理する方法を学ぶ。
【教材】
(1)コマ用オリジナル資料パワーポイント資料スライド1-15.
(2)コマ用オリジナル資料パワーポイント資料スライド16-19.
(3)コマ用オリジナル資料パワーポイント資料スライド20-24.

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 55-58.
(2)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 8-9, 33-36. 日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 31-34.
(3)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 34-38.

【参考とコマ主題細目との対応】
主題細目① 参考(1)「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」
主題細目② 参考(2)「はじめての統計学」
主題細目③ 参考(3)「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」
コマ主題細目 ① 平均値とヒストグラム ② 度数分布 ③ ヒストグラム
細目レベル ① 代表値の中で最も普通に用いられるものが平均値である。平均値はデータの総和をデータの個数で割ることで表されることが最も多く、これを相加平均と呼ぶ。相加平均は算術平均とも呼ばれる。これに対して、データグループの特徴や解析の目的によって相乗平均(幾何平均ともいう)を求めることもある。これは、データの積にデータの個数のn乗根を取ったものである。例えば、年間の物価上昇率(前年比)のデータがあったとする。このとき、年間の物価上昇率の平均について、上昇率の特徴を「前年の何倍になっているのか」という風に考えると、それは3年間同じ上昇率と考えた場合の平均上昇率ということになり、相乗平均を考える方が自然である。一般的に用いられる平均は相加平均であることは、感覚的にも理解できると思う。しかし、「変化率」の平均を考える場合には相加平均よりも相乗平均をとることが適切であることをおさえる。ここでのポイントは、正しく平均値を使い分けることの理解とする。データを正しく得たとしても、その後の解析を誤った場合は、適切な結論を導くことができないことは自明である。正しくデータを解析する技術は、卒論研究のみならず、卒業後の社会での業務において必要となる。
② 例えば、10人程度の身長のデータであれば、①で計算した平均を求める程度で全体の傾向をとらえることができる。しかし、データの数が50 人の身長測定値の場合、数字の羅列を見ただけでは、全体としての傾向や特徴は何もわからない。このようなとき、通常行われるのは、データを複数のクラス(階級)に分けて、クラスごとの度数を調べることである。各クラスの度数の集まりを度数分布という。これを表で表したものを「度数分布表」と呼ぶ。度数分布表を作成する際には「階級値」、「階級」、「度数」、「相対度数」を求める。階級値はそれぞれの階級を示す数値で、階級の中央の値を意味する。ここまでを求めた後に、階級値と相対度数の積を計算し、これを積算すると平均値に近い値になる。ここでは、度数分布表を作成し、そこから得られる平均値との関係についておさえる。ここでのポイントは、度数分布表を正しく作成することといえる。特に、階級を分ける際には、なぜその階級でわけることにしたのかといった理由について、各自が意見や根拠を持って分けることが重要である。
③ この度数分布を柱状のグラフで表したものをヒストグラムという。これは2次元のグラフのひとつであるが、縦軸に上の表の度数を、横軸に階級値を取ったものである。各階級の度数を足し合わせたものを総度数という。例えば、上記の②で示した情報の場合、総度数は50 である。元のデータが示されている場合、正確な平均値は50人分のデータを平均して計算できる。しかし、ヒストグラムだけが与えられていたとき場合には、加重平均(重み付き平均)を用いることができる。加重平均は、いくつかの決まった値が出る確率が与えられているときにも応用できる。なお、ヒストグラムを作成する際に、横軸におけるひとつひとつの区切りは、度数分布表の階級値となる。そのため、階級値の決定によって、ヒストグラムの形がかわる。ここでは、度数分布表とヒストグラムの関係をおさえ、ヒストグラムが描けるところまでをおさえる。ここでのポイントは、ヒストグラムの階級分けの違いによって、データ解釈が異なる場合があることを理解することといえる。ヒストグラムは、データを得た際の最初に作成し、その状況を把握するために用いられる。ここで階級分けを適切に行わなかった場合、誤った解釈をする可能性もある。よって、ヒストグラムを作成する際には、どのような理由をもって階級分けを行ったかを説明できるようにすることが重要である。
キーワード ① 平均値 ② 度数分布 ③ 度数分布表 ④ ヒストグラム ⑤ 相対度数
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、ヒストグラムを理解し、描くことである。階級値の設定によって形が異なるため、階級値の設定を間違えれば、逆に解釈が困難になる可能性もある。ただし「そのようなこともある」と理解していれば、その後に修正などの対応は可能となる。そのため、今回の課題としては、ヒストグラムを描く技術を確実なものにしていただきたい。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回は代表値とヒストグラムを理解することが重要である。各自でヒストグラムを描き、様々な代表値を計算できるようにする。

【次コマの予習】
百分率の考え方や算出方法について、基礎数学の資料を見直す。

4 5数要約 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第一部の基礎として、データの代表値とそれを整理する方法を学ぶ。
【教材】
(1)コマ用オリジナル資料パワーポイント資料スライド25-30.
(2)コマ用オリジナル資料パワーポイント資料スライド31-32.
(3)コマ用オリジナル資料パワーポイント資料スライド33-38. コマ用オリジナル資料エクセル資料シート2

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 34-38.
(2)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 38-44.
(3)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 5-7.
(4)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 44-47.
(5)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 13.

【参考とコマ主題細目との対応】
主題細目① 参考(1)「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」
主題細目② 参考(2)「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」、参考(3)「Excelで学ぶ統計解析入門」
主題細目③ 参考(4)「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」、参考(5)「Excelで学ぶ統計解析入門」
コマ主題細目 ① 四分位数 ② 5数要約 ③ 箱ひげ図
細目レベル ① ヒストグラムを描くことで、おおまかなデータ要約の方法を抑えることができた。次は、データを数字で要約することで、図表よりももう少し詳細に分布の形状を明らかにする方法として、分位数(分位点)を学ぶ。分位数とは、データを小さい方から大きさ順に並べ、データ全体をいくつかのグループに観測値の個数で等分した際の境界となる値を意味する。よく使用されるものが四分位数である。これは、数量を順位で4等分することを示す。四分位数で表現する際には、第0四分位数、第1四分位数、第2四分位数、第3四分位数、第4四分位数として示される。ここでのポイントは、四分位数とは、データを4等分したときの区切り値を示していることを理解することである。つまり、小さいほうから「25パーセンタイル(第1四分位数)」、「50パーセンタイル(第2四分位数:中央値)」、「75パーセンタイル(第3四分位数)」となる。この関係性の理解と、計算による導出ができるようになることが重要である。
② コマ主題細目①で確認した通り、第0四分位数は、すなわち最小値である。第1四分位数とは、データが100個あった場合に、小さい順に25番目にあるものを探すような作業である。つまり、第2四分位数は中央値となる。このように、第0四分位数(または最小値)、第1四分位数、第2四分位数(または中央値)、第3四分位数、第4四分位数(または最大値)とした5つの指標を、5数要約と呼ぶ。これを抑えると、データの分布の予想が可能となる。例えば、あるデータについて、中央値と最小値の差が、中央値と最大値の差よりも小さい場合、そのデータの分布は右側のすそが長い(山を描いた際に向かって右側斜面が緩やかなシルエット)図になる。データを要約する際に一般的に用いられる統計量として抑える。ここでのポイントは、5数要約の導出と、その解釈といえる。5数要約は、データの解釈において概観を捉える際に用いられる指標値である。その一方、平均値のように日常生活で多用される統計量ではないため、意味を理解できていないと、何を示しているのか理解し難い。よって、この指標値が何を示しているのかの理解のために、自ら導出できることと、その値が示す状況を確実なものにすることが必要である。
③ ヒストグラムと同様に、分布を表現するグラフの手法として「箱ひげ図」がある。この名称がグラフの特徴とデータの分布を表現している。つまり、「ひげ」の端で第0四分位数(または最小値)と第4四分位数(または最大値)を表し、「箱」の両端で第1四分位数と第3四分位数を表す。そして、「箱」の中に「1本の縦線」が引かれているが、これが第2四分位数(または中央値)を表す。また、上記の定義に基づくと、「ひげ」の両端の間の長さは最小値から最大値の「範囲」を示しており、「箱」の長さが四分位範囲を示していることが分かる。このグラフは、ヒストグラムに比べて作成が容易であり、データの要約としても理解しやすいため、よく用いられる。ただし、箱ひげ図はヒストグラムを描いた際に、山がひとつの場合にのみ用いることができる点に注意する。山が2つあるような特殊な分布を持つデータでは、その分布の特徴を表現できない。「箱ひげ図」は作成が容易で、データを理解しやすいことから使い勝手は良いが、注意点があることもおさえる。ここでのポイントは、主題細目②と関連するが、箱ひげ図の読み取りといえる。箱ひげ図は、四角と棒で構成される、いわば特殊な形のグラフである。しかし、他の図と異なり、示している情報は多く、使いこなせば使い勝手の良さに気がつくことと思う。まずは、5数要約の理解が必須となるが、それを踏まえた上で、四角と棒の意味を正しく理解することが重要といえる。
キーワード ① パーセンタイル ② 最小値 ③ 最大値 ④ 中央値 ⑤ 箱ひげ図
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、箱ひげ図を理解し、描くことである。データ全体を要約することができ、データの統計学的なばらつきをわかりやすく「箱」と「ひげ」で表現することができる。基礎ゼミナールでのフィードバックにおいても教員から示されたように、「全体のうちの何パーセントが」として示す際にも有用である。そのため、今回の課題としては、箱ひげ図を描く技術を確実なものにしていただきたい。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回は5数要約と箱ひげ図を理解することが重要である。各自で箱ひげ図を描き、5数要約を計算できるようにする。

【次コマの予習】
分散と標準偏差の算出方法について、基礎数学の資料を見直す。

5 データのバラツキ 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第一部の基礎として、分散と標準偏差の計算方法を学び、その意味を理解する。
【教材】
(1)コマ用オリジナル資料ワード資料p. 1-2. コマ用オリジナル資料パワーポイント資料スライド1-8.

(2)コマ用オリジナル資料ワード資料p. 1-2、コマ用オリジナル資料パワーポイント資料スライド9-11
(3)コマ用オリジナル資料ワード資料p. 3-4、コマ用オリジナル資料パワーポイント資料スライド12-19.

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 61-67.
(2) 日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 73-79.

【参考とコマ主題細目との対応】
主題細目① 参考(1)「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」
主題細目② 参考(2)「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析、
主題細目③ 参考(2)「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」
コマ主題細目 ① データの分析 ② データのバラツキ ③ 標準偏差
細目レベル ① 実験データや調査結果の数値は、通常ある「広がり」を持って分布する。データの分布は第2回で学んだヒストグラムのようなパターン(図)と、数値(代表値)で表され、認識される。分布のパターンにもさまざまなものがあるが、最も代表的なパターンは、平均値付近にピーク(度数の最大値)があり、その左右に裾野をひく一つ山のパターンである。これは、第二部の第11回の講義における「分布の形」の基礎となり、詳しい内容の理解は、第11回に行う。平均値はデータの集まりの特徴を表す重要な代表値である。しかし、分布を示すことを目的として、平均値の他にもうひとつ重要な代表値がある。それが分散と標準偏差である。ここではその定義をおさえる。ここでのポイントは、分散と標準偏差を確実に計算できるようになることといえる。特に、標準偏差は、平均値とともに今後学ぶ分布において、形を決定する最重要な統計量となる。まずは、確実に計算できるようになる必要がある。
② コマ主題細目①で確認したように、どのような実験や調査であっても、複数のサンプルを得た場合には、データにバラツキが生じる。ここまでは平均値、中央値といった、ひとつの数値によってデータ全体の特徴をつかむ代表値について学びを深めてきた。しかし、この値によって、データのバラツキ具合を推し量ることはできない。第4回講義のコマ主題細目②では5数要約として、第4回講義のコマ主題細目③では箱ひげ図として、「中央値」を基準としたバラツキ具合を値で示してきた。よってここでは、「平均値」を基準としたバラツキ具合を示す値として、分散や標準偏差を扱うこととする。ここでのポイントは、中央値を基準としたバラツキ具合と、平均値を基準としたバラツキ具合において、用いている指標がことなることを理解することといえる。箱ひげ図で扱った値は、四分位数であり、計算して求めるというよりも「探した値」であった。ここで学ぶ平均値を基準としたバラツキ具合の指標である標準偏差は、計算によって導出するものであるといった、扱っている指標値が異なっていることを理解する必要がある。
③ 標準偏差の計算理論は、第6回の講義にて解説する。ここでは、どのような値であるかのイメージを得ることを目的として説明する。なお、計算式自体は、暗記できないものではない。しかし、ここではその式の成り立ちをストーリー仕立てで理解することに重きを置く。例えば、3.00 cmのネジを100個作ったとする。売ろうとした際には、それが正確に3.00 cmなのかが重要である(当然、バラツキは生じる)。その際に、私たちはまずはなんとなく平均値を計算する。そして、その平均値から、ネジ1本1本がどの程度ズレているのかを確認する(偏差)。そのズレを要約しようとした際に、積算してしまうと0になる。この課題は、二乗することでマイナスをプラスへと変換してクリアできる。その二乗した結果をすべて足し算すると、バラツキの全体像が見えてくる(偏差平方和)。しかし、この状態では数が大きすぎてしまう。この場合、総数で割り算をして、平均値のように計算したくなってしまうことはもはや人情である。よって、偏差平方和を総数で割ったものが分散である。だが、この状態でもまだ値は大きすぎる。なぜならば、ここまでの計算過程において、マイナスを消すために二乗をしているためである。よって、平方根をとることで、元の次元へと数値を戻すことができる。これが、標準偏差である。ここでのポイントは、統計量には意味があることを、ストーリーをもとに理解することが必要と言える。
キーワード ① 代表値 ② 分散 ③ 標準偏差 ④ 偏差平方和 ⑤ 偏差
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、平均値のバラツキ具合の指標として、標準偏差あることを理解し、その計算の成り立ちを理解することといえる。今回は、標準偏差の計算理論はパスする(第6回での講義内容のため)としても、ストーリーをもとに統計量には意味があることを理解することが必要といえる。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回は標準偏差の利用と、算出の流れを理解することが重要である。計算の流れを説明できるようにする。

【次コマの予習】
次回は、標準偏差の実際の計算を行う。今回紹介した計算のストーリー(流れ)を確認し、自身の例に数字を使って置き換えてノートにまとめる。

6 分散と標準偏差 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第一部の基礎として、分散と標準偏差の計算方法を学び、その意味を理解する。
【教材】
(1)コマ用オリジナル資料ワード資料p. 3、コマ用オリジナル資料パワーポイント資料スライド20-21.
(2)コマ用オリジナル資料パワーポイント資料スライド22-34. コマ用オリジナル資料エクセル資料シート1-3

(3)コマ用オリジナル資料パワーポイント資料スライド35-41. コマ用オリジナル資料エクセル資料シート4-6

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1) 日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 73-79.
(2)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 8-9.
(3)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 63-76.
(4)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 10-11.

【参考とコマ主題細目との対応】
主題細目① 参考(1)「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」
主題細目② 参考(2)「Excelで学ぶ統計解析入門」
主題細目③ 参考(3)「はじめての統計学」、参考(4)「Excelで学ぶ統計解析入門」
コマ主題細目 ① 分散 ② 母標準偏差 ③ 標本標準偏差
細目レベル ① 第5回講義では、標準偏差の計算のストーリーまでを解説した。ここでは、標準偏差よりも先に算出される「分散」について学ぶ。個々のデータが平均値からどのように離れているか、という量を偏差と呼ぶ。偏差の定義は、「偏差 = 個別のデータ – 平均値」である。個々のデータは平均より大きかったり小さかったりするため、偏差は正になったり負になったりする。それぞれの絶対値は、個々のデータが平均からどれから離れているかを示す値になる。絶対値の合計が大きいほど、データの散らばり方が大きいことは理解できる。データの散らばり方の程度を表すのにこの絶対値の平均をとるのもひとつの方法と考えられるが、統計処理では絶対値を取る代わりに偏差の2乗の和(平方和)の平均を取ることにしている。これを分散と呼んでいる。分散は「分散 = 偏差の平方和 / データの個数」である。ここでのポイントは、分散は計算の最後において、データの個数で割っていることといえる。これは、データの個数で割らなかった場合、データの個数が増えれば増えるほど参考にする指標が大きくなってしまうためだからである。そしてもう一つのポイントは、分散はデータの広がりを表す数であるが、個々のデータや平均値とは異なる次元をもつことを理解することといえる。異なる次元とは、計算過程において2乗をしていることである。つまり、データを概観する際に、分散を参考にした場合は、バラツキ具合が大きく見える点に注意することといえる。
② コマ主題細目①からの続きとなるが、ポイントとして挙げた「次元が異なる」とは、平方していることを示す。つまり、同じ次元にするには分散の平方根を取ればよい。この平方根を標準偏差と呼ぶ(標準偏差^2=分散)。ただし、ここまでで説明した標準偏差は「母標準偏差」と呼ばれる指標値である。名称に「母」がついていることより、母集団を扱う際に用いられる標準偏差であることは予想がつくものと思う。つまり、調べたい対象全体(母集団)の標準偏差である。コマ主題細目③での学びとなるが、標本標準偏差とは異なるものである。違いはコマ主題細目③にて解説するが、まずここでのポイントは、標準偏差と分散はデータの散らばり具合を示す代表値として広く使われる量であり、平均値とともにデータ解析の基礎的な量としてよく理解し、計算できるようにしておくことが必要である。ここまでの計算方法をおさえる。
③ コマ主題細目②までの説明は標本データではなく、対象を母集団とした場合の考え方であった。実は、標本の場合、「分散 = 偏差の平方和 / データの個数」(母分散)、「標準偏差^2=分散」(母標準偏差^2=母分散)の式の値は、母集団の分散、標準偏差よりやや大きくなることが知られている。そこで標本の場合は「分散 = 偏差の平方和 / データの個数」の式のかわりに、「標本分散 = 偏差の平方和 / 自由度」の式を用いて分散を求める。この「自由度」という概念は少し難しいが、制限なくデータを選び得る数を意味する。標本の数がnのとき、データを選ぶ自由度はnであるが、標本の偏差は平均値の制約を受けるのでn-1となる。従って 標本分散の式の分母は、n-1である。標本標準偏差は、母標準偏差の式の定義と同じであり、「標準偏差^2=分散」(標本標準偏差^2=標本分散)となる。ここまでの計算をおさえる。ここでのポイントは、標本標準偏差と母標準偏差の使い分けへの理解と言える。自由度の考え方が加わるが、ここでは、データを得た経緯をもとに、どちらを用いるべきかを判断できるようにする必要がある。
キーワード ① 母分散 ② 母標準偏差 ③ 標本分散 ④ 標本標準偏差 ⑤ 自由度
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、標準偏差には、「母標準偏差」と「標本標準偏差」があることを理解することにある。実際に、25名のクラスで英語の試験を行ったとして、クラスを母集団とした場合の母標準偏差と、5名ごとに区切って5つの標本としてから算出(標本を母集団と仮定して母標準偏差を出してから期待値として平均)した値は、異なる。このように、数学における計算は理論をもとに構築されているため、間違った値を用いてはいけない。今回は、理論はパスするとしても、両者が存在し、使い分けなければいけないことはおさえていただきたい。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回は母分散、母標準偏差と標本分散(不偏分散)、標本標準偏差(不偏標準偏差)の違いを理解することが重要である。どちらを計算する必要があるかを判断し、正確に計算できるようにする。

【次コマの予習】
サイコロを例として、確率と確率変数が何になるのかを調べてノートにまとめる。

7 データの分布_確率 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第一部の基礎として、確率変数と確率の意味、確率密度分布と相対度数分布を学ぶ。
【教材】
(1)コマ用オリジナル資料ワード資料p. 1-2、コマ用オリジナル資料パワーポイント資料スライド1-16
(2)コマ用オリジナル資料ワード資料p. 2、コマ用オリジナル資料パワーポイント資料スライド17
(3)コマ用オリジナル資料パワーポイント資料スライド18-23

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 137-139.
(2)栗原伸一(2021)入門統計学(第2版),オーム社,P. 23-24.
(3)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 88-92.
(4)栗原伸一(2021)入門統計学(第2版),オーム社,P. 25-26.
(5)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 138-144.
(6)栗原伸一(2021)入門統計学(第2版),オーム社,P. 27-29.

【参考とコマ主題細目との対応】
主題細目① 参考(1)「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」、参考(2)「入門統計学(第2版)」
主題細目② 参考(3)「はじめての統計学」、参考(4)「入門統計学(第2版)」
主題細目③ 参考(5)「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」、参考(6)「入門統計学(第2版)」
コマ主題細目 ① 確率 ② 確率変数 ③ 確率分布
細目レベル ① まず、確率とは、ある試行の標本空間『U={e1, e2, e3, …, en}』において、e1, e2, e3, …, enのどれが起こることも同様に確からしいという前提が成立し、かつ、事象Eに含まれる要素の数がmのとき、P(E)=m/nを、事象Eの確率と定義することができる。さまざまな用語を用いたが、「サイコロを振ったときに、偶数の目が出る確率を求める」を例として説明する。「サイコロを振る」という行為は『試行』と呼ばれる。サイコロの出る目(サイコロの場合は1, 2, 3, 4, 5, 6)が『標本空間』と呼ばれる。「偶数の目がでる」ことが『事象』と呼ばれる。つまり、『試行』とは、何度でも繰り返すことができて、その結果が偶然に左右される行為のことを示す。『標本空間』とは、ある試行を行った際に起こり得るすべての結果を集めた集合のことを示す。『事象』とは、標本空間の一部であり、言い方を変えると、標本空間の部分集合のことを示す。ここでのポイントは、用語を覚えることといえる。簡単な言葉を専門用語に置き換えることは、初めて学ぶ際には難しく感じるかもしれない。しかし、これから統計学を学ぶ上で、これらの専門用語を理解し、使用できることが、先につながる勉強を進めやすくするためには必要である。
② データは実験で測定したり、調査で調べたりして数値の集まりとして得られるものだが、決まった値になるわけではなく、いつも散らばっている。例えば1 Lのガソリンで平均15 km走る車があったとする。この車である距離を何回か走り、燃費(=距離/ガソリン消費量)を測ったとする。必ず毎回15 km/Lという値になることはなく、15 km/Lの両側に測定値は散らばる(分布する)。言い換えれば、測定結果が15 km/Lとなる確率は100%ではない。ある試行の結果が x km/L であるとする。xの値は15の両側に分布する。平均値の15に近いほど回数は多く、15から離れるほど少ない。すなわち、15から離れるほど確率yが低くなる。この際に、燃費のように分析の対象となるものが「確率変数」であり、その発生する割合を「確率」と呼ぶことをおさえる。ここでのポイントは、言葉の理解である。「変数」という言葉が付加されるだけではあるが、何を意味しているかを明確にすることが必要といえる。
③ 上述のコマ主題細目①で示した燃費の話について、この様子を、x(確率変数)を横軸、yを(確率)を縦軸にしてプロットすると、釣鐘型の図を描くことができる。これは、「確率は分布する」という表現ができ、このような分布を「確率密度分布」という。データを取得する試行を何回か行うときに結果が従う確率分布を知ることが、統計の最も重要な基礎となる。サイコロを例に挙げる。サイコロを振ると、1から6の目が一つ出る。しかし、1回サイコロを振ったときにいくつの目が出るかは偶然によるので、やってみなければわからない。このように偶然が関係することを行って結果を出すことを試行と言う。1回の試行では出る目の数は偶然でそこに法則があるようには思えないが、数回、数10回、数100回と試行を繰り返すと、ある数の目がでる回数に法則があることが見えてくる。回数が十分多いと、1の出る回数も2の出る回数も6の出る回数も近い数になる。すなわち投げた回数でひとつの目が出る割合はほぼ等しいことがわかる。この割合のことを確率、それぞれの目の数のことを確率変数という。それぞれの目の出る確率は等しく、1/6であり、それら6個の確率を合計すると1になる。このように6個の確率変数の値それぞれに 1 個の確率が対応しているとき、6個の確率の集まりを確率分布という。この例の場合、すべての確率が等しい。このような確率分布を一様分布という。ここでは、「確率」、「確率変数」、「確率分布」までをおさえる。ここでのポイントは、確率が分布するといった考え方への理解といえる。試行を繰り返せば、得られる確率の数も増加する。その確率が同じ値を取ることはなく、いろいろな確率がでてくる。この状態が、「確率が分布する」と表現できる。まずは、この言葉の意味を理解する必要がある。
キーワード ① 確率変数 ② 確率 ③ 確率密度 ④ 分布 ⑤ 試行
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、「確率」が「分布する」という表現の理解といえる。授業ではサイコロの例を挙げた。それぞれの目が出る確率は1/6で、その目が出る確率はすべての目において等しく分布している。言われてみればその通りと感じていただけると思うが、このことを「確率分布」と呼ぶ。統計学が確率論と呼ばれる理由は、この確率分布を扱うためである。復習は後述の通り課題を解くこととするが、まずは、言葉を理解していただきたい。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回は確率の概念と、確率変数、確率密度、確率分布の意味を理解することが重要である。また、確率から期待値を計算できるようにする。

【次コマの予習】
エクセルのシートを開き、期待値算出のための入力箇所を確認する。

8 データの分布_期待値 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第一部の基礎として、確率変数と確率の意味、確率密度分布と相対度数分布を学ぶ。
【教材】
(1)コマ用オリジナル資料パワーポイント資料スライド24-37
(2)コマ用オリジナル資料ワード資料p. 3、コマ用オリジナル資料エクセル資料シート1-6
(3)コマ用オリジナル資料ワード資料p. 3、コマ用オリジナル資料パワーポイント資料スライド38-43、コマ用オリジナル資料エクセル資料シート1-6

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 137-139.
(2)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 138-144.
(3)栗原伸一(2021)入門統計学(第2版),オーム社,P. 27-29.

【参考とコマ主題細目との対応】
主題細目① 参考(1)「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」、
主題細目② 参考(2)「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」
主題細目③ 参考(3)「入門統計学(第2版)」
コマ主題細目 ① 期待値 ② エクセルを使った演習 ③ 期待値の演習の解説
細目レベル ① 一般的には、確率変数をX、Xのとり得る値が x1, x2, - - -, xNのN個、それぞれの確率が p1, p2, - - -, pNとすると、p1+ p2+ - - -+ pN = 1となる。この時の、1回の試行あたりXのとる値の平均値(Xの上にバー)を、確率変数の「期待値」と呼び、E (Xの上にバー)= x1 p1+ x2 p2+ - - -+ xN pN として定義される。期待値について、より身近で具体的なイメージを持ってもらうために宝くじの例を挙げる。2017年の年末ジャンボの場合、1ユニットの発行枚数は200万枚、1等の配当金は7億円、ユニットごとの本数は1、よって1等の確率変数は700,000,000、1等の確率は0.00000005となる。このように7等までを計算し、配当ごとの「確率変数×確率」を積算すると、期待値は約150となる。宝くじは1枚が300円である。すなわち、講義担当教員は、宝くじで夢を買っていると割り切って考えていることがわかる。ここでは、期待値の統計処理における意味と計算までをおさえる。ここでのポイントは、期待値を計算できることにある。計算自体は平均値と近しく、確率を用いていることがポイントといえる。計算理論をおさえ、身近な例をもとに各自が計算できるようになる必要がある。
② ここでは、第7回と第8回コマ主題細目①までの学びの確認として、エクセルを使っての演習を行う。例題として、エクセルの RANDBETWEEN関数を使って『1つのサイコロを投げる』という実験(試行)を繰り返し、確率と期待値の関係を見てみる。RAND関数は『乱数関数』と呼び、『=RAND()』 のように書く。これは0 と1 の間のすべての実数を同じ確率で発生し、指定したセルに答えを与える関数である。またサイコロのように目の出る数が整数である範囲の値をとるときには『=RANDBETWEEN(1,6)』のようにすると、この関数は1から6までの整数を同じ確率で発生してくれる。ここではRANDBETWEEN関数を使っていくつかの確率過程の試行を行い、確率関数と確率、期待値の関係を学ぶことにする。具体的な演習の内容としては、期待値の定義の式として、E (X)= x1 p1+ x2 p2+ - - -+ xN pNを用いて、サイコロを振った時に出る目の数の『理論的な期待値』を求める。次に、乱数関すを用いてサイコロを1000回振り、相対度数分布の図を描く。そして、出た目の平均値を求め、理論的な期待値と比較する。ここでのポイントは、エクセルを用いて行っている計算の意味を理解することといえる。指定された操作に対し、作業のように実施してしまうと、理解のための操作とは言い難いものになる。よって、エクセルの操作は極力単純なシートを配布するため、学生は、ここでの計算がサイコロの目の理論値と実際に試行した際の値の比較を行っていることを十分に理解し、次のコマ主題細目③の解説に繋がるように、得られた結果を吟味することが必要である。
③ まず、入力方法について解答例を示す。サイコロを1000回振るために、まず、指定された回数を示す列(1回から1000回まで連番が記入済み)の隣に、『=RANDBETWEEN(1,6)』を入力する。この際に、最上部のセルに一度入力し、以降のセルにはオートフィル機能を使って入力するとよい、ここで得られたサイコロを1000回振った場合の結果について、=COUNTIF(範囲,検索条件)を用いて、「検索条件」に各サイコロの目を指定し、1000回中の何回において指定された目が出たかを確認する。ここで得られた値が『度数』となる。この、サイコロの各目の度数を、1000回で割った値が、確率としての相対度数となる。この相対度数に、各該当する目の数を掛け算し、それの総和を取ると、実験値として期待値が求められる。この操作では、まず理論で解説した期待値の算出方法を理解しながら実施することがポイントとなる。実験値のため、各目の数の相対度数は異なっているが、およそ16%あたりで収束していることが確認できると思う。次に、理論値としての期待値を算出する。サイコロの各目の確率は一律で1/6である。よって、この確率に各該当する目の数を掛け算し、それの総和を取ると、実験値として期待値が求められる。この結果、期待値は『3.50』と確認できる。この値を、先ほどの実験値の期待値と比較する。おそらく、実験値の期待値も3.50付近にあることが確認できたであろう。ここでのポイントは、理論的な期待値が、実測値とどの程度の違いがあるのかを理解することにある。期待値とは、1回の試行で得られる値の平均値のことで、得られうるすべての値とそれが起こる確率の積を足し合わせたものである。理論的には理解できたとしても、それが事実なのかは確認してみなければ疑問が生じる。結論として、「およそ近い結果」が確認できたと思う。このように、理論を理解した上で、それが本当に起こる現象なのかを確認することで、学びの定着を図ることとする。
キーワード ① 期待値 ② エクセル ③ 相対度数 ④ 理論値 ⑤ 実験値
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、エクセルを用いて行っている計算の意味を理解することといえる。指定された操作に対し、作業のように実施してしまうと、理解のための操作とは言い難いものになる。よって、学生は、ここでの計算がサイコロの目の理論値と実際に試行した際の値の比較を行っていることを十分に理解し、得られた結果を吟味することが必要である。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回はエクセルを用いた操作によって、理論値と実験値の比較をすることが重要である。よって、期待値を計算できるようにし、また実験値での相対度数を用いて作図し、その結果を確認することする。

【次コマの予習】
コインを例にとり、表が出る確率をノートにまとめる。

9 分布の形 (1) 二項分布 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第二部の基礎として、分布の中で代表的な二項分布を学ぶ。
【教材】
(1)コマ用オリジナル資料ワード資料p. 1、コマ用オリジナル資料パワーポイント資料スライド1-8
(2)コマ用オリジナル資料ワード資料p. 2、コマ用オリジナル資料パワーポイント資料スライド9-15
(3)、コマ用オリジナル資料ワード資料p. 3、コマ用オリジナル資料パワーポイント資料スライド16-19

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 93-94.
(2)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 94-96.
(3)栗原伸一(2021)入門統計学(第2版),オーム社,P. 31-34.
(4)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 94-96.

【参考とコマ主題細目との対応】
主題細目① 参考(1)「はじめての統計学」
主題細目② 参考(2)「はじめての統計学」、参考(3)「入門統計学(第2版)」
主題細目③ 参考(4)「はじめての統計学」
コマ主題細目 ① コイントス ② 二項係数 ③ 順列
細目レベル ① 第7回講義のコマ主題細目③で、一様分布について学んだが、確率分布には他にもさまざまな分布があり得る。今回ではその中で代表的な二項分布について説明する。コイントスについて考えてみる。表の出る確率をp、裏の出る確率をqとする。特別な仕掛けのないコインであればp = q = 0.5である。仮に何か仕掛けがあった場合はp≠qとなるが、その場合でもp + q =1である。すなわち、q = 1−pはいつも成立している。このコインをn回投げた場合を考える。n回のうち、表のでた回数を確率変数Xのとる値とすると、Xの取り得る値はn + 1個あり、0, 1, 2, - - -, nである。表が出る回数をk回とすると、0 ≦ k ≦ nとして、n回のうち表がk回出る確率を求めると、P(X = k) = nCk×p^k×q^n-k となる。ここでのポイントは、コイントスを例に挙げての状況と理論をおさえることとする。特に、確率として、p + q = 1が、どのような状況においても変わらないことが特徴であることを理解することが重要である。
② コマ主題細目①のコイントスの例で示されたP(X = k) = nCk×p^k×q^n-k の式の中身を確認する。P(X = k) = nCk×p^k×q^n-k の右辺で用いられているのは、二項係数 nCkである。二項係数で表される確率分布のため、P(X = k) = nCk×p^k×q^n-k の式で表される分布を二項分布という。二項係数はnCk = n! / ((n−k)!×k!)の式で表される。ここで、n! = 1×2×3×- - -×nである。これをnの階乗と呼ぶ。nの階乗の定義はこの式であるが、n = 0のときはこの式では定義できない。ゼロの階乗は1と定義する。ここでは、二項分布の式の意味を理解するとともに、二項係数の計算方法をおさえる。また、確率として、p + q =1である。すなわち、q = 1−pはいつも成立していることを再度確認するところまでをおさえる。ここでのポイントは、主題細目①に関連するが、確率として、p + q = 1は、つまりq = 1−pであることを理解することと言える。pやqといった文字を多く使うと、余計な情報となり、理解の妨げになりかねない。よって、qをpに置き換えるにはどのように考えるべきかといった転換が必要といえる。
③ A,B,C,D,E の 5 枚のカードから3枚取り出し、横1列に並べるとき、並べ方は何通りあるかを考える。1枚目に並べるカードの選び方は、A,B,C,D,E の 5 通りある。そのそれぞれについて、2枚目に並べるカードの選び方は、1枚目に選ばなかった残りの4枚のカードの数だけあるので、4通りある。よって、1枚目、2枚目までの並べ方は、5×4 = 20(通り)となる。さらに、そのそれぞれの並べ方について、3枚目に並べるカードの選び方は1枚目、2枚目で選ばなかった残りの3枚のカードの数だけあるので、3通りある。よって、3枚を取り出し並べるときの並べ方は、5×4×3=60(通り)となる。一般にn個の区別できるものの中から、k個を取り出して順番に1列に並べたものをn個のものからk個を取り出す順列という。その順列の総数はnPk = n(n−1) (n−2)--- (n−k + 1)で表される。nPk = n! / (n−k)!と表すこともできる。ここでのポイントは、二項係数の理解を深めることにある。第10回講義のコマ主題細目①では組み合わせの説明を行うが、データをどのように扱っているかの理解をもって、順序立てて理解することが必要である。
キーワード ① コイントス ② 二項分布 ③ 二項係数 ④ 順列 ⑤ 階乗
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、二項分布もそうだが、実は「相場観」にある。例えば、コインを5回投げたとする。1回も表がでないという現象が起こる確率はいくらだろう。計算方法を学んだ学生各位ならば、0.03程度と算出できるだろう。つまり3%だが、ここで、この3%はみなさんの「予想」と比べてどう感じるだろう。だいたいこの程度と思う学生がほとんどだと思うが、それが相場観である。計算によって得た値がすべてと考えがちだが、計算間違えは誰にでも起こり得る。その際に、明らかに変な値が返ってきた際は、まず、冷静に自身の相場観とも比較してほしい。そこまで考えることで、統計処理という技術の利用価値は高まる。演習問題に取り組む際には、ぜひ意識していただきたい。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回は二項分布の概念を理解することが重要であり、二項分布に従う確率を各自で計算できるようにする。

【次コマの予習】
エクセルのシートを開き、コイントス実施のための入力箇所を確認する。

10 分布の形 (1) 二項分布_演習 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第二部の基礎として、分布の中で代表的な二項分布を学ぶ。
【教材】
(1)コマ用オリジナル資料ワード資料p. 4-6. 
(2)コマ用オリジナル資料エクセル資料シート1-3
(3)コマ用オリジナル資料エクセル資料シート1-3、コマ用オリジナル資料パワーポイント資料スライド20-43

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 94-96.
(2)栗原伸一(2021)入門統計学(第2版),オーム社,P. 31-34.

【参考とコマ主題細目との対応】
主題細目① 参考(1)「はじめての統計学」
主題細目② 参考(1)「はじめての統計学」、参考(2)「入門統計学(第2版)」
主題細目③ 参考(2)「入門統計学(第2版)」
コマ主題細目 ① 組み合わせと二項分布 ② エクセルを使った二項分布の演習 ③ 二項分布の演習の解説
細目レベル ① 第9回講義のコマ主題細目③からの続きとして、組み合わせの説明から始め、二項分布を紹介する。A,B,C,D,E の 5 個のボールから 3個取り出し、袋に入れる入れ方(組合せ)が何通りあるかを考える。もし、袋に入れるのではなく、1 列に並べるなら、その並べ方は、5P3 通りである。ところが、袋に入れると、順列では区別していた同じ組合せは、同じ入れ方として数えなければならない。つまり、5P3 =60(通り)のうち、3 個のボールの並べ方には 3P3 = 6 (通り)の同じ組み合わせがある。よって、それで割って、60÷6=10(通り)が求める組み合わせの数となる。一般にn個の区別できるものの中から、k個を取り出す(順序は考えない)ことを n 個のものから k 個とりだす組合せといい、その組合わせの総数をnCk =nPk / k! = n! / ((n−k)!×k!)) 通で表す。これが、二項係数である。以上をおさえる。ここでのポイントは、主題細目②の続きとしての、q = 1−pの考え方への理解である。起こる・起こらないの検定の場合、起こる確率をpとすれば、起こらない確率はqとおける。しかし、pやqといった文字が増えるほどに理解は困難なものとなる。この際に、すべての確率を足すと、必ず1になるといった基本的な考え方をもって臨めば、q = 1−pを導出できる。このような考え方が、ここでは必要となる。
② ここでは、第9回と第10回コマ主題細目①までの学びの確認として、エクセルを使っての演習を行う。例題として、エクセルのRANDBETWEEN関数を使って『5枚のコインを投げる』という実験(試行)を200回繰り返し、1回の試行において表がk回出る確率を確認する。まずは、二項係数の式として『nCk =nPk / k! = n! / ((n−k)!×k!))』をエクセルで入力する。ここでは、階乗(!)が多用されている。階乗は『=FACT()』のように入力する。試行において表がk回出るとしたエクセル上の列に、「0, 1, 2, 3, 4, 5」と入力しておく。これに、FACT関数を用いて二項係数の式に当てはめ、理論値として『5C0, 5C1, 5C2, 5C3, 5C4, 5C5』を計算する。次に、二項分布として『nCk×p^k×q^n-k』の式における『p^k×q^n-k』を整理する。これに、理論値としての二項係数をそれぞれ掛け算することで、理論値としての『5枚のコインを投げた際の、k回表が出る確率』が得られる。この一方で、実験値としては、RAND 関数を用いてコイントスを行う。方法として、『=RAND()』として0から1の数値を発生させ、その中で0.5以上であれば表、0.5よりも小さければ裏として関数を組むことで、コイントスを再現できる。そして、実験値より、表の出た相対度数を算出し、理論値との作図によって、理論値と実験値との比較を行う。ここでのポイントは、エクセルを用いて行っている計算の意味を理解することといえる。指定された操作に対し、作業のように実施してしまうと、理解のための操作とは言い難いものになる。よって、エクセルの操作は極力単純なシートを配布するため、学生は、ここでの計算がコイントスの理論値と実際に試行した際の値の比較を行っていることを十分に理解し、次のコマ主題細目③の解説に繋がるように、得られた結果を吟味することが必要である。
③ まず、二項分布として『nCk×p^k×q^n-k』の式における『p^k×q^n-k』を整理について、解説する。今回のコイントスの例の場合、コインの表裏のどちらかが出る確率は、同じ(0.5)である。よって、表が出る確率pと、裏が出る確率qは、同じ値を取ることできる。つまり、『p^k×q^n-k = p^k×p^n-k』となる。よって、指数の計算により、底としてpが同じ値のため、『p^n』と置き換えることができる。これにより、p^n = 0.5^5となり、『p^k×q^n-k = 0.031』となる。今回は表(p)と裏(q)の出る確率が同じ0.5であったが、ここでは、『q = 1 - p』も合わせて覚えておきたい。これは、確率は全てを足すと必ず『1』となることを示している。つまり、今回の表(p)の出る確率を、全体である『1』から引き算をすることで、裏の出る確率を求めることができる。最終的な結論として、実験値による相対度数と理論値によって作図した図を比較すると、およそ同様の形をしていることがわかると思う。ここでのポイントは、理論的な値が、実測値による相対度数とどの程度の違いがあるのかを理解することにある。相場観としても、5枚のコインによるコイントスにおいて、すべて表が出ることは珍しいと感じると思う。実際にその通りであり、数学的にも示すことが可能である。このような結果は、理論的には理解できたとしても、それが事実なのかは確認してみなければ疑問が生じる。結論として、「およそ近い結果」が確認できたと思う。このように、理論を理解した上で、それが本当に起こる現象なのかを確認することで、学びの定着を図ることとする。
キーワード ① 二項分布 ② 理論値 ③ 実験値 ④ エクセル ⑤ コイントス
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、エクセルを用いて行っている計算の意味を理解することといえる。指定された操作に対し、作業のように実施してしまうと、理解のための操作とは言い難いものになる。よって、学生は、ここでの計算がコイントスの理論値と実際に試行した際の値の比較を行っていることを十分に理解し、得られた結果を吟味することが必要である。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回はエクセルを用いた操作によって、理論値と実験値の比較をすることが重要である。よって、二項分布の計算をできるようにし、また実験値での相対度数を用いて作図し、その結果を確認することする。

【次コマの予習】
正規分布についてインターネットなどを用いて調査しておく。

11 分布の形(2)正規分布 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第二部の重要箇所として、正規分布の基本的性質を知る。
【教材】
(1)コマ用オリジナル資料ワード資料p. 1-3、コマ用オリジナル資料パワーポイント資料スライド1-12
(2)コマ用オリジナル資料ワード資料p. 4-5、コマ用オリジナル資料パワーポイント資料スライド13-16
(3)コマ用オリジナル資料パワーポイント資料スライド17-23

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 93-99.
(2)栗原伸一(2021)入門統計学(第2版),オーム社,P. 31-36.
(3)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 145-149.
(5)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 111-112.
(7)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 113-114.

【参考とコマ主題細目との対応】
主題細目① 参考(1)「はじめての統計学」、参考(2)「入門統計学(第2版)」、参考(3)「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」
主題細目② 参考(5)「はじめての統計学」
主題細目③ 参考(7)「はじめての統計学」
コマ主題細目 ① 離散型確率分布 ② 連続型確率分布 ③ 正規分布の式
細目レベル ① 今回から学ぶ正規分布は、『連続型確率分布』の代表的な例である。ここではまず、第9回と第10回講義における二項分布を、『離散型確率分布』の代表的な例としてまとめる。「事象1:Aである確率はpとする。事象2:Aでない確率は q =1−pとする。」2つの確率的事象として、起こる確率が上記のように決まっている。確率的事象のどちらが起こるかは試行(実験)を行わないと決まらない。n回の試行を行うとき、事象1が起こる場合の数は0回からn回のn + 1 通りある。n回の試行のうち、事象1が k回 起こる確率の分布が二項分布(Binominal Distribution)であり、P(X = k) = B(n, p) = nCk×p^k×q^n-k の式で表される。このように二項分布をB(n, p)と記すことがある。二項分布の期待値μ、分散σ^2は、それぞれμ= np、σ^2 = npqで表される。二項分布は期待値np付近で最大となり、期待値に関して対称な釣鐘型になる。分布の広がりは分散の平方根(標準偏差)σ=√npqで決まる。二項分布B(n, p)は代表的な離散型確率分布であり、nが大きくなると同じ期待値と分散をもつ「正規分布」に近づく。ここでのポイントは、第9回と第10回からの拡張として、『nが大きくなると同じ期待値と分散をもつ「正規分布」に近づく』という点にある。コマ主題細目②以降にも関連するが、二項分布は反復試行の成功回数を表現する上で重要な分布である一方、nが大きくなると扱いにくくなる。そこで、nが大きくなると正規分布と近似してくるという特性の有用性が高くなる。
② 正規分布(Normal Distribution) は、『連続確率分布』として、最も重要な確率密度分布である。工業製品の寸法誤差や、その検査における測定誤差も正規分布に従うことが知られている。後で学ぶ推測統計においては、母集団から抽出した標本の平均値が母平均を期待値とする正規分布に従うことが証明されている。こうしたことから、正規分布の理解は統計数学の最も重要な鍵となる課題と言える。身長、体重、農作物の収穫量、工業製品の寸法などは測定の精度さえよければ小数点以下何桁までも決められる数である。これらの分布を対象とするとき、ある1点の値を厳密に取る確率を考えることはできない。例えば、身長が「173.5 cm である確率」という表現は意味をなさず、「173.25≦身長≦173.34である確率」、というように、対象となるデータ群から注目する値の両側にある幅を持った範囲に選びだす確率、ということが意味を持つ。その点が二項分布とは異なる点である。以上をおさえる。ここでのポイントは、二項分布と正規分布の違いとして、二項分布が離散型確率分布に対し、正規分布が連続型確率分布であることを理解することとする。扱うことができるデータの性質が離散型と連続型と異なるため、どのようなデータを解析に用いるのかといったデータの性質に対する理解も必要となる。
③ 正規分布は連続型確率分布でありx: N (μ,σ^2)として示される(式はシラバスへの記載が困難なため、講義中に示す)。式におけるxは確率変数、 πは円周率、eはネイピア数である。正規分布の式は、ネイピア数を底とする指数関数である。別の形で書くとx: N (μ,σ^2)= Ae^ -BX^2である。ただし、A = 1 / (√2πσ^2)、B = 1 / (2σ^2)、X = x−μである。正規分布の式は、nが大きいとき、μ= np、σ^2= np (1−q)とおいたときの二項分布の式P(X = k) = B(n, p) = nCk×p^k×q^n-kに対応することがわかっている。正規分布の式はμとσ^2で決まるので、x: N (μ,σ^2)と書く。すなわち、B(n, p) = nCk×pk×(1−p)^n-kは正規分布の式に対応するといえる。大きな違いとして、二項分布は、k =0からk = n までのn +1個(有限個)の確率変数(整数)からなる確率密度分布であった。確率変数は連続ではなくとびとびなので、離散型確率変数のひとつである。これに対し、正規分布の確率変数xは連続的であり、xに対する関数値Nはxにおける確率密度を表す。以上をおさえる。ここでのポイントは、正規分布の式の中身の理解といえる。一見すると難解な式だが、その内容では、標準偏差と平均値が用いられている程度である。まずは、式においてどのような統計量が用いられているのかを確認することが、ここでのポイントとなる。
キーワード ① 正規分布 ② 標準偏差 ③ 面積 ④ 平均 ⑤ 釣鐘型
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、「正規分布は釣鐘型で、いろいろなところで見られる現象」ということを理解することにある。身長を考えてみればわかりやすいが、平均身長の人が多く、谷地先生は身長2 mを越す方には1度しかお会いしたことがない。このように、正規分布とはどのような分布だったかと思い出す際には、よく見られる現象で、平均が最も高い釣鐘型と思い浮かべられるようにしていただきたい。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回は正規分布の形と、正規分布の記号での示し方を覚えることを課題とする。

【次コマの予習】
エクセルのシートを開き、正規分布のための入力箇所を確認する。

12 分布の形(2)正規分布_演習 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第二部の重要箇所として、正規分布の基本的性質を知る。
【教材】
(1)コマ用オリジナル資料ワード資料p. 6-8.
(2)コマ用オリジナル資料エクセル資料シート1-4
(3)コマ用オリジナル資料ワード資料p. 6、コマ用オリジナル資料エクセル資料シート1-4、コマ用オリジナル資料パワーポイント資料スライド24-29


なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)栗原伸一(2021)入門統計学(第2版),オーム社,P. 31-36.
(2)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 23-24.
(3)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 25.
(4)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 150-152.
(5)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 26-27.

【参考とコマ主題細目との対応】
主題細目① 参考(1)「入門統計学(第2版)」参考(2)「Excelで学ぶ統計解析入門」
主題細目② 参考(3)「Excelで学ぶ統計解析入門」、参考(4)「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」、参考(5)「Excelで学ぶ統計解析入門」
主題細目③ 参考(3)「Excelで学ぶ統計解析入門」、参考(4)「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」、参考(5)「Excelで学ぶ統計解析入門」
コマ主題細目 ① 正規分布の形 ② エクセルを使った正規分布の演習 ③ 正規分布の演習の解説
細目レベル ① 正規分布は平均値であるμにピークをもち、x=μに関して対称な形をしている。μは正規分布x: N (μ,σ^2)にしたがう確率変数xの平均値、すなわちxの期待値に等しいことがわかる。一方、σ^2を大きくすると、ピークの値は下がり、分布の形は広がる。σ^2はxの散らばり具合を表し、確立変数の分散という。μとσ^2を変化させると曲線の形は変わるが、曲線とx軸で囲まれる面積は変わらず、常に1になる。以上が正規分布の式で表される正規分布の意味するところである。前述の通り、正規分布(Normal Distribution) は最も重要な確率密度分布である。工業製品の寸法誤差や、その検査における測定誤差も正規分布に従うことが知られている。ここでは、正規分布の特徴をおさえる。ここでのポイントは、正規分布が釣鐘型の分布をしていることを確認することといえる。そして、日常でのさまざまな場面でこの分布が適用されることを、例をもとに確認することで理解を確実なものにすることが必要である。
② ここでは、第11回と第12回コマ主題細目①までの学びの確認として、エクセルを使っての演習を行う。例題として、期待値(平均と同意)10、標準偏差5の正規分布を描く。正規分布をエクセルで描くためには、『=NORM.DIST (値, 平均, 標準偏差, 関数形式)』の関数を用いることになる。ここでのポイントは、エクセル関数を知ることも重要だが、関数の中身として用いられている要素が、平均と標準偏差であることといえる。つまり、すでに計算可能な代表値である。まずは、正規分布はすでに算出可能な代表値がわかってさえいれば、自由に値を得ることができることを理解することが必要である。次に、標準偏差を3あるいは8として正規分布の計算を行う。ここで得た結果をもとに、図にも結果を追加する。ここでのポイントは、標準偏差を変更した際の値の変化と、それによる図で示した際の結果の変化を、視認することといえる。数字だけを確認しても、『数値が違う』のみとしか理解できないものと思う。しかし、図に示すことで、明確に何が変化したのかが理解できる。よって学生は、ここでの複数の計算結果に対し、計算過程において何を変化させたかを理解し、次のコマ主題細目③の解説に繋がるように、得られた結果を吟味することが必要である。
③ 演習では、標準偏差を変更して、複数の正規分布の作図を行った。入力自体は困難ではなかったと思うが、結果として得られた図に注目してもらいたい。標準偏差5を今回は基準として考えると、標準偏差3(つまりバラツキが小さくなった)場合は、図が、横軸10を中心として細く高い形状を取り、標準偏差8(つまりバラツキが大きくなった)場合は、図が、横軸10を中心として太く低い形状を取ったことがわかると思う。つまり、正規分布の形を決定づけている要因は、標準偏差であることがわかる。また、形は変わっても、図の中心は変わっていないことも見て分かると思う。つまり、期待値(平均と同意)によって、図の位置が決定づけられているという特徴がある。ここでのポイントは、正規分布は、平均が中心の位置を決め、標準偏差が形の幅を決めていることを理解することと言える。作図して確認することで理解しやすかったものと思う。このように、各自で作成して、視認することで学びの定着を図ることとする。
キーワード ① 正規分布 ② エクセル ③ 標準偏差 ④ 平均 ⑤ 作図
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、エクセルを用いて行っている計算の意味を理解することといえる。指定された操作に対し、作業のように実施してしまうと、理解のための操作とは言い難いものになる。よって、学生は、ここでの計算が標準偏差を変更した際の図の形状の比較を行っていることを十分に理解し、得られた結果を吟味することが必要である。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回はエクセルを用いた操作によって、正規分布を自身で計算し、作図までを実施できることが重要である。よって、平均10、標準偏差5として正規分布を計算できるようにし、また標準偏差を変更するなどして作図し、その結果を確認することする。

【次コマの予習】
正規分布の標準化についてインターネットなどを用いて調査しておく。

13 分布の形(3)正規分布の標準化 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第二部の重要箇所として、正規分布の標準化、標準正規分布の確率密度、累積分布を学ぶ。
【教材】
(1)コマ用オリジナル資料ワード資料p. 1、コマ用オリジナル資料パワーポイント資料スライド1-11
(2)コマ用オリジナル資料パワーポイント資料スライド12-17
(3)コマ用オリジナル資料パワーポイント資料スライド18-21
なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 115-117.
(2)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 118-126.
(3)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 113-114.
(4)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 39-41.

なお、標準正規分布の確率分布表は担当教員が資料を配布する。この確率分布表は、「鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 187.」に記載されているものと同様である。

【参考とコマ主題細目との対応】
主題細目① 参考(1)「はじめての統計学」
主題細目② 参考(2)「はじめての統計学」
主題細目③ 参考(3)「はじめての統計学」、参考(4)「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」
コマ主題細目 ① 標準正規分布 ② 確率密度 ③ 累積分布
細目レベル ① 種類のデータ、身長のデータについて、例えば、A組男子とB組女子の平均値、ばらつき方の指標である標準偏差などは比較ができる。「どちらの平均値が大きい」とか、「ばらつき方はどちらが大きい」ということができる。これに対し、異なる種類のデータのばらつき方の比較や、異なる条件で取ったデータから平均値は、直接比較が困難である。ケースとして、相対的位置を調べる場合である。例えば、1学期の国語の点数と2学期の国語の点数を比較する場合、同じ点数で平均値が同じであっても、順位は異なることがある。そのような比較をする場合に分布の標準化が必要となることがある。これは、期待値を0とし、分散を1とする方法である。この標準化の方法をおさえる。ここでのポイントは、正規分布と標準正規分布の関係性を理解することといえる。標準化を行うと、すべての正規分布は標準正規分布として、期待値が0、分散が1となる。まずは、この基本部分を確実なものとする。
② 第9回の講義において、二項分布の確率は棒グラフの面積に対応していることを述べた。正規分布の与える確率とグラフ上の面積との関係は以下のようになっている。正規分布の確率密度分布曲線は釣鐘型である。サイコロやコイン投げの場合と違い、連続型分布の場合、例えば、「x = 15となる確率」と言うのは意味がない。例えば、多数のイチゴを収穫し、重量を測った時の平均値が10.0グラムであったとする。イチゴの中から目をつぶってひとつを取り出した時、15.0グラムぴったりになる、ということはない。強いて言えば確率はゼロである。「15.0±2.5グラムの範囲である確率」ということであれば意味がある。その確率は確率密度分布における面積で表される。これについて、図を確認しながら意味をおさえる。ここでのポイントは、標準化のための式の置き換えといれる。標準化の記号を『z』として表すが、その中身は『データ – 平均』を、『標準偏差』で割ったものである。ここでは、この置き換え式を覚えることが重要といえる。
③ 上述のコマ主題細目②で説明した面積を得るためには不定積分の計算が必要である。積分の計算を忠実に行うことは煩雑なので、x = −∞からx = xiまでの正規分布確率密度関数を積分してx≦xiの部分の面積を計算する「エクセル関数」を利用することが簡単である(「NORM.DIST(x, μ, σ, TRUE)」という関数で計算できる)。積分値を計算する関数は、累積分布関数と呼ばれる(式はシラバスへの記載が困難なため、講義中に示す)。要するに、「確率密度分布」と「累積密度」は同意であり、「確率密度分布」を積み上げたものが「累積密度」である。確率を面積で求めるという確率論の都合によって、異なる分布が存在しているように見えるかもしれないが、示し方の違いであることをおさえる。ここでのポイントは、卒業研究において分布を用いる際に、どちらの示し方でも対応できるようにすることといえる。例えば、環境影響の負荷について、負荷量が一定基準より低い状況の地域が占める確率のように考える際には、累積分布の使用勝手が良い。解析例は授業内で解説するため、示し方の違いと利用方法の違いについて理解することが重要である。
キーワード ① 標準正規分布 ② 確率密度 ③ 累積分布 ④ パーセント点 ⑤ 面積
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、「標準化」の理解である。結局それが何?という場合には、偏差値を思い出してほしい。高校の定期試験において、偏差値50が平均で、偏差値60を取った際には褒められはしなかっただろうか。これは、成績を標準化して10倍して50を足して算出した値である。標準化の時点で平均は0となり、最後に50を足したことで、平均点をとった場合は偏差値50となるわけだ。このようにすると、平均点が異なるさまざまな科目間においても共通の評価の指標とすることができる。このように、標準化とは確率を求めるための簡便化の手段のみならず、共通の指標を得るためにも用いることができる手法であることを覚えておいていただきたい。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回は正規分布の標準化の理解が重要となる。計算方法を覚え、各自で計算できるようにする。

【次コマの予習】
エクセルのシートを開き、正規分布の標準化における、正規分布からの変更箇所を確認する。

14 分布の形(3)正規分布の標準化_演習 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第二部の重要箇所として、正規分布の標準化、標準正規分布の確率密度、累積分布を学ぶ。
【教材】
(1)コマ用オリジナル資料ワード資料p. 2-4.
(2)コマ用オリジナル資料エクセル資料シート1-5
(3)コマ用オリジナル資料ワード資料p. 2-4、コマ用オリジナル資料エクセル資料シート1-5、コマ用オリジナル資料パワーポイント資料スライド22-33

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 39-41.
(2)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 28.
(3)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 28-29.

なお、標準正規分布の確率分布表は担当教員が資料を配布する。この確率分布表は、「鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 187.」に記載されているものと同様である。

【参考とコマ主題細目との対応】
主題細目① 参考(1)「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」参考、(2)「Excelで学ぶ統計解析入門」
主題細目② 参考(3)「Excelで学ぶ統計解析入門」
主題細目③ 参考(3)「Excelで学ぶ統計解析入門」
コマ主題細目 ① 標準正規分布表 ② エクセルを使った標準正規分布の演習 ③ 標準正規分布の演習の解説
細目レベル ① 正規分布しているデータを標準化する際には、z = (x−μ)/σで計算できる。例えば、A組の学生の身長 (x)は、平均160 cm (μ) 、標準偏差10 cm (σ)の正規分布をするとする。この分布において身長が180 cm以下である確率はいくらかを求めようとした場合、PCを用いなくとも、暗算程度の計算と、標準正規分布表によって確率を求めることができる。つまり、P (z ≦ (180 – 160)/10)となり、P (z ≦ 2)となる。この状態から、標準正規分布表を用いて、z ≦ 2を読み取ればよい。つまり、0.9772となる。ここでのポイントは、標準正規分布表の読み取り間違えを起こさないように、データをよく理解することと言える。標準正規分布表の場合、z ≦ Aとz ≧ Aの表がある。不等号の向きで間違えることはないが、稀に読み間違えることもある。しかし、その際にも、冷静に問題を確認することで、誤解答を防ぐことができる。今回の例題の場合でみると、身長について平均160 cm、標準偏差 10 cmの集団にあって、180 cm以下である確率は、おおよそ大きな確率であると予想できるだろう。このように、常に問題にも意識して、得られた結果が適切なものかを考えることも必要である。
② ここでは、第13回と第14回コマ主題細目①までの学びの確認として、エクセルを使っての演習を行う。例題として、期待値10、標準偏差5の正規分布を標準化し、標準正規分布を描くとする。ここまでの知識を動員すると、使えるエクセル関数としては、『= NORMDIST(x, 平均, 標準偏差, FALSE)』がある。ここで注意したいことは、この関数は正規分布を計算する際に用いた関数である。つまり、標準正規分布として使う際には、事前にxを標準化した後に、平均と標準偏差を標準正規分布に合わせた(つまり標準化)しておく必要がある。ここでのポイントは、エクセルを用いて行っている計算の意味を理解することといえる。指定された操作に対し、作業のように実施してしまうと、理解のための操作とは言い難いものになる。よって、エクセルの操作は極力単純なシートを配布するため、学生は、ここでの正規分布の関数において、どの値を変更すると『標準化』となるかを理解し、次のコマ主題細目③の解説に繋がるように、得られた結果を吟味することが必要である。
③ 今回の演習では、データを標準化した後に、正規分布のエクセル関数である『= NORMDIST(x, 平均, 標準偏差, FALSE)』を用いて、標準正規分布とするところまでが問われた。まず、データの標準化においては、『データ – 平均』を、『標準偏差』で割ったものとして計算する。これが『z』として『x』の代わりに置かれる。次に、平均と標準偏差だが、これらは第13回講義で説明した通り、平均は0、標準偏差は1となる。つまり、ここまでをまとめると、エクセル関数においても『= NORMDIST(z, 0, 1, FALSE)』として入力することで、標準正規分布として計算することが可能となる。なお、ここまでの操作を用いると、標準正規分布表をエクセルで作成することも容易である。ここでのポイントは、標準化の意味の理解といえる。エクセルでの入力操作自体は資料を参考にしながらでも入力できるが、『標準化』した数値の入力については、標準化への理解が必要である。よって、エクセル操作への慣れと同時に、何を行っているかを常に意識しながら操作することが必要である。
キーワード ① 標準化 ② エクセル ③ 期待値 ④ 標準偏差 ⑤ 標準正規分布表
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、エクセルを用いて行っている計算の意味を理解することといえる。指定された操作に対し、作業のように実施してしまうと、理解のための操作とは言い難いものになる。よって、学生は、ここでの計算として用いられたエクセル関数が正規分布と同じでものあることを理解したうえで、どこを変更して標準正規分布として結果を得られたかを十分に確認することが必要である。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回は正規分布の標準化の理解が重要となる。計算方法を覚え、各自でエクセルを用いて計算できるようにする。

【次コマの予習】
第三部の推計統計に入る。全数調査と標本調査の違いについてノートにまとめる。

15 推計統計学_概要 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第三部の基礎として、全数調査と標本調査の違いを学
【教材】
(1)コマ用オリジナル資料ワード資料p. 1-2
(2)コマ用オリジナル資料パワーポイント資料スライド1-27
(3)コマ用オリジナル資料パワーポイント資料スライド28-33

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)栗原伸一・丸山敦史(2017)統計学図鑑,オーム社,P4, 42-57.
(2)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 164-168.
(3)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 169-173.

なお、標準正規分布の確率分布表は担当教員が資料を配布する。この確率分布表は、「鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 187.」に記載されているものと同様である。

【参考とコマ主題細目との対応】
主題細目① 参考(1)「統計学図鑑」
主題細目② 参考(2)「日本統計学会公式認定 統計検定3級対応 データの分析」
主題細目③ 参考(3)「日本統計学会公式認定 統計検定3級対応 データの分析」
コマ主題細目 ① 記述統計学 ② 推計統計学 ③ 全数調査と標本調査
細目レベル ① ここまでの学びでは、記述統計学と推計統計学のどちらでも利用できる統計学での計算などに重きをおいて展開してきた。第15回以降の講義では、推計統計学に特に重点を置いた展開となる。そのため、まずはここまでの確認として、記述統計学についての確認を行う。記述統計学では、『あるデータに対して、そのデータの特徴をより分かりやすく表現する』ということが行われる。具体的には、ある2つのクラス(AとB)において、身長やテストの点数分布があったとする。どちらのクラスの身長が高いのか、テストの点数が高いのかを考える際に、『平均値』という指標が導入される。これを用いると単純な比較が可能となる。このように、『あるデータに対して、そのデータの特徴をより分かりやすく表現する』ことが、記述統計学の目的となる。また、図や表を作成して、データの特徴を可視化することも記述統計学の範疇となる。しかし、対象が『日本人全体の』であったり、データが『これから得られるデータ』を対象とした場合のように、現時点でデータを得られない状況では分析できないといった点が、記述統計学の限界となる。ここでのポイントは、記述統計学の有用性を理解すると同時に、その手法における限界を理解することといえる。つまり、記述統計学は、現状で得られていないデータについては、分析や推測ができないといったことが、手法としての限界といえる。
② 推計統計学とは、限られた標本から調査したい母集団全体の特徴を推測するという学問である。推計統計学では、集められたデータは大きな母集団の中の小さな標本に過ぎないと考える。しかし、本質的に知りたいことは母集団の情報である。そのため、標本から母集団を推測することになる。例えば、10 haの畑からイモを掘り出すとする。すべてのイモを残らず掘り出すことはよほどの努力があっても不可能に近い。しかし、その畑のイモの大きさを知ることで、今年の売り上げを考える必要に迫られることもある。その場合、いくつかのイモ(標本)を掘り出し(標本抽出)、その標本をもとに、畑のイモの大きさを予測することになる。このような作業が、推計統計学であることをおさえる。ここでのポイントは、推計統計学はデータの一部を用いて推計する方法であることを理解することとする。そして、卒業研究では、主に推計統計を扱うことも併せて確認する。
③ 国勢調査のように、日本国内に住むすべての人を対象とする調査、集団全体を対象とする調査を全数調査という。これに対し、集団から一部を抜き出して行う調査を標本調査という。一般に、対象とする集団全体を母集団、母集団から抽出された集まりを標本、標本を抜き出すことを標本抽出という。母集団には平均、分散、標準偏差などがひとつ存在するが、これらそれぞれを母平均、母分散、母標準偏差と呼ぶ。また母集団全体の特徴を現す数値、例えば内閣支持率のような数値を母数という。これらの数値は必ず存在するが、母集団の全数調査を行わない限り、それらの正確な値を知ることはできない。その様な場合に、母集団から無作為に抽出した標本を調べることにより、それらのおおよその数値を推定することができる。ここでのポイントは、母集団と標本の関係として、標本平均値の平均は母集団の平均値と等しく、分散は異なるといった特性があることを理解することとする。
キーワード ① 推計統計 ② 母集団 ③ 母数 ④ 全数調査 ⑤ 標本調査
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、「推測する」という言葉への理解といえる。推測というと、「未来」を予言するようなイメージを持つかもしれない。そうではなく、ここでは「未知のデータ」を考えることを意味している。例えば、谷地先生は、日本全国の河川を対象に農薬濃度の変化を研究している。しかし、谷地先生は全国の河川水調査に出掛けているわけではなく、「推測」している。つまり、実データを持っているわけではなく、手持ちのデータを最大限に活かしているのだ。今回の授業でも、標本から母集団を推測したが、同じことといえるだろう。このように、今回学んだ技術や考え方は、今後の卒業研究でも活かされる。ぜひ、楽しみにしつつ、現段階の復習では、言葉の意味と、何をしているのかという点をおさえていただきたい。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回は推計統計学の概念として、標本から母集団を推測するということの理解が重要となる。

【次コマの予習】
エクセルのシートを開き、データの確認と、簡単な平均値の計算まで実施する。

16 推計統計学_平均と分散 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第三部の基礎として、全数調査と標本調査の違いを学ぶ。
【教材】
(1)コマ用オリジナル資料ワード資料p. 3-4.
(2)コマ用オリジナル資料エクセル資料シート1-3、コマ用オリジナル資料パワーポイント資料スライド34-36
(3)コマ用オリジナル資料パワーポイント資料スライド37-50

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)石井俊全(2012)まずはこの一冊から 意味がわかる統計学,ベレ出版,P88-90.
(2)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 164-168.
(3)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 169-173.

なお、標準正規分布の確率分布表は担当教員が資料を配布する。この確率分布表は、「鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 187.」に記載されているものと同様である。

【参考とコマ主題細目との対応】
主題細目① 参考(1)「意味がわかる統計学」
主題細目② 参考(2)「日本統計学会公式認定 統計検定3級対応 データの分析」
主題細目③ 参考(3)「日本統計学会公式認定 統計検定3級対応 データの分析」
コマ主題細目 ① 推定の理論 ② 標本平均値の平均 ③ 標本平均値の分散
細目レベル ① ある集団からn個のメンバーを抽出し、標本を作るものとする。このときのnを標本の大きさという。同じ大きさnの標本でも、何通りでも抽出の仕方はあるので、標本同士が互いに同じ値、例えば平均値を持つとは限らない。無作為抽出であれば、どのような値になるかはまったくの偶然である。その意味で、標本調査は「試行」と考えることができる。標本調査を行って始めてn個のメンバーの値が確定するので、それらの値は確率変数である。n個のメンバーを、X1, X2, X3,---, Xnとすると、これらは互いに独立であり、同じ母集団に属していたので母集団と同じ確率分布に従うはずである。例えば、母集団が期待値μ、分散σ2の正規分布x: N(μ: σ^2)に従うとき、X1, X2, X3,---, Xnも同じx: N(μ: σ^2)に従い、これらの確率変数の期待値はμ、分散はσ^2にそれぞれ等しい。従ってX1, X2, X3,---, Xnを調べることにより、母平均等の母数を推測できると考えられる。ここでのポイントは、母集団と標本の関係として、標本は母集団から抽出されたものであることを再度確認することといえる。つまり、標本は複数採取しても、同じ母集団から採取したものであれば、その標本の確率分布は母集団の確率分布に従うはずである。
② 具体的な母集団の例として5人の身長(cm)からなる小さな母集団を取り上げて説明する。例えば、174 cm、166 cm、168 cm、177 cm、170 cmだったとする。ここでの5人の平均身長は、(174+166+168+177+170)/5のため、171.0 cmとなる。この、171.0 cmは母集団の平均値であるため、母平均(μ)となる。次に、この母集団の分散(母分散:σ^2)は、((174−171.0)^2+(166−171.0)^2+(168−171.0)^2+(177−171.0)^2+(170−171.0)^2)/5のため、16.0となる。上記の身長の母集団について、ここで母集団から大きさ2の標本を取り出してみる。5人の身長から1人の身長を取り出す方法は5通りで、これを2回繰り返すわけだから、全部で5^2 = 25通りある。抜き出した25個の標本についてそれぞれの平均を計算し、標本平均値として示す。その結果、標本平均値の平均(Xの上にバー)を計算すると171.0 cmであり、母集団の平均値(μ)に等しいことがわかる。ここでの解説としては、第8回授業における期待値が関係してくる。まず、状況として、未知の母平均μを標本平均(Xの上にバー)で推定するとした場合、標本平均(Xの上にバー)の値がどの程度になるのか(期待できるか)を考えることになる。標本平均(Xの上にバー)は、期待値(Eをおく)として捉えられ、E(Xの上にバー) = (E(x1)+E(x2)+...+E(xn))/nとして求められる。ここに、調査対象となる標本の身長を調べると値はいくつになると期待できるかを考えると、その人は母集団分布(母平均μ、母分散σ^2)に従うため、x1 はμ(期待値である母平均)になると期待できる。つまり、E(x1) はμに等しい。同様に、x2はμになると期待できる。つまり、E(x2) もμに等しい。以下すべて同様で、結論として、標本平均の平均 E(Xの上にバー)は未知の母平均μに一致する。つまり、標本平均(Xの上にバー)は、未知の母平均μに一致すると期待できる。すなわち、標本平均(Xの上にバー)はμに一致するという結果が得られることになる。ここでのポイントは、標本平均値の平均の特徴として、母平均に一致するといった特徴((Xの上にバー)=μ)を理解し、この特徴を覚えることが重要である。
③ コマ主題細目②からの続きとして、5人の身長(cm)からなる小さな母集団を取り上げて説明する。すでに得られている25個の標本平均値を用いて、標本分散(s^2)を計算する。標本平均値の平均との差をそれぞれ二乗し、合計を25で割る。結果は s^2= 8.0 となる。この値は母分散(σ^2)= 16.0 の1/2 になる。つまり、母集団の身長の散らばり具合に比べ、標本ごとに求めた2人の身長の標本平均値の散らばり具合は小さいことがわかる。一般に、母集団の全数調査ができていない場合についても、その母集団からn個の標本を無作為抽出した標本平均値の分散(s^2)は母分散(σ^2)の1/nとなることがわかっている。すなわち、s^2 = (σ^2)/nとなる。なお、この特徴は、計測関連の企業において応用されている。具体的には、2つの測定器AとB(より高精度)があり、両機器の繰返し性を評価した場合に、測定器Bと同等の繰返し性を得るためには何回の測定を行うべきかといった評価において用いられる。例えば、繰返し性を標準偏差として考えて、測定器Aの繰り返し性が測定器Bの4倍であった場合、σBを基準(母集団の標準偏差)として考えると、σAは標本標準偏差として考えられる。ここで、標本平均の分布の特性として、上述の平方根をとった『標本標準偏差は、母標準偏差の1/√nに等しい』が用いられる。まとめると、σA = (1/√n)×σBとなり、つまり、1/4×σB = (1/√n)×σBとなる。よって、n = 16となり、16回の測定が必要とわかる。ここでのポイントは、標本平均値の平均と分散について、母集団との関連性を理解することと同時に、社会的な利用もおさえることといえる。統計学は、データの分析で用いられる他、測定現場での機器補正などにも応用されている。ここでの学びを、大学での授業だけに留めず、さらに今後の進路として社会に出てからも有用であることを意識することが必要である。
キーワード ① 期待値 ② 標本平均 ③ 母平均 ④ 標本標準偏差 ⑤ 母標準偏差
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、標本平均値の平均と分散の、母集団との関係の理解である。平均は標本と母集団で一致するが、分散は標本分散が母分散の1/nとなる。この理解が進むと、例えば計測器の精度についても考えることが可能となる。このように、今回学んだ技術や考え方は、今後の卒業研究でも活かされる。ぜひ、楽しみにしつつ、現段階の復習では、言葉の意味と、何をしているのかという点をおさえていただきたい。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回は推計統計学における平均と標準偏差の特性として、両者の関係の理解が重要となる。

【次コマの予習】
正規分布の標準化について、復習しておく。

17 母平均の推定(1)基礎 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第三部の基礎として、標本分散と母分散の関係を学ぶ。
【教材】
(1)コマ用オリジナル資料ワード資料p. 1-2
(2)コマ用オリジナル資料ワード資料p. 1-2、コマ用オリジナル資料パワーポイント資料スライド1-7
(3)コマ用オリジナル資料ワード資料p. 3-5、コマ用オリジナル資料パワーポイント資料スライド8-12

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 139-144.
(2)栗原伸一(2021)入門統計学(第2版),オーム社,P. 69-70.
(3)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 145-154.

なお、標準正規分布の確率分布表は担当教員が資料を配布する。この確率分布表は、「鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 187.」に記載されているものと同様である。

【参考とコマ主題細目との対応】
主題細目① 参考(1)「はじめての統計学」
主題細目② 参考(2)「入門統計学(第2版)」
主題細目③ 参考(3)「はじめての統計学」
コマ主題細目 ① 大数の法則 ② 中心極限定理 ③ 母平均区間推定の考え方
細目レベル ① ここでは、第三部として始まった「推計統計学の理解として、母平均の推定について学ぶ」における基本となる考え方として、大数の法則をおさえる。基礎母平均μ、母標準偏差σの正規分布をする母集団からn個の標本を無作為抽出するとき、標本の平均(Xの上にバー)は、母平均μ、標本標準偏差sはσ/√nに近い値の正規分布になることを学んだ。σ/√nはnが大きいほど小さくなる。したがって、標本平均はnが大きくなるほど母平均に近づくことになる。これを大数の法則という。具体的には、母集団から無作為に標本を抽出して平均値を求めるということを繰り返したとしても、標本平均(Xの上にバー)は母集団の平均(母平均:μ)に一致することはない。どの標本平均も、母平均のあたりを中心としたある程度のばらつきをもって分布する。この分布を平均についての『標本分布』呼ぶ。この標本分布の特性を利用すると、母平均を推測できる。標本分布の一つである大数の法則では、例えばサイコロの例を思い出すとわかりやすい。第8回講義においてサイコロの期待値を求めた際に、3.5となることを学んだ。演習において1000回のサイコロを振ったが、200回振った時よりも、1000回振った方が3.5あたりに値が収束したことを確認した。つまり、サイコロを振る回数を増やすほど各目の出る回数は1/6に近づくため、出る目の平均は3.5に近づく。ここでのポイントは、大数の法則は、母平均のある集団から標本を抽出する場合、サンプルサイズが大きくなるにつれて、標本平均(Xの上にバー)は母集団の平均(母平均:μ)に近づくという特徴を、以前の授業資料も参考にしながら理解することと言える。すなわち、大数の法則をもとに考えると、母集団から抽出された標本から母平均を推測する場合には、サンプルサイズが大きくなるほどより正確に母平均を推測できるということが分かる。
② 中心極限定理とは、母集団が正規分布に限らずどんな分布をしていても、標本の数nが十分に大きければ、標本平均の分布(Xの上にバー)は、『平均がμ、分散がσ^2/n(つまり、標準偏差はσ/√n)の正規分布N (μ, σ^2/n)に近づく』というものである。中心極限定理をもとに考えると、サンプルサイズが大きいほど標本平均の分布における平均は母平均(μ)に、標本平均の分布における標本分散は母分散(σ^2)の1/n倍の値に近づく。これは、サンプルサイズが大きいほどその標本平均のばらつきが小さくなり、標本平均が母平均のより近くに集まることを表している。つまり、母平均をより正確に推測できることを表している。コマ主題細目①の大数の法則と、ここで学んだ中心極限定理が、標本平均から母平均を推定する根拠となっている。ここでのポイントは、大数の法則と中心極定理をもとにした母平均推定の理解である。例えば、1 個のサイコロを振った時の目の数1~6を確率変数Xにとると、Xは確率1/6の一様分布となる。次に20回サイコロを振ってこの確率変数の平均値を求めると、それは期待値3.5に近い値となる。20回サイコロを振るという試行を繰り返すと、1試行ごとの目の数の平均値は期待値3.5を中心に分布する。分散は定義に従って計算され、2.926 - - -、標準偏差はその平方根で 1.7078 - - - となる。従って20回振って得る標本平均値の標準偏差は~1.7078/20となる。これを理論値と20回振る試行1万回の統計を取ってグラフにすると、一様分布の確率変数の平均値の分布が正規分布になっていることが確認できる。このように、実験例も交えながら、基本となる法則や定理を理解することが必要となる。
③ 第6回の講義において、例えば、身長が「173.5 cm である確率」という表現は意味をなさず、「173.25≦身長≦173.34である確率」、というように、対象となるデータ群から注目する値の両側にある幅を持った範囲に選びだす確率、ということが意味を持つことを学んだ。母平均区間推定でも同様に、母集団からn個のデータを無作為に抽出した標本の平均値が(Xの上にバー)のとき、「母平均 は(100×β%の信頼度で (Xの上にバー)−a×(σ/ √n)≦μ≦ (Xの上にバー)+ a×(σ/ √n)の区間にある」のように(Xの上にバー)± a×(σ/ √n)の区間を指定するのが母平均の区間推定と呼ばれる考え方、方法である。この時、a = 1.96がよく用いられる。このaの値は、母平均値推定の信頼度(確からしさ) に依存して決まる。例えば、信頼度βを 0.95 (95%) とした場合、a = 1.96になるということである。信頼度βを1から引いたa = 1−βを危険率と呼ぶ。ここでのポイントは、母平均は、『標本平均± 1.96×推定母標準偏差 / √データ個数』の区間にある。と考えると95%正しい(間違っている確率が5%)という考え方であることを理解することとする。
キーワード ① 標本分布 ② 母平均 ③ 大数の法則 ④ 中心極限定理 ⑤ 区間推定
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、「95%信頼区間」という考え方の理解といえる。間違えないようにしたいのが、「母平均は標本平均±σ/√nの区間にある」ということが95%正しいという考え方である。信頼度95%と信頼度68%を比べた際に、68%の方が信頼度は低いだろう。これは、「〇〇ということが68%正しい」という解釈になる。復習としての課題は計算問題に挑戦してもらうが、まずは、この考え方を理解した上で復習課題に取り組んでいただきたい。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回は区間推定の理解が重要となる。計算方法を覚え、各自で計算できるようになることを課題とする。

【次コマの予習】
エクセルのシートを開き、データの確認と、標準正規分布表の使い方について確認しておく。

18 母平均の推定(1)基礎_演習 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第三部の基礎として、標本分散と母分散の関係を学ぶ。
【教材】
(1)コマ用オリジナル資料ワード資料p. 6、コマ用オリジナル資料パワーポイント資料スライド13-30
(2)コマ用オリジナル資料ワード資料p. 7-8、コマ用オリジナル資料エクセル資料シート1-9
(3)コマ用オリジナル資料ワード資料p. 7-8、コマ用オリジナル資料エクセル資料シート1-9、コマ用オリジナル資料パワーポイント資料スライド31-42

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 145-154.
(2)栗原伸一(2021)入門統計学(第2版),オーム社,P. 69-70.
(3)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 164-168.
(4)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 174-182.

なお、標準正規分布の確率分布表は担当教員が資料を配布する。この確率分布表は、「鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 187.」に記載されているものと同様である。

【参考とコマ主題細目との対応】
主題細目① 参考(1)「はじめての統計学」、参考(2)「入門統計学(第2版)」
主題細目② 参考(3)「日本統計学会公式認定 統計検定3級対応 データの分析」
主題細目③ 参考(4)「日本統計学会公式認定 統計検定3級対応 データの分析」
コマ主題細目 ① 95パーセント信頼区間 ② エクセルを使った区間推定の演習 ③ 区間推定の演習の解説
細目レベル ① 上述のコマ主題細目②において、区間推定の基本的な考え方を述べたが、一つ問題がある。それは母分散、母標準偏差は通常わからないということである。すなわち、「母平均 は(100×β%の信頼度で(Xの上にバー)−a×(σ/ √n)≦μ≦ (Xの上にバー)+ a×(σ/ √n)の区間にある」という式において、σが不明であると区間の幅は求めることができない。そこでσのかわりに標本の標準偏差sを代用することになる。すなわち、正規分布を標準化して得られる標準正規分布を用いることになる。方法として、z = ((Xの上にバー)−μ) / σ√nを求め、zが標準正規分布に従うものとすると、95%に対する パーセント点は±1.96となり、−1.96≦((Xの上にバー)−μ) / σ√n≦1.96とし、すなわち、(Xの上にバー)−1.96×σ√n≦μ≦(Xの上にバー)+1.96×σ√nとなる。このようにして得られた母平均の存在区間を「95パーセント信頼区間」と呼ぶ。ここでのポイントは、『信頼度』と『危険率』の考え方となる。危険率は、信頼度を1から引いた値である。つまり、仮説として母平均の区間を挙げた際に、それが間違っている確率となる。この信頼度と危険率の用語はセットで覚えることとする。
② ここでは、第17回と第18回コマ主題細目①までの学びの確認として、Excelを使っての演習を行う。例題として、畑Aにおいて栽培している芋の重さを、95%信頼区間として重量の範囲を求めることとする。なお、この畑Aは、事前調査によって、収穫される芋の重量の標準偏差は15 gとすでにわかっているものとする。この畑Aから5個の芋を採取(標本抽出)したところ、平均は300.2 gだったとする。このような場合、コマ主題細目①で示した「母平均 は(100×β%の信頼度で (Xの上にバー)−a×(σ/ √n)≦μ≦(Xの上にバー)+ a×(σ/ √n)の区間にある」を思い返して、入力を進めれば良い。つまり、必要な情報は、信頼度95%の定数(z)、標本平均(Xの上にバー)、母標準偏差(σ)、標本サイズ(n)である。ここでのポイントは、『95%信頼区間として重量の範囲を求める』としている点にある。つまり、小さいサイズと大きいサイズによる範囲が存在していることを見抜くことといえる。その結果、危険率は0.05/2として、0.025となる。つまり、信頼度95%の定数(z)は、0.025として考えることになる。この変換についても、設問から間違えずに読み取って計算できることが重要である。
③ 解答を導くために、ひとつひとつの情報を埋めていくこととする。信頼度95%の定数(z)は、両側で考えるため0.025とし、その確率に該当する値を標準正規分布表で探す。つまり、1.96となる。次に、標本平均(Xの上にバー)は設問中にある300.2とする。母標準偏差(σ)も設問中にある15となる。標本サイズ(n)は、5個の芋を採取とあるため、5となる。この情報をもとに、母平均の下方信頼限界では(Xの上にバー)−z×(σ/ √n)として算出(287.1)し、母平均の上方信頼限界では(Xの上にバー)+z×(σ/ √n)として算出(313.3)する。この結果より、畑Aにおける栽培している芋の重さは、95%信頼区間のもと、287.1 gから313.3 gと推定することができる。ここでのポイントは、計算に用いる値と専門用語への理解と言える。式の中にもあるが、母標準偏差(σ)や標本平均(Xの上にバー)など、様々な用語と、それが示す値が登場する。ここまでの授業において、これら専門用語の理解が不十分であると、計算式がわかっていたとしても、計算に用いる値が判断できない。式の理解も重要であるが、今一度、専門用語の理解も確認することが今後の展開のためにも大切である。
キーワード ① 標本分散 ② 母分散 ③ 自由度 ④ 区間推定 ⑤ 95パーセント信頼区間
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、エクセルを用いて行っている計算の意味を理解することといえる。指定された操作に対し、作業のように実施してしまうと、理解のための操作とは言い難いものになる。よって、学生は、区間推定として問われている範囲がどのような設定になっているかを自身でよく確認し、計算を実施することが大切である。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回はエクセルを用いた操作によって、区間推定を完了することが大切である。よって、エクセルを用いて正しく計算できるようにし、結論を文章で説明するところまで確認することする。

【次コマの予習】
母分散が分かっている状況はあり得るのかについて疑問をもち、検討する。

19 母平均の推定(2)t分布 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第三部の重要箇所として、t分布について学ぶ。
【教材】
(1)コマ用オリジナル資料ワード資料p. 1、コマ用オリジナル資料パワーポイント資料スライド1-25
(2)コマ用オリジナル資料パワーポイント資料スライド26-29
(3)コマ用オリジナル資料パワーポイント資料スライド30-33

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 155-156.
(2)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 157-158.
(3)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 159-161.

なお、t分布の確率分布表は担当教員が資料を配布する。この確率分布表は、「鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 169.」に記載されているものと同様である。

【参考とコマ主題細目との対応】
主題細目① 参考(1)「はじめての統計学」
主題細目② 参考(2)「はじめての統計学」
主題細目③ 参考(3)「はじめての統計学」
コマ主題細目 ① t分布の特徴 ② 正規分布との関係 ③ t分布を用いた母平均区間推定の手順
細目レベル ① これまでに学んだ正規分布の標準化では、「(Xの上にバー)– μによって、平均がμから0 に移動する」、「(Xの上にバー) – μをσで割ると、標準偏差はσ分の1に縮まる」、つまり、「標準偏差は1になる」ということを学んだ。t分布はzの分布(標準正規分布)に似ている。形は釣鐘型で、平均 (μ)が0である。異なる点として、標準正規分布は自由度が変わっても形が変わらないが、t分布は自由度が変わると形が変わる。自由度が小さいと広がりが大きくなるという特徴がある。また、自由度が30以上でほぼ正規分布になる。t分布の分散は、σ^2 = m / (m−2)で求められる。つまり、t分布の標準偏差は、σ = √(𝑚 / (𝑚−2))となる。ここで、mは自由度を示し、m = n−1によって求められる。ここでのポイントは、まずはt分布を概観することといえる。主題細目②で触れるが、分布型は正規分布に近いことがわかる。大きな違いは、用いるデータが母標準偏差か、標本標準偏差かといった点にある。この箇所を、式をもとに理解することが大事である。
② これまでに、母分散(母標準偏差)が既知の場合に、標本平均から母平均の区間推定を行う方法と手順を説明した。しかし、一般には母分散σ^2(母標準偏差σ)は既知ではない。そこで標本から得られる標本分散s^2(標本標準偏差s)を使って母平均μを求めることにする。これまで見てきた通り、z = ((Xの上にバー)−μ) / σ√nの確率変数zは標準正規分布に従う。このσを標本標準偏差sに置き換えると新しい確率変数が得られるが、これをTとする。つまり、T = ((Xの上にバー)−μ) / s / √nとなる。この変数の分布は正規分布ではなく「t分布」に従うことがわかっている。この式から分かる通り、正規分布とt分布はよく似ている。この回では、両者の使い分けも含めて、t分布についておさえる。ここでのポイントは、t分布の使い方への理解といえる。一般的に、母平均が不明で、母標準偏差は既知といった状況は少ない。標本について、標本平均と標本標準偏差がわかっているため、その状態から母集団を推定したいと考えることが一般的である。使い勝手の良い分布型として理解することとする。
③ t分布を用いて母平均の区間推定を行う方法、手順は以下のようになる。1. 標本数n、標本平均(Xの上にバー)、標本標準偏差sを求め、T = ((Xの上にバー)−μ) / s / √nの確率変数を考える。2. 危険率a、あるいは信頼度1−aを選ぶ。ここで、Tはt分布に従うので、自由度n−1のt分布に対する信頼度100×(1−a) のパーセント点を求める。3. 不等式を変形し、区間推定を行う。つまり、−a ≦((Xの上にバー)−μ) / s√n≦ aを、(Xの上にバー)−a×(s / √n)≦μ≦ (Xの上にバー)+ a×(s / √n)とする。この時、s / √nは、標準誤差(se)と呼ばれる。これを使い、(Xの上にバー)−a×(se)≦μ≦ (Xの上にバー)+ a×(se)とする。このようにして、t分布を使って母平均の「95パーセント信頼区間」などを求められる。次回では、この計算の一連の流れを、練習問題を通して身につけることする。今回でのポイントは、分布を使った解析における使い分けへの理解といえる。t分布は使い勝手が良い。しかし、サンプルサイズが大きくなった際には標準正規分布を使用することになる。このような使い分けを間違いなく実施できるようになる必要がある。
キーワード ① t値の定義 ② 大標本 ③ 小標本 ④ t分布 ⑤ 自由度
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、「t分布」の使用場面への理解といえる。標準正規分布からも母平均は推測できるが、集団の母平均を区間推定する際に、母分散が分かっているケースはあまり考えられない。つまり、標本平均から推測できるt分布の方が、使用場面は多いだろう。復習課題としては問題演習を解いていただくとして、今後の卒業研究での利用場面を考えた際に、t分布は使い勝手がよい分布ということを理解していただきたい。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回は t 分布の理解が重要となる。標準正規分布との計算方法や使用場面の違いを説明できるようになることを課題とする。

【次コマの予習】
エクセルのシートを開き、データの確認と、t分布表の使い方について確認しておく。また、事前に配布しているワード資料5ページより、『T.INV関数』の使い方を確認しておく。

20 母平均の推定(2)t分布_演習 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第三部の重要箇所として、t分布について学ぶ。
【教材】
(1)コマ用オリジナル資料ワード資料p. 2-5、コマ用オリジナル資料エクセル資料シート1-3
(2)コマ用オリジナル資料ワード資料p. 2-5、コマ用オリジナル資料エクセル資料シート1-3、コマ用オリジナル資料パワーポイント資料スライド34-41
(3)コマ用オリジナル資料ワード資料p. 6、コマ用オリジナル資料エクセル資料シート4.

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 114-119.
(2)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 120-123.
(3)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 124-127.

なお、t分布の確率分布表は担当教員が資料を配布する。この確率分布表は、「鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 169.」に記載されているものと同様である。

【参考とコマ主題細目との対応】
主題細目① 参考(1)「Excelで学ぶ統計解析入門」、参考(2)「Excelで学ぶ統計解析入門」
主題細目② 参考(1)「Excelで学ぶ統計解析入門」、参考(2)「Excelで学ぶ統計解析入門」
主題細目③ 参考(3)「Excelで学ぶ統計解析入門」
コマ主題細目 ① エクセルを使ったt分布の演習 ② t分布の演習の解説 ③ t分布表とエクセル関数
細目レベル ① ここでは、第19回までの学びの確認として、Excelを使っての演習を行う。例題として、畑Aにおいて栽培している芋の重さの母平均を、95%信頼区間のもとでの区間推定するものとする。なお、事前情報として、この畑Aから10個の芋を採取(標本抽出)したところ、平均は301.8 gだったとする。そして、標本標準偏差は2.773だったとする。このような場合、第19回講義資料のコマ主題細目③で示した手順に沿って、情報を整理しながら計算することになる。まず、母標準偏差が不明であり、標本数nは10と少ないことから、t分布を用いることと判断する。次に、95%信頼区間であることから、危険率は0.05と判断する。標本数10の情報をもとに、危険率0.05としてt分布表を両側検定として読み取り、a値を決定する。そして、区間推定を行う。つまり、『(Xの上にバー)−a×(s / √n)≦μ≦ (Xの上にバー)+ a×(s / √n)』の式を思い返して、入力を進めれば良い。ここでのポイントは、母集団に関する情報が一切得られていない状況で、母平均の区間推定を実施していることに気がつくことといえる。第17回と第18回の講義では、『母標準偏差が分かっている』といった、通常では起こりにくい状況での推定だった。今回の例題では、標本に関する情報しか得られていない状況での推定となる。感覚的にも、こちらの状況の方が起こりやすいと思うが、その際に使えるテクニックであることを意識して問題に取り組むことが重要である。
② 解答を導くために、ひとつひとつの情報を埋めていくこととする。標本数10の情報をもとに、危険率0.05としてt分布表を両側検定としてa値を読み取ると、2.262となる。次に、標本平均(Xの上にバー)は、今回のデータからは、301.8 gとなる。次に、標本標準偏差(s)は、今回のデータからは、2.773となる。この情報をもとに、母平均の下方信頼限界では(Xの上にバー)−a×( s / √n)として算出(299.8)し、母平均の上方信頼限界では(Xの上にバー)+a×( s / √n)として算出(303.8)する。この結果より、畑Aにおける栽培している芋の重さは、95%信頼区間のもと、299.8 gから303.8 gと推定することができる。ここでのポイントは、今回のコマシラバス上ではデータの標本平均と標準偏差を数値として示しているが、実際にはデータとして10個の芋の重量が示されただけの状態から、母平均推定までを実施したことにある。ここでは、t分布の計算は当然だが、標本標準偏差の計算といった、以前の授業回での学びでの理解も求められる。よって、推定結果として正答を導けなかった場合は、計算過程のどこに誤りがあったかを確認し、ここまでの理解を確実にすることが必要となる。
③ コマ主題細目①とコマ主題細目②での演習において、t分布表の値を読み取って、a値を決定した。ただし、特殊な読み取り方を行うため(両側検定か片側検定かによって上下が異なる)、読み取り間違いが発生するリスクがある。これについて、エクセル関数を用いれば、読み取りによる誤りを防ぐことが可能となる。ここでは、エクセル関数として『T.INV関数』を確認する。この関数の入力は、『=T.INV(確率, 自由度)』である。これによって、例えば、標本数10で、危険率0.05の両側区間推定であれば『=T.INV(0.975, 9)』と入力して、a値の『2.262』が得られる。ただし、この関数を用いる際には、自身が得ようとしている値に対する理解が十分であることが求められる。ここでのポイントともなるが、関数の中で入力する『確率』は、危険率0.05で両側区間推定の場合は、1−0.05/2となることに注意が必要である。つまり、信頼度として、両側パーセント点の右側の値を用いている。そして、『自由度』はn−1である。この関数を利用して計算する際には、上記の点に十分な注意を払うことが必要である。そして、常に、両側区間推定なのか、片側区間推定なのかといった、自身が何を知ろうとしているかといった点についても、統計処理が単なる作業とならないように、常に意識することが必要である。
キーワード ① t値の定義 ② 標本分散 ③ t分布 ④ 自由度 ⑤ 区間推定
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、エクセルを用いて行っている計算の意味を理解することといえる。指定された操作に対し、作業のように実施してしまうと、理解のための操作とは言い難いものになる。よって、学生は、今後の卒業研究での利用場面を考えた際に、t分布やエクセル関数は使い勝手がよいということを理解し、今回扱った演習問題を復習にいかしていただきたい。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回は t 分布による推定が完了することが目的となる。今一度、演習問題を完全に解けるようにまるでを課題とする。

【次コマの予習】
研究のみならず日常生活においても、ある処理を施した・施していないなどの 2 組の標本データを得た際に、その標本データに差があるのかどうかに興味を持つことが多いと思う。それを検証する作業を検定という。身近な例で「これも検定に掛けるデータか」というものを探し、ノートに例を挙げておく。

21 母平均の推定(3)2標本データの比較 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第三部として、等分散の場合の標本平均値の有意差の検定を学ぶ。
【教材】
(1)コマ用オリジナル資料ワード資料p. 1-2、コマ用オリジナル資料パワーポイント資料スライド1-11
(2)コマ用オリジナル資料ワード資料p. 1-2、コマ用オリジナル資料パワーポイント資料スライド1-11
(3)コマ用オリジナル資料パワーポイント資料スライド12-19



(1)コマ用オリジナル資料パワーポイント資料スライド1-5.
(2)コマ用オリジナル資料パワーポイント資料スライド6-11、コマ用オリジナル資料ワード資料p. 1-3.
(3)コマ用オリジナル資料パワーポイント資料スライド12-25、コマ用オリジナル資料ワード資料p. 4.

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 191-194.
(2)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 183-187.
(3)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 195-196.
(4)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 197-203.

なお、標準正規分布、t分布の確率分布表は担当教員が資料を配布する。この確率分布表は、「鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 187.」に記載されているものと同様である。

【参考とコマ主題細目との対応】
主題細目① 参考(1)「はじめての統計学」、参考(2)「日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社」
主題細目② 参考(3)「はじめての統計学」
主題細目③ 参考(4)「はじめての統計学」
コマ主題細目 ① 2組の標本データの平均値の差 ② 仮説検定 ③ 第1種の過誤と第2種の過誤
細目レベル ① 実験や調査では、同種のデータの平均値に有為差があるかどうかがしばしば問題にされる。ある肥料と土壌で栽培し収穫したイチゴの糖度の平均値と、工夫して少し異なる肥料、土壌の条件で栽培し収穫したイチゴの糖度の平均値に差があったとき、その差が『単なるバラツキの範囲内なのか』、あるいは『工夫した新しい肥料、土壌の条件が有効で有意の差が出たということなのか』などの問題である。このような平均値の有意差を調べ判定することを『検定』という。有意差があるかないかを知るためには、2組の標本データの平均値の差を調べればよい。このように、2つの独立した母集団があり、それぞれの母集団から抽出した標本の平均に差があるかどうかを検定することを、『2標本の平均値のt検定』と呼ぶ。ここでのポイントは、まずは初めての検定におけるイメージを固めることといえる。検定と聞くと複雑な印象があるかもしれない。しかし、実質に行うことは、2つの標本の平均値を比較して、差があるかどうかを確認している程度である。そのようなイメージをもってこれからの検定に臨むことが大切である。
② 仮説検定とは『ある仮説に対して、それが正しいのか否かを統計学的に検証する』という推計統計学の手法の一つである。仮説には、帰無仮説(H0)と対立仮説(H1)を設定し、客観的に判断をしていくことになる。ここで、帰無仮説(H0)は、仮説で検証したい仮説となり、対立仮説(H1)は、帰無仮説の逆の仮説を指す。また、用語として、『帰無仮説(H0)は間違っている』と判断する際には、『帰無仮説(H0)を棄却する』と呼ぶ。ここまでをおさえた上で、t検定に繋げる。t検定を行うためにはまず「2組の標本平均に有意な差はない」、すなわち「標本平均の差は0」という仮説を立てる。これが帰無仮説となる。その逆に、本来主張したい「2組の標本平均に有意な差がある」とする仮説を、対立仮説という。仮説検定においては、対立仮説と帰無仮説を立てるところから始めるため、内容をおさえる。ここでのポイントは、帰無仮説と対立仮説の正しい理解といえる。検定にかけるのは、帰無仮説であると覚えることが大切である。
③ 第1種の過誤とは、本当は差がないのに、差があると間違えてしまうことを指す。つまり、「間違えて対立仮説を採択する」ことである。第一種の過誤をしてしまう可能性は、有意水準αと同じである。有意水準 α = 5%より外れるということは、「差がない場合だが、5%の確率で発生することが起こった」ということである。つまり、100回のうち5回しか起きない出来事が、たまたま起こったということとなる。第2種の過誤とは、本当は差があるのに、「差がない」と間違えてしまうことを指す。つまり「間違って帰無仮説を採択する」ということである。検定にかける際には、誤った方の仮説を採択する可能性がある。その可能性があることを、理解を含めておさえる。ここでのポイントは、過誤の種類の理解といえる。特に、第1種の過誤が深刻であるが、ここでは、検定には間違いが起こる可能性が存在していることをよく理解することが大切である。
キーワード ① 仮説検定 ② 帰無仮説 ③ 対立仮説 ④ 2標本 ⑤ 平均
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、「平均の差の検定」にt検定が使えることを覚えることといえる。例えば、AとBの処理を行う卒業研究において、結果を考究する際には、まず、その群に違いがあるかないかに興味を持つことと思う。その際に、t検定は有効な検定方法である。卒業研究にも使える技術でもあり、復習課題を通してしっかりと身につけていただきたい。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回も、t分布の理解が重要となる。t 検定の手順を覚え、各自で計算し、判定できるようになることを課題とする。

【次コマの予習】
エクセルのシートを開き、データを確認しておく。また、余力があれば、エクセルにヒントとして示しているp値計算のためのエクセル関数を確認する。

22 母平均の推定(3)2標本データの比較_演習 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第三部として、等分散の場合の標本平均値の有意差の検定を学ぶ。
【教材】
(1)コマ用オリジナル資料ワード資料p.1-2、コマ用オリジナル資料パワーポイント資料スライド20-21
(2)コマ用オリジナル資料ワード資料p.3-4、コマ用オリジナル資料エクセル資料シート1-4、コマ用オリジナル資料パワーポイント資料スライド22-32
(3)コマ用オリジナル資料ワード資料p.2、コマ用オリジナル資料エクセル資料シート5、コマ用オリジナル資料パワーポイント資料スライド33-40

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 191-203.
(2)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 183-187.
(3)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 120-127.

なお、標準正規分布、t分布の確率分布表は担当教員が資料を配布する。この確率分布表は、「鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 187.」に記載されているものと同様である。

【参考とコマ主題細目との対応】
主題細目① 参考(1)「はじめての統計学」、参考(2)「日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社」
主題細目② 参考(3)「Excelで学ぶ統計解析入門」
主題細目③ 参考(3)「Excelで学ぶ統計解析入門」
コマ主題細目 ① t 検定の手順 ② エクセルを使ったt検定の演習 ③ t検定の演習の解説
細目レベル ① 通常、標本の元になる母集団の分散、標準偏差はわからず、差の標本の分散、標準偏差もわからない。そこで、差の標本についてt分布を用いて検定を行う。これを2標本の平均値のt検定という。t検定の手順は、次の通りとなる。
1. 帰無仮説「2組のデータの平均に差はない(平均値の差は0)」を設定する。
2. 2組のデータから統計検定量t0を計算する。
3. 有意水準aを0.05 (5%)とするとき、1−a / 2 = 0.975及び、自由度m+n−2を求め、パーセント点 a を計算する。
4. aとt0を比較して帰無仮説の採択/棄却を決める。(t0 > a 有意差有、t0 < a 有意差無となる)。パーセント点による判定と同じことではあるが、検定の場合はa値のかわりに|t0 |> aの確率p値(すなわち分布両端±aより外側の部分の面積)を使うことが多い。その場合2,3では、両側検定の場合、a≦ p のとき仮説棄却、すなわち有意差有りとする。
この流れを、練習問題を解きながら理解する。ここでのポイントは、検定結果の理解といえる。危険率側に結果があった場合は、帰無仮説を棄却することとなる。この状態を有意差有りと呼ぶ。これらの理解が重要といえる。

② ここでは、第21回と第22回コマ主題細目①までの学びの確認として、エクセルを使っての演習を行う。例題として、『対応のない2標本のt検定』を挙げる。まず、『対応のない2標本』とは、例えばある中学校のA組とB組の英語の試験の平均点の差として挙げられる。A組とB組では、在籍する生徒個人が異なる。つまり、対応がないといえる。一方、A組において、4月に英語の試験を実施し、授業をある程度実施した後の7月にも同じ英語の試験を実施し、その結果を比較するとなった場合は、対象となっている生徒は同じである。つまり、『対応がある』といえる。話は戻るが、今回は『対応のない2標本のt検定』の演習問題例を紹介する。ある中学校のA組とB組の英語の試験の平均点に差があるかの検定を行うとする。A組は30人、平均点は75点、標準偏差は5点で、B組は32人、平均点は70点、標準偏差は8点だったとする。ここで、検証は、5%有意水準で仮説検定を行うこととする。コマ主題細目①の手順にそって検定は進めていくことになるが、ここでのポイントは、仮説の立て方と、自由度の値といえる。まず、帰無仮説(H0)は、A組とB組の英語試験の平均点は等しいとなり、対立仮説(H1)は、A組とB組の英語試験の平均点は差があるとなる。そして、検定にかける仮説は帰無仮説(H0)となる。これは、第21回コマ主題細目①の学びとなるため、再度確認していただきたい。次に、自由度は、2つの標本数−2となる。これは、分散の式をもとに考える必要がある。通常のt分布で用いる分散では、自由度がn−1として求められてきた。しかし、対応のない2標本の場合は、検定する標本が2つあるといえる。つまり、自由度もn1−1+ n2−1= n1+ n2−2となる。対応のない2標本の場合は、特に自由度の考え方や分散の計算がやや煩雑となるため、理由を理解した上で計算に臨むことが必要となる。
③ 解答を導くために、ひとつひとつの情報を埋めていくこととする。A組は30人(n1)、平均点は75点(X1の上にバー)、標準偏差は5点(s1)である。B組は32人(n2)、平均点は70点(X2の上にバー)、標準偏差は8点(s2)である。帰無仮説(H0)の棄却のルールとしては、自由度が(30 + 32 – 2= 60)のため、t分布表より棄却域tの値は2.000となる。計算式が煩雑となるため省略するが、検定統計量としてのtの値は2.93となる。このtの値は、棄却域の2.000よりも大きく、検定統計量tは棄却域の中に入るといえる。よって、帰無仮説は棄却され、A組とB組の英語試験の平均点は等しいとはいえない。このように、差の検定は実行される。ただしここで、p値と呼ばれる指標値についても理解しておきたい。p値とは、有意差判定に用いられる指標値で、有意差がある場合は、p値<0.05のように記載される。この指標値の導出には、エクセル関数を用いると容易である。エクセル関数では『=t.dist.2t(tの検定統計量, 自由度)』として求められる。関数を覚えなければいけないが、便利な関数なため、覚えることを勧めたい。ここでのポイントは、ここでのポイントは、エクセルを用いて行っている計算の意味を理解することといえる。指定された操作に対し、作業のように実施してしまうと、理解のための操作とは言い難いものになる。よって、エクセルの操作は極力単純なシートを配布するため、学生は、ここでの計算が『対応のある』もしくは『対応のない』といった使用しているデータの性質の判別から、結論としての文章表現までを確実なものとすることが必要である。
キーワード ① エクセル ② t 検定 ③ 検定統計量 ④ 自由度 ⑤ t分布表
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
ここでのポイントは、エクセルを用いて行っている計算の意味を理解することといえる。指定された操作に対し、作業のように実施してしまうと、理解のための操作とは言い難いものになる。よって、エクセルの操作は極力単純なシートを配布するため、学生は、ここでの計算がエクセル関数の使用も含めて、間違いなく算定するべき数値を導出することが重要となる。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回は、特に『対応のない2標本』における検定統計量の算出が、計算間違いなく実施できるようにすることと、それによる結論までを文章として説明できるようになるまでを課題とする。

【次コマの予習】
ノンパラメトリック検定について学ぶ。これまでに勉強してきたデータを見直し、正規分布が仮定されているという状況を確認する。

23 ノンパラメトリック検定 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回は、第四部として、ノンパラメトリック検定の方法を学ぶ。
【教材】
(1)コマ用オリジナル資料エクセル資料シート1-21、コマ用オリジナル資料エクセル資料シート1-2
(2)コマ用オリジナル資料パワーポイント資料スライド 22-26
(3)コマ用オリジナル資料パワーポイント資料スライド27-29
コマ用オリジナル資料ワード資料p.2、コマ用オリジナル資料パワーポイント資料スライド33-40

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」、

【参考】
(1)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 246.
(2)栗原伸一(2021)入門統計学(第2版),オーム社,231-253.
(3)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 247-253.
(4)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 254-260.

【参考とコマ主題細目との対応】
主題細目① 参考(1)「Excelで学ぶ統計解析入門」、(2)「入門統計学(第2版)」
主題細目② 参考(3)「Excelで学ぶ統計解析入門」
主題細目③ 参考(4)「Excelで学ぶ統計解析入門」
コマ主題細目 ① パラメトリック検定とノンパラメトリック検定 ② 対応のないデータ_ウィルコクソンの順位和検定(U検定) ③ 対応のあるデータ_ウィルコクソンの符号順位和検定
細目レベル ① ここまでに学んできた仮説検定は、母集団が特定の確率分布に従っていることが前提となっていた。例えば、t検定では2つの標本の分布が共に正規分布に従った母集団から抽出されたことを仮定している。そのため、観測データを使って母平均の差を推測できた。このように、母集団に特定の確率分布を仮定する検定をパラメトリック検定と呼ぶ。検定統計量の計算には、平均、割合、標準偏差が用いられる。一方、実際に扱うデータは母集団に確率分布を仮定できるものばかりとは言い難い。例えば、ある少数の2群のデータがあったとして、どちらも極端に大きな値(外れ値)があったとする。各群の平均に差がありそうとなったとしても、外れ値によって検定統計量は小さく歪ませてしまうことがある。つまり、平均には差がありそうだが、不偏分散は同等といった状況である。この場合、t検定を実施すると有意な差がないといった検定結果になりかねない。そのような場合、各データを小さい順(順位)とすると、極端に大きかったデータも、極端な値ではなくなる(例:『3、5、10、100』が、『1位、2位、3位、4位』となる)。このような変換によって、検定を行った方が適しているケースもある。まずここでは、パラメトリック検定とノンパラメトリック検定の違いを概観し、どのようなケースで使い分けるかをおさえる。ここでのポイントは、ノンパラメトリック検定の特徴の理解といえる。特徴としては、母集団に対する一切の前提を仮定しない、質的データの検定にも使える、外れ値のある量的データの検定にも使えるなどがある。ただし、本来パラメトリック検定を行うべきデータに使うと、帰無仮説を棄却できるのに採択する確率が上昇するといったデメリットもある。この辺りの理解を確実にすることが、卒論研究の実施にむけて重要な箇所といえる。
② ウィルコクソンの順位和検定は、ノンパラメトリック検定の代表的な検定方法の一つである。似た検定に、マンホイットニーのU検定と呼ばれるノンパラメトリック検定法があるが、検定統計量の算出方法に違いがあるものの、検定結果は一致する。この検定法は、対応のないデータの2群間の平均値に差があるかどうかを検定する方法である。ただし、コマ主題細目①で説明した通り、データの大小を順位に置き換えて統計検定を行うため、2群間の平均値の差というよりも、順位平均値(中央値)の有意差を調べる検定手法と考えると理解しやすい。検定の流れはt検定と同様だが、検定統計量では検定統計量Uを求める。ただし、p値は、2群のサンプルサイズのどちらも7以下の場合はマンホイットニーU検定表を参照してp値を求め、2群のサンプルサイズのどちらかが8以上の場合は検定統計量がz分布に従うとしてp値を求める。この検定の流れは慣れが必要となるが、ここでは、まずデータの状況によって使用できるパラメトリック検定法の一つとして修得する。ここでのポイントは、『対応のない』といった表現の理解となる。例えば、環境科学部の教員と心理学部の教員について、授業アンケートの結果を比較するとする。この場合、教員個人に対応関係はない。よって、対応のないデータとなる。統計処理によって検定を行う前に、データの特性を理解しなければ、正しい検定はできない。よって、この理解を確実なものにする。
③ ウィルコクソンの符号順位和検定は、ノンパラメトリック検定の代表的な検定方法の一つである。この検定は、サインランク検定と呼ばれることがある。コマ主題細目②のウィルコクソンの順位和相関とは名称が似ているが、異なる検定法として注意が必要である。共通点としては、どちらもデータ順序尺度の場合および、距離尺度の場合はサンプル数が少ないときに用いられることである。ウィルコクソンの符号順位和検定は、2つのデータ間に対応があるときに用いられる。つまり、ウィルコクソンの符号順位和検定は、パラメトリック検定における対応のあるt検定に相当する。検定の流れは、コマ主題細目②のウィルコクソンの順位和検定と同様だが、p値を求める際の、サンプルサイズの条件が異なる。得られる検定統計量はJとして、2群のサンプルサイズの合計が25以下の場合は、順位和とサインランク表で参照した数値を比較し、有意差を判別する。ここで、p値は算出されない。一方、サンプルサイズが26以上の場合は、サインランク表は適用せず、z分布に従うとしてp値を得る。ここでは、対応のないデータと、対応のないデータによって、用いる検定法が異なることを理解すると共に、サンプルサイズによって使い分けることも修得する。ここでのポイントは、『対応のある』といった表現の理解となる。例えば、環境科学部の各教員を例に挙げた際に、授業アンケートとシラバスアンケートの結果を各教員個別で比較するとする。この場合、個人間での比較が可能となるため、対応関係はある。よって、対応のあるデータとなる。統計処理によって検定を行う前に、データの特性を理解しなければ、正しい検定はできない。よって、この理解を確実なものにする。
キーワード ① パラメトリック ② ノンパラメトリック ③ 中央値 ④ サンプルサイズ ⑤ データの対応
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、データの性質を理解することにある。データを得た場合、すぐに統計処理にかけ、有意な差があるのかないのかといった判断をしたいことと思う。しかし、誤った方法によって検定にかけてしまうと、本来は差があるはずでも、差がないと判断してしまいかねない。今一度基本に立ち返り、データの性質を確認することから始めなければならない。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回は、授業で使用したデータをよく確認し、対応がある・対応がないの判断を、どこで判断しているかを示せるようにすることとする。

【次コマの予習】
エクセルのシートを開き、データを確認しておく。また、余力があれば、U検定表とサインランク表の読み方を、事前配布資料をもとに確認する。

24 ノンパラメトリック検定_演習 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回は、第四部として、ノンパラメトリック検定の方法を学ぶ。
【教材】
(1)コマ用オリジナル資料エクセル資料シート3-6、コマ用オリジナル資料パワーポイント資料スライド24-27
(2)コマ用オリジナル資料エクセル資料シート7-10、コマ用オリジナル資料パワーポイント資料スライド27-31
(3)コマ用オリジナル資料エクセル資料シート3と7、コマ用オリジナル資料パワーポイント資料スライド22-40

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」、教材(2)「コマ用オリジナル資料」
主題細目② 教材(1)「コマ用オリジナル資料」、教材(3)「コマ用オリジナル資料」
主題細目③ 教材(2)「コマ用オリジナル資料」、教材(3)「コマ用オリジナル資料」、

【参考】
(1)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 246.
(2)栗原伸一(2021)入門統計学(第2版),オーム社,231-253.
(3)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 247-253.
(4)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 254-260.

【参考とコマ主題細目との対応】
主題細目① 参考(1)「Excelで学ぶ統計解析入門」、参考(2)「入門統計学(第2版)」
主題細目② 参考(2)「入門統計学(第2版)」、参考(3)「Excelで学ぶ統計解析入門」
主題細目③ 参考(1)「Excelで学ぶ統計解析入門」、参考(2)「入門統計学(第2版)」、参考(3)「Excelで学ぶ統計解析入門」、参考(4)「Excelで学ぶ統計解析入門」
コマ主題細目 ① エクセルを使ったウィルコクソンの順位和検定の演習 ② エクセルを使ったウィルコクソンの符号順位和検定の演習 ③ ノンパラメトリック検定の演習の解説
細目レベル ① ここでは、第23回の学びの確認として、エクセルを使っての演習を行う。例題として、『高校生と小学生を対象に、ペン回しの技術に差があるか』を検定することとする。条件として、都内からランダムに7人と6人を選んで同じ技で各自100回してもらった。100回中、ミスをした数を記録した。この条件において、技術に差があるかを、有意水準0.05で両側検定することとする。帰無仮説と対立仮説を設定した後に、まずは順位和を求める。例えば、高校生をA群、小学生をB群とする。両群を合わせて、ミスの回数が小さい順に並び替えを行い、順位を振る。次に、同じミスの回数をしている場合は、順位を平均した値に置き換える。具体的には、1位、2位、3位が同じ30回のミスだった場合、これらは『2位、2位、2位』となる。この操作が完了した後に、合わせていた群を、振ってある順位はそのままとしてA群とB群に分ける。分けた後に、それぞれの群における順位の総和を取る。ここまでの計算が『順位和(R)』となる。得られた順位和(R)を用いて、検定統計量(U)を求める。検定統計量(U)は、次式によって求められる。なお、ここでは、A群の場合は、検定統計量をUA、サンプル数をnA(B群はnB)、順位和をRAとして示す。『UA=nA×nB+(nA×(nA+1))/2-RA』となる。A群とB群とで検定統計量(U)を求めた後に、小さい値を、この検定における検定統計量(U)とする。次に、この検定統計量(U)について、マンホイットニーU検定表を用いてp値を検索する。今回の例では、nAが7、nBが6で、Uが4だったとする。その場合、nAが7の表を用いて、nBが6の列、Uが4の行にある値が該当する。つまり、0.007となる。最後に、今回の条件が、『有意水準0.05で両側検定』であるため、得られたp値を2倍して、0.05の値と比較し、検定の結果を結論づける。例えば、得られたp値が0.014であった場合は、p値<0.05より、帰無仮説の『高校生と小学生のペン回しのミス回数に差がない』が棄却される。つまり、高校生と小学生のペン回しのミスの回数に差があると結論づけることになる。ここでのポイントは、順位和を正しく得ることにある。解析の名称の通り、得られた結果を順位に置き換えるといった操作によって解析を行う。この過程において、並び替えの誤りなどがあると計算が正しく実行できない。まずは、この統計処理法の特徴を理解した上で、どのような手順を踏んでいるかを確認し、ミスなく計算を実行することが肝要である。
② ここでは、第23回の学びの確認として、エクセルを使っての演習を行う。例題として、『ある料理の改良前後における評価の違い』を検定することとする。条件として、学生10人を対象に、試食をしてもらった。改良前後の料理について、10点満点で評価を行い、その結果を記録した。この条件において、改良後において、料理の評価は高いといえるかを、有意水準0.05で検定する。手順としては、帰無仮説と対立仮説を設定した後に、学生10人に対してIDを1から10まで振る。その後に、検定のためにまずはデータの差を求める。例えば、学生1が、改良後を評価9点、改良前を評価7点とした場合、差は2とする。また、差が0の場合は、『×』として、今後の計算には含めないこととする。10人分の差を計算した後に、これらの差について絶対値を取る。次に、差の絶対値を小さい順に並び替え、この順をもとに小さい順に順位を振る。ここで、同じ順位がある場合は、順位を平均した値に置き換える。具体的には、学生5と学生6における差の絶対値が1となった場合、暫定的に学生5を1位、学生6を2位とする。そして、この順位を平均し『1.5位、1.5位』となる。ここまで完了した後に、もとの『差』において符号がプラスの順位を使って、平均された順位の和を求める。また、もとの『差』において符号がマイナスの順位を使って、平均された順位の和を求める。ここで得たそれぞれの順位和のうち、小さい方の値を検定統計量(J)とする。今回は、例えばプラスの順位和が37.5、マイナスの順位和が7.5だったとすると、検定統計量(J)は7.5となる。次に、この検定統計量(J)について、サインランク表を用いて値を比較する。サインランク表では、nが『サンプルサイズ − 差が0(×と表記)となったサンプルの数』となる。今回は、片側検定の0.05より、『8』となる。この値を、検定統計量(J)の7.5と比較しする。結果として、『検定統計量(J)の7.5<8』となり、解析結果としては『改良後は改良前より評価が高い』と結論づけることになる。ここでのポイントは、コマ主題細目①で扱ったウィルコクソンの順位和検定との違いを理解することといえる。データの性質として、対応がある・対応がないの判断を正しく行わなければ、誤った統計処理法を選択してしまう。まずは、解析を始める前に、このデータの性質をよく確認することが重要である。
③ 今回の解説では、両側検定と、片側検定のどちらを採用するかに注目して説明する。コマ主題細目①で行った解析では、対立仮説が『高校生と小学生を対象に、ペン回しの技術に差がある』となる。この場合、『どちらの技術が高いものか』という問いではない。どちらの技術が高いのかといった問いの場合は、対立仮説が『高校生は、小学生よりもペン回しの技術が劣る』といったものになる。その場合、『高校生は小学生よりもペン回しのミスが多い』となるため、高校生のミス数の順位和が多くなる。つまり、検定統計量(U)は数の多い群Aの38を適用することになる。その結果を片側検定により解析し、『劣る・劣るといえない』の判断となる。一方、コマ主題細目②で行った解析では、対立仮説が『改良後において、料理の評価は高い』となる。コマ主題細目①とは異なり、群Aの母集団順位平均値は、群Bの母集団順位平均値より大きいといった判定となるため、片側検定となる。このように、解析の目的に応じて、両側検定を行うべきか、片側検定を行うべきかを判断する必要がある。ここでのポイントは、エクセルを用いて行っている解析に対して、その本来の目的をよく検討してから解析を始める必要があることといえる。指定された操作に対し、作業のように実施してしまうと、理解のための操作とは言い難いものになる。よって、エクセルの操作は極力単純なシートを配布するため、学生は、ここでの計算がどのような目的を持って実施されていることを意識すると同時に、最終的な結論として帰無仮説が棄却されたかどうかによる判定までを、文章として適切に示すことまでが必要となる。
キーワード ① 対応のないデータ ② 対応のあるデータ ③ 帰無仮説 ④ 対立仮説 ⑤ エクセル
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、エクセルを用いて行っている計算の意味を理解することといえる。指定された操作に対し、作業のように実施してしまうと、理解のための操作とは言い難いものになる。よって、学生には、ここでの計算がどのような目的を持って実施されていることを意識すると同時に、最終的な結論として帰無仮説が棄却されたかどうかによる判定までを、文章として適切に示すことに注力することを理解していただきたい。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回は、エクセルを用いての計算の練習とともに、どのような仮説をたてるべきかを検討するまでを課題とする。

【次コマの予習】
χ2(カイ二乗)分布を学ぶ際に、クロス集計表を用いる。基礎数学の第14回の講義資料を見直す。

25 複数のデータの分析(1)χ2分布 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、正規分布に従う複数のデータを一斉に扱えることを学ぶ。
【教材】
(1)コマ用オリジナル資料ワード資料p.1-2、コマ用オリジナル資料エクセル資料シート1、コマ用オリジナル資料パワーポイント資料スライド1-10
(2)コマ用オリジナル資料ワード資料p.3、コマ用オリジナル資料エクセル資料シート2
(3)コマ用オリジナル資料ワード資料p.2、コマ用オリジナル資料エクセル資料シート5、コマ用オリジナル資料パワーポイント資料スライド11-20

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 173-180.
(2)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 8-9.
(3)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 180-190.

なお、χ2分布の確率分布表は担当教員が資料を配布する。この確率分布表は、「鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 187.」に記載されているものと同様である。

【参考とコマ主題細目との対応】
主題細目① 参考(1)「はじめての統計学」
主題細目② 参考(2)「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」
主題細目③ 参考(3)「はじめての統計学」
コマ主題細目 ① χ2検定の考え方 ② クロス集計表 ③ χ2検定
細目レベル ① χ2検定は別名「独立性の検定」とも呼ばれる。独立という言葉はやや難しいが、「独立である→関係がない」「独立でない→何か関係性がある」と解釈すると、理解しやすいように思う。χ2検定では、以下のステップを踏んで検定を行う。
1. データをクロス集計表にまとめる。
2. 検定について、帰無仮説と対立仮説を設定する。
3. 期待度数(もし関係が無かったら、きっとこうなるだろうという回数)を求める。
4. データと期待度数との差を求める(この差が大きければ、関係ありとみなせそうである)。
5. χ2値を計算によって求める。
6. 得られたχ2値をp値に変換する。
7. 得られたp値を解釈する。
実際に各自がデータを得た場合を想定し、この分析の流れをおさえる。ここでのポイントは、計算の流れの理解といえる。データについて、クロス集計表によって集計してから、期待度数を計算するなど作業を進めることになる。χ2検定といった統計処理も行うが、データの取りまとめから専用の表によるまとめ方が存在することを理解することが重要である。

② 二種類のデータを考える際に、より複雑なデータを扱うこともある。これは、「本当に関係があるかどうか、微妙なデータ」が現れたときである。例えば、「長男であるかどうかということは、野球選手になる適正と何か関係があるか」というケースである。この際に、独立性の検定が行われる。ただし、この際には、野球選手になった人のデータと、野球選手にならかった人のデータが、それぞれ長男と次男に必要である。つまり、独立性の検定を行うためには、まずはデータの集計が必要となる。その際に用いられるデータの集計方法に「クロス集計表」と呼ばれる方法がある。ここでは、クロス集計表の作成方法を学び、データの活用法を理解するところまでをおさえる。ここでのポイントは、クロス集計表を実際に作成することといえる。表に記す条件に適した数値を記入することとなるが、表に正しく数値を記入することと共に、表の各項目を正しく設定することも必要である。
③ χ2検定では、期待度数を求めて計算される。期待度数とは、「もし〇〇に関係が無かったら、きっとこうなるだろうという数」である。すなわち、元データをもとにその起こる割合を求め、その割合に元のデータの数を掛け合わせて算出する。こうして得られた期待度数を用いて、「(元のデータ−期待度数)2 / 期待度数」の式によって、データの数だけ算出し、最後にその値を足し合わせた数としてχ2値が得られる。このχ2値が大きければ「関係がありそうだ」と、みなすことができる。このχ2値をp値に変換し、p値が0.05を上回ったときは「〇〇と△△には、有意な関係があるとは言えない」ということになる。ここで、伝統的に、p値は0.05を下回れば小さいとみなす。この一連の流れを、問題を解きながらおさえる。ここでのポイントは、p値の理解である。p値は危険率を示す。そのため、95%信頼区間を用いる場合は、危険率は5%となる。このような統計学的な判定指標を理解することが大切である。
キーワード ① χ2値 ② クロス集計表 ③ 期待度数 ④ 独立性 ⑤ 独立性の検定
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、χ2検定の考え方と、その手順の理解にある。ここまでに学んできた統計処理の手法と比べ、表を作ってのデータ整理というステップが新しく加わったと感じた学生も多いと思う。しかし、これまで学んできた統計処理法においても、データ整理は教員側である程度実施していたに過ぎない。よって、まずはデータ整理を完璧なものにすることを心がけていただきたい。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回はクロス集計表を作成できるようになることを課題とする。

【次コマの予習】
エクセルのシートを開き、データを確認しておく。また、余力があれば、クロス集計表を事前に配布した資料を確認しながら作成する。

26 複数のデータの分析(1)χ2分布_演習 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、正規分布に従う複数のデータを一斉に扱えることを学ぶ。
【教材】
(1)コマ用オリジナル資料ワード資料p.3-5、コマ用オリジナル資料エクセル資料シート2-3、コマ用オリジナル資料パワーポイント資料スライド21-23
(2)コマ用オリジナル資料ワード資料p.6、コマ用オリジナル資料エクセル資料シート2-3、コマ用オリジナル資料パワーポイント資料スライド24-27
(3)コマ用オリジナル資料ワード資料p.6-7、コマ用オリジナル資料エクセル資料シート4-6

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 173-180.
(2)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 370-375.
(3)日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 8-9.
(4)鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 180-190.

なお、χ2分布の確率分布表は担当教員が資料を配布する。この確率分布表は、「鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 187.」に記載されているものと同様である。

【参考とコマ主題細目との対応】
主題細目① 参考(1)「はじめての統計学」、参考(2)「Excelで学ぶ統計解析入門」
主題細目② 参考(2)「Excelで学ぶ統計解析入門」、参考(3)「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」
主題細目③ 参考(4)「はじめての統計学」
コマ主題細目 ① クロス集計表から期待度数算出の演習 ② χ2検定を用いた解析の演習 ③ χ2検定の演習の解説
細目レベル ① ここでは、第25回の学びの確認として、エクセルを使っての演習を行う。例題として、『デザインを決定しようとしていて、色と指向性には何か関係があるか』を検定することとする。この例では、ABテストと呼ばれる、ある特定の期間にページの一部分を2パターン用意して、どちらがより効果の高い成果を出せるのかを検証する実験例を用いる。状況として、400人を対象に実験を行った結果、青いボタンにつながるサイトを見た人が250人、赤いボタンにつながるサイトを見た人が150人いた。青いボタンにつながるサイトを見た人のうち、ボタンを押した人は70人いた。赤いボタンにつながるサイトを見た人のうち、ボタンを押した人は30人いたとする。クロス集計表では、行として『青いボタン』『赤いボタン』となり、列として『ボタンを押した人数』『ボタンを押さなかった人数』となる。最後に、各行列にて合計を算出する。ここでの注意としては、行としての2行の合計と、列としての2列の合計が400となっていることを確認することとする。次に、期待度数の算出を行う。ここでは、『もし色に関係が無かったら、きっとこうなるだろうという回数』を求めることになる。これを期待度数と呼ぶ。この期待度数と、元のデータが大きく異なれば「関係ありそうだ」とみなせる。期待度数の求め方では、まず『ボタンの色に関わらない、ボタンを押した人の割合』を見る。全体400人のうち100人がボタンを押している。つまり『ボタンの色と押されやすさに関係がなければ、1/4の確率でボタンが押される』ということになる。次に、青いボタンに注目する。青いボタンを目にした人の数は『250人』である。これに、上の『ボタンの色と押されやすさに関係がなければ、1/4の確率でボタンが押される』を組み合わせる。その結果、『ボタンの色と押されやすさに関係がなければ、青いボタンを押す人の数は、250÷4=62.5人になるだろう』と考えられる。この62.5人が『期待度数』となる。赤いボタンも同様に、150人のうちの4分の1がボタンを押すため、『37.5人』となる。なお、『(ボタンの色を無視して)ボタンを押さなかった人の割合』は4分の3となっている。よって、青いボタンを押さなかった人は『250×(3/4)=187.5人』となる。同様に、赤いボタンを押さなかった人は『150×(3/4)=112.5人』となる。これが期待度数の算出方法である。なお、ここでもクロス集計表と同様に表を作成する。ここまででのポイントは、クロス集計表と期待度数表のどちらにおいても、最後に、各行列にて合計を算出し、行としての2行の合計と、列としての2列の合計が400となっていることを確認することとすることといえる。ここまでの計算は、もとのデータが400人からなるものであったため、合計をすれば必ず400となる。ただし、表を作成するといった複雑な操作の特性上、記入間違いや単純な計算間違いは起こり得る。先の計算へと進む前に、表作成段階において誤りがないことを必ず確認することを癖づけることが、初級学年の学生においては何よりも重要である。
② ここでは、コマ主題細目①において作成したクロス集計表と期待度数表を用いて、命題である『デザインを決定しようとしていて、色と指向性には何か関係があるか』を検定することとする。検定の前に、まず、帰無仮説と対立仮説を設定する。帰無仮説H0は『ボタンの色とボタンの押されやすさの関係は独立である(関連性なし)』とし、対立仮説H1は『ボタンの色とボタンの押されやすさの関係は独立でない(関連性あり)』とする。では、元のデータと期待度数との差を求める。式は『(元のデータ – 期待度数)^2 / 期待度数』として求められる。例として、青いボタンを押した人の数については、元のデータが70人、期待度数が62.5人の場合は、0.9となる。これらをすべての条件について同様に計算をする。次に、χ2値を求める。χ2値は、単純に、先ほど計算したすべての値を足し合わせるだけで計算できる。今回の例では、『0.9+0.3+1.5+0.5=3.2』となる。よって、『元のデータと期待度数の差は3.2となった(χ2値は3.2)』となる。最後に、χ2値をp値に変換する(ここでのp値は、005を基準として考えることとする)。この変換は、エクセル関数を用いることとする。エクセル関数は、『CHISQ.DIST.RT(x, 自由度)』となる。ここで、xにはχ2値が入る。自由度は、クロス集計表を確認し『(縦のマスの数 – 1)×(横のマスの数 – 1)』として計算できる。つまり、今回の例での自由度は『1』である。よって、『=CHISQ.DIST.RT(3.2, 1)』とセルに入力すると、0.074という数値が返ってくる。この結果について、p値=0.074であり、0.05を上回っている。つまり、帰無仮説は棄却されず『ボタンの色と押されやすさには、有意な関係があるとは言えない』ということになる。ここでのポイントは、ここでのポイントは、χ2検定で用いられる『独立性』への理解といえる。χ2検定は別名『独立性の検定』とも呼ばれる。独立という言葉はやや難しいが、『独立している = 関係がない』『独立でない = 何か関係性がある』と解釈できる。よって、今回の結果は言い回し変えると、『ボタンの色と押されやすさは、独立している』とも表現される。独特な表現となるが、χ2検定が『独立性の検定』であるとの意味を理解していれば間違えることはない。この理解を確実なものにすることが重要である。
③ 今回の解説では、χ2値の解釈と、p値の解釈に注目して説明する。コマ主題細目②で得たχ2値は、元データと期待度数との差をすべて足し合わせるだけで計算できた。数字を用いて示すと、『0.9+0.3+1.5+0.5=3.2』である。これは、『元のデータと期待度数の差は3.2となった(χ2値は3.2)』ことを示している。この解釈としては、単純な差の総和であることから『このχ2値が大きければ大きいほど、期待度数と元データが大きく異なっている』ことを示している。期待度数は『もし関係が無かったら、きっとこうなるだろうという回数』を示す。つまり、χ2値が大きければ『ボタンの色と押されやすさには関係がありそうだ』とみなすことができる。次に、p値の解釈について説明する。データを分析すると、『偶然そうなった』のではないかと疑いの気持ちがでる。今回の例の場合、『偶然、青いボタンが好きな人が被験者の中に多かった』や、『偶然、赤いボタンが嫌いな人だけが集まっていた』といった状況でテストをしていた可能性も否定はできない。このように集められたデータを使った場合、『偶然』青いボタンが押されやすいように見え、χ2値も大きくなってしまう。そのような場合、今回の例としたχ2値が3.2よりも大きくなることはあり得る。そのような『偶然』が、p値の0.074(7.4%)で起こるということになる。つまり、p値は『偶然、色とボタンの押されやすさに関係があると見えてしまう確率』を示している。ここでのポイントは、特にp値の解釈の理解といえる。p値は、PC を用いれば容易に算出できる。そして、有意差の判定基準としても使い勝手が良いため、その意味の理解は後回しとして、p値を超えた超えないの議論のみとなってしまうこともある。しかし、統計処理によって判定をする際には、その指標の意味も理解しなければ、誤った解釈をする可能性も考えられる。ここでは、p値とは『たまたま、χ2値が得られた値よりも大きくなる確率』と覚えておくことが大切である。
キーワード ① クロス集計表 ② χ2値 ③ p値 ④ エクセル ⑤ 独立性
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、「複数のデータを分析」するということにある。今回学んだクロス集計表とカイ二乗分布では、2つの変数に関連があるのかを検定した。ここで、まず、検定にかけるデータが複雑という点に注意してもらいたい。最初に、データを整理する必要がある。これがクロス集計表になるのだが、ここの作り方を誤れば、その後の計算は崩壊する。計算は課題を解いて身につけるとして、まずはデータ整理を完璧なものにすることを心がけていただきたい。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回はクロス集計表の作成から、χ2検定における結論づけまでを、滞りなく完了できるようになるまで練習することを課題とする。

【次コマの予習】
3 群以上からなるデータの解析を行う。どのような状況か、各自ノートにまとめる。

27 複数のデータの分析(2)分散分析 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第四部の重要箇所として、実験の目的となる要因が結果に影響を与えたかの判定方法を学ぶ。
【教材】
(1)コマ用オリジナル資料ワード資料p.1、コマ用オリジナル資料パワーポイント資料スライド1-7
(2)コマ用オリジナル資料ワード資料p.2-4
(3)コマ用オリジナル資料ワード資料p.5-6

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)栗原伸一・丸山敦史 (2017)統計学図鑑,オーム社,P. 104-109.
(2)栗原伸一(2021)入門統計学(第2版),オーム社,P. 159-162.
(3)小林克己 (2015)毒性試験による統計解析,薬事日報社,P. 59-60.
(4)栗原伸一(2021)入門統計学(第2版),オーム社,P. 163-167.
(5)小林克己 (2015)毒性試験による統計解析,薬事日報社,P. 61-62.

F分布表は、担当教員が資料を配布する。この資料は、エクセル関数を用いて担当教員が作成したものである。

【参考とコマ主題細目との対応】
主題細目① 参考(1)「統計学図鑑」、参考(2)「入門統計学」
主題細目② 参考(3)「毒性試験による統計解析」、参考(4)「入門統計学」
主題細目③ 参考(4)「入門統計学」、参考(5)「毒性試験による統計解析」
コマ主題細目 ① 分散分析の特徴 ② 一元配置分散分析について ③ 分散分析表
細目レベル ① 2標本の平均値に差があるかを検定する方法として、第19回と第20回でのt検定について勉強した。ここでは、3群以上からなるデータ(例えば1組、2組、3組の算数のテスト等)や1つのデータに2つの要素を含むデータ(薬A、B、Cをそれぞれ10 mg、20 mg投与した場合の効果等)の母平均の差を検定する「分散分析」について勉強する。ここではまず、分散分析は、データの「分散」をもとにした分析方法であることをおさえる。次に言葉として、要因、因子、水準、○元配置を覚える。要因とは、データの値に変化を与える要素のことである。因子とは、要因の中でも特に、母平均に差をもたらすと考えられることから研究対象となる要因のことである。水準とは、1つの要因に含まれる項目(グループ)のことである。◯元配置とは、データに含まれる因子の数を表すもののことである。ここでのポイントは、3群以上のデータなどの母平均の差を検定する手法として分散分析が存在することを理解することとする。また、要因、因子、水準は、用語として覚えるのみではなく、それぞれが持つ意味を理解することもポイントとする。因子については、「実験であれば実験結果に影響を与えると考えられる要因」を示し、水準は、「因子をいくつかの段階に分ける条件」とする。ここでの用語と意味の理解が、主題細目②におけるさまざまなズレの計算において必要となる。
② 分散分析のポイントは、「データ全体の平均値から因子の各水準の平均値がどのくらいズレているか」を見ることである。そのため、いくつかのズレについて理解する必要がある。
1. データ全体の平均値からの各データのズレについて、
2. データ全体の平均値からの因子の各水準の平均値のズレについて、
3. それ以外のズレ(因子の各水準の平均値からの各データのズレ)についての3つに分けて考える。
ここで、「全体の平均値からの各データのズレ」は、「全体の平均値からの因子の各水準の平均値のズレ」+「それ以外のズレ」となる。これを計算し、これらの情報をもとに「分散分析表」を作成する。ここでのポイントは、ズレの種類について理解することとする。特に、水準間のズレを知りたい際には全体の平均から各水準の平均を引き算し、水準内でのズレを知りたい際には各水準の平均からデータを引き算するといった、ズレの意味を理解することが必要となる。

③ 分散分析を行う際に、「分散分析表」の作成を行う。分散分析表とは、「因子」、「平方和」、「自由度」、「平均平方」、「F値」の列に、「要因」、「残差」、「全体」の値を記入する表である。「平方和」の列にはズレの二乗和の値が入ることになる。「要因」には「データ全体の平均値からの因子の各水準の平均値のズレ」、「残差」には「それ以外のズレ」、「全体」には「データ全体の平均値からの各データのズレ」が入る。次に自由度を求める。「全体の自由度」では全てのデータの個数から1を引いたもの、「要因の自由度」では因子の水準(地方)の個数から1を引いたもの、「残差の自由度」では「全体の自由度」から「要因の自由度」を引いたものとする。次に平均平方を求める。平均平方は「平方和」を「自由度」で割ったもので「要因」と「残差」のみを求める。最後に、統計量Fを「要因の平均平方 / 残差の平均平方」によって求める。得られた統計量Fは、F分布表を用いて棄却域に入っているかを確認する。これによって、帰無仮説が棄却されるかを判断し、結論づける。この流れを、問題を解きながらおさえる。ここでのポイントは、分散分析表を正しく作成することとする。表の向かって左側(平方和)から作成することで、順を追って作成することができるといった作成の流れを理解することが必要となる。
キーワード ① 要因 ② 因子 ③ 自由度 ④ 統計量F ⑤ 分散分析表
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、先週に引き続き「複数のデータを分析」するということにある。今回学んだ分散分析は、3群以上の解析を対象としている。しかし、ここで卒業研究に思いを馳せていただきたい。例えば、河川水調査を行うにしても、1地点や2地点のみで研究をするだろうか。多くの場合、多地点での調査により、地点ごとに差があるかを研究したくなるはずだ。つまり、この分散分析は、研究分野によってはもっとも重要な統計処理方法といえる。計算などは課題を解いて身につけるとして、ここでは、ぜひ卒業研究で何をしたいか、もしくは先輩がどのような研究をしているかといったことにも興味をもっていただきたい。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回は分散分析表を各自で作成でき、3 群以上からなるデータに差があるといえるのかを統計学的に説明できるようになることまでを課題とする。

【次コマの予習】
エクセルのシートを開き、データを確認しておく。また、余力があれば、各ズレの計算を事前に配布した資料を確認しながら実施する。

28 複数のデータの分析(2)分散分析_演習 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回では、第四部の重要箇所として、実験の目的となる要因が結果に影響を与えたかの判定方法を学ぶ。
【教材】
(1)コマ用オリジナル資料ワード資料p.2-4、コマ用オリジナル資料エクセル資料シート2-4
(2)コマ用オリジナル資料ワード資料p.5-6、コマ用オリジナル資料エクセル資料シート5-6、コマ用オリジナル資料パワーポイント資料スライド8-11
(3)コマ用オリジナル資料ワード資料p.1-7、コマ用オリジナル資料エクセル資料シート7-8、コマ用オリジナル資料パワーポイント資料スライド12-27

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)栗原伸一(2021)入門統計学(第2版),オーム社,P. 159-162.
(2)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 270-271.
(3)栗原伸一(2021)入門統計学(第2版),オーム社,P. 163-167.
(4)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 272-273.
(5)菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P.274-280.

F分布表は、担当教員が資料を配布する。この資料は、エクセル関数を用いて担当教員が作成したものである。

【参考とコマ主題細目との対応】
主題細目① 参考(1)「入門統計学」、参考(2)「Excelで学ぶ統計解析入門」
主題細目② 参考(3)「入門統計学」、参考(4)「Excelで学ぶ統計解析入門」
主題細目③ 参考(3)「入門統計学」、参考(5)「Excelで学ぶ統計解析入門」
コマ主題細目 ① データのズレの計算の演習と解説 ② 分散分析表作成の演習と解説 ③ 検定統計量Fからの検定の演習と解説
細目レベル ① ここでは、第27回の学びの確認として、エクセルを使っての演習を行う。例題として、『ある飲食チェーン店の日本全国の分布状況について、地方によって差があるか』を検定することとする。この例では、日本を7つの地方(群)に分け、さらにそこに存在する各都道府県の店舗数をもとに検定を行うこととする。よって、帰無仮説は『各地方の『飲食店』数の母平均は等しい』とする。まず、日本全国における都道府県ごとの店舗数の平均(データ全体の平均値)を求める。ここでは2とする。次に、各地方(群)の平均値を求める。ここでは、各群につき平均値を得たとする。まずは、『データ全体の平均値からの各データのズレ』として、全体の平均値と47都道府県すべてのデータとの差の二乗和を求める。結果として、518となったとする。次に、『データ全体の平均値からの因子の各水準の平均値のズレ』を求める。具体的には、全体の平均値と7つの群それぞれにおける平均値との差を二乗したものに、各群に含まれるデータ数(都道府県数)をかけたものの和を求める。結果として、64となったとする。最後に、『それ以外のズレ』を求める。それ以外のズレは、『全体の平均値からの各データのズレ』-『全体の平均値からの因子の各水準の平均値のズレ』として求められる。結果として、454となる。以上が、ズレの計算となる。
ここでのズレに関する解説として整理すると、『データ全体の平均値からの因子の各水準の平均値のズレ』とは、全体平均を基準として、各地方(群)の平均がどの程度ばらついているかを数値化したもの(群間変動:要因)といえる。そして、『それ以外のズレ』は、同じ地方(群)の中でも都道府県ごとの違いによるばらつきを数値化したもの(群内変動:残差)といえる。このように、分散分析とは、群間変動、群内変動、全体変動を用いて、各群の平均値を分析していることになる。ここでのポイントは、まずは各ズレの計算を確実なものとすることといえる。ここで挙げた3つのズレは、この後に続く平均平方(分散)や、F値(分散比)を求めるための基礎となる。データのもつばらつきすべてについて意識し、群間、群内のズレすべてを検討しているかを確認しながら計算することが必要である。

② コマ主題細目①からの続きとして、分散分析表を作成する。分散分析表では、行として『要因』『残差』『全体』があり、列として『平方和』『自由度』『平均平方』『F値』がある。すでに、『平方和』の列については、コマ主題細目①で計算した、各ズレがそれぞれ当てはまる。次に、自由度を求める。まず、『全体の自由度』は、全てのデータの個数から1を引いたものとして求められる。ここでは、「47-1=46」となる。次に、『要因の自由度』は、因子の水準(地方)の個数から1を引いたものとして求められる。ここでは、「7-1=6」となる。最後に、『残差の自由度』は、『全体の自由度』から『要因の自由度』を引いたものとして求められる。ここでは、「46-6=40」となる。次に、平均平方を求める。平均平方は『平方和』を『自由度』で割ったものとして求められる。なお、最終的な検定に用いるF値は、『要因の平均平方』と『残差の平均平方』の比を用いて検定を行う。よって、ここでは『全体の平均平方』は求めなくても良い。ここでの『要因の平均平方』は、「64/6=10.67」となる。ここでの『残差の平均平方』は、「454/40=11.35」となる。最後に、検定統計量Fを求める。検定統計量Fの算出について、一元配置分散分析では要因の平均平方が「分子」、残差の平均平方が「分母」として求められる。ここでは「10.67/11.35=0.94」となる。以上が、分散分析表の作成手順となる。
ここでの分散分析表作成の解説として、まず、『平方和』を説明する。『要因(群間変動)』と『残差(群内変動)』を求める理由として、『要因(群間変動)』のみでは母集団の平均の違いを正しく考慮できない可能性があるためである。例えば、A群(12, 8, 7)、B群(12, 7, 3, 2)、C群(7, 4, 1, 0)のデータ1と、A群(10, 9, 8)、B群(8, 7, 6, 3)、C群(5, 4, 2, 1)のデータ2があったとする。どちらのデータグループも、各群の平均は、A群9、B群6、C群3で、要因(群間変動)における平方和は62である。しかし、残差(群内変動)における平方和は、データ1では106で、データ2では26である。つまり、データ1の場合は、群内におけるばらつきが大きく、母集団の平均に対する信憑性が低く、よって母平均に違いがあるかは不明である。一方、データ2の場合は、群内におけるばらつきが小さく、よって母集団の平均への信憑性が高く、よって母平均に違いがあるといえそうとなる。このように、母集団の平均の違いを調べる分散分析においては、『要因(群間変動)』のみでは母集団の平均の違いを正しく考慮できない可能性があり、『残差(群内変動)』を求める必要があるといえる。続けて、検定統計量F値を解説する。前述のデータ1とデータ2の例で示した通り、『残差(群内変動)』の平方和は、各群内でのばらつきが大きいほど大きな値となる。ただし、この検定で検討したいことは、『要因(群間変動)』の大きさともいえる。この際に、『要因(群間変動)』の平均平方を『残差(群内変動)』の平均平方で割ることによって比較の指標とすることができる。具体的には、『要因(群間変動)』の平方和が大きく、『残差(群内変動)』の平方和が小さいほど、群間の母平均に違いがあるといえる。ここでのポイントは、分散分析表において『要因(群間変動)』と『残差(群内変動)』の項目が存在するが、その存在理由を理解することといえる。群間ばかりに注目をしていると、群内のばらつきを見落としてしまい、結果的に平均のみを見ていると『差がありそう』と思えるデータでも、実は差がないといった結論にいたることもある。検定をかけることで解決はできるが、データを扱う者として、常にデータ全体を見通すように注意が必要である。

③ コマ主題細目①とコマ主題細目②からの続きとして、検定統計量Fから検定を行う。今回の例では、検定統計量F「0.94」を、自由度(6,40)のF分布を使って検定する。検定を行う際には、F分布表を用いる方法と、エクセル関数を用いる方法があり、どちらも扱えることが望ましい。まず、F分布表では、有意水準5%(危険率0.05)の表を用いる。表の読み方は、第1行に『分母の自由度』、第1列に『分子の自由度』が記載されており、それぞれを作成してある分散分析表との組み合わせで探すことになる。今回の例では、『要因(群間変動)』が分子側となり、自由度は6である。そして、『残差(群内変動)』が分母側となり、自由度は40である。これを組み合わせて検索すると、F値は「2.336」となる。この2.336は、F分布と照らし合わせると棄却域に入っていない。よって、『帰無仮説は棄却されない』という結果となる。つまり、「地方によって『ある飲食チェーン店の日本全国』の数の母平均に差があるとはいえない」と結論づけられる。同様に、今度はエクセル関数を用いる例を説明する。エクセル関数では、まず有意水準5%の値を得るために「=FINV(確率, 自由度1, 自由度2)」を用いる。ここで、『確率』には、今回の有水準5%として「0.05」、『自由度1』には『要因(群間変動)』の自由度として「6」、『自由度2』には『残差(群内変動)』の自由度として「40」を入力する。次に、検定としてp値を得るために、「F.DIST.RT(x, 自由度1, 自由度2)」を用いる。ここで、『x』には、先に計算したF値(この例では0.94)、自由度は上記と同様に入力をする。その結果、p値として「0.48」が得られる。つまり、結果として、有意水準である0.05よりも大きな値となり、「有意水準5%の片側検定において、帰無仮説H 0は棄却されない」という結果になる。つまり「地方によって『ある飲食チェーン店の日本全国』の数の母平均に差があるとはいえない」と結論づけられる。以上が、検定までの説明となる。
ここでの解説として、分散分析における『片側検定』について説明する。分散分析では、『残差(群内変動)』のばらつき(それ以外のズレ)に対する『要因(群間変動)』のばらつき(全体の平均値からの因子の各水準の平均値のズレ)が相対的に大きいかどうかを検定する。つまり、『大きい場合には要因による効果は有意である』と判断され、『小さい場合には要因による効果は有意であるとはいえない』と判断される。よって、要因のばらつきが相対的に大きいかどうかだけを見ればよいので、分散分析では必ず「片側検定」を行うことになる。片側検定と両側検定の関係の詳細は、第24回講義コマ主題細目③とも同様となるため、そちらを参照していただくとする。ここでのポイントは、様々ある統計処理法における検定について、片側検定と両側検定のどちらを用いるべきか(用いなければいけないか)への理解といえる。分散分析では片側検定を用いることとなるが、他の統計検定においては、その選択によって統計検定量が棄却域に入るか入らないかといった、致命的なミスを犯すことに繋がる。よって、学生は、ここでの設定がどのような目的を持って実施されているかを意識すると同時に、最終的な結論として帰無仮説が棄却されたかどうかによる判定までを、文章として適切に示すことまでが必要となる。

キーワード ① 残差 ② 要因 ③ F分布表 ④ エクセル ⑤ 片側検定
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
今回のポイントは、分散分析表の作成と、片側検定と両側検定への理解といえる。エクセルを用いての指定された操作に対し、作業のように実施してしまうと、理解のための操作とは言い難いものになる。そして、誤った仮説の設定を行うと、計算過程が正しかったとしても結論に重大な誤りが生じる可能性がある。そのため、今、自分が何を目的として統計検定を行っているかを常に意識することが必要である。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、分からなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法が分からない場合は、講義中に使用した資料を参照しても良いこととする。今回はエクセルを用いて授業で実施した検定を再度行い、さらに復習課題として配布した資料にも挑戦し、結論を得ることまでを課題とする。

【次コマの予習】
次週は総合演習のため、これまでの課題プリントで分からない箇所はノートにまとめておく。

29 総合演習_1 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回は、全般にわたる演習問題を行い、理解を確実なものにする。
【教材】
(1)コマ用オリジナル資料ワード資料p.1、コマ用オリジナル資料エクセル資料シート1-2
(2)コマ用オリジナル資料ワード資料p.1、コマ用オリジナル資料エクセル資料シート3
(3)コマ用オリジナル資料ワード資料p.2、コマ用オリジナル資料エクセル資料シート4 

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)栗原伸一・丸山敦史(2017)統計学図鑑,オーム社,P4, 42-57、鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 6-9, 15-36, 88-92、日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 2-5, 10-47, 55-58, 61-79, 137-144, 158-168.菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 5-13.  (2)栗原伸一(2021)入門統計学(第2版),オーム社,P. 23-29.

(2) 鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 93-99, 111-126、日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 39-41, 145-152.栗原伸一(2021)入門統計学(第2版),オーム社,P. 31-36. 菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 23-29.

(3)栗原伸一・丸山敦史(2017)統計学図鑑,オーム社,P4, 42-57、鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 139-161, 191-203、日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 164-187.栗原伸一(2021)入門統計学(第2版),オーム社,P. 69-70. 菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 114-127.

なお、標準正規分布、t分布、χ2分布の確率分布表は担当教員が資料を配布する。この確率分布表は、「鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P.125-126, 169, 187」に記載されているものと同様である。F分布表は、担当教員が資料を配布する。この資料は、エクセル関数を用いて担当教員が作成したものである。
コマ主題細目 ① 第一部の総合演習 ② 第二部の総合演習 ③ 第三部の総合演習_1
細目レベル ① 第一部の「統計解析における数値の扱い方の基礎」の中で、特に重要と考えられるものは、データの分布の理解である。実験データや調査結果の数値は、通常ある「広がり」を持って分布する。データの分布は第2回で学んだヒストグラムのようなパターン(図)と、数値(代表値)で表され、認識される。分布のパターンにもさまざまなものがあるが、最も代表的なパターンは、平均値付近にピーク(度数の最大値)があり、その左右に裾野をひく一つ山のパターンである。これは、第二部の第6回の講義における「分布の形」の基礎となった。平均値はデータの集まりの特徴を表す重要な代表値である。しかし、分布を示すことを目的として、平均値の他にもうひとつ重要な代表値がある。それが分散と標準偏差である。ここではその理解を確認する。
② 第二部の「分布の形の理解」の中で、特に重要と考えられるものは、標準正規分布の理解といえる。種類のデータ、身長のデータについて、例えば、A組男子とB組女子の平均値、ばらつき方の指標である標準偏差などは比較ができる。「どちらの平均値が大きい」とか、「ばらつき方はどちらが大きい」ということができる。これに対し、異なる種類のデータのばらつき方の比較や、異なる条件で取ったデータから平均値は、直接比較が困難である。ケースとして、相対的位置を調べる場合である。例えば、1学期の国語の点数と2学期の国語の点数を比較する場合、同じ点数で平均値が同じであっても、順位は異なることがある。そのような比較をする場合に分布の標準化が必要となることがある。これは、期待値を0とし、分散を1とする方法である。この標準化の方法を確認する。
③ 第三部の「推計統計学の理解」の中で、特に重要と考えられるものは、標準正規分布による解析とt分布による解析といえる。ここでは、標準正規分布による解析から確認する。正規分布しているデータを標準化する際には、z = (x−μ)/σで計算できる。例えば、A組の学生の身長 (x)は、平均160 cm (μ) 、標準偏差10 cm (σ)の正規分布をするとする。この分布において身長が180 cm以下である確率はいくらかを求めようとした場合、PCを用いなくとも、暗算程度の計算と、標準正規分布表によって確率を求めることができる。つまり、P (z ≦ (180 – 160)/10)となり、P (z ≦ 2)となる。この状態から、標準正規分布表を用いて、z ≦ 2を読み取ればよい。つまり、0.9772となる。ここでのポイントは、標準正規分布表の読み取り間違えを起こさないように、データをよく理解することと言える。標準正規分布表の場合、z ≦ Aとz ≧ Aの表がある。不等号の向きで間違えることはないが、稀に読み間違えることもある。しかし、その際にも、冷静に問題を確認することで、誤解答を防ぐことができる。例えば、身長について平均160 cm、標準偏差 10 cmの集団にあって、180 cm以下である確率は、おおよそ大きな確率であると予想できるだろう。このように、常に問題にも意識して、得られた結果が適切なものかを考えることも必要である。このように、計算は当然として、読み違えなどを起こさずに標準正規分布を使用できているかについて確認する。
キーワード ① 分布 ② 正規分布 ③ 二項分布 ④ 標準正規分布 ⑤ 標準正規分布表
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
まとめと演習ではあるため、重要箇所の演習問題を多くこなすこととなる。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、わからなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法がわからない場合は、講義中に使用した資料を参照しても良いこととする。

【次コマの予習】
なし。

30 総合演習_2 科目の中での位置付け 本講義では、数値解析の基礎となる次の4項目について講義と演習を行う。具体的には、第1回の講義から第8回までの講義にかけては、統計解析における数値の扱い方の基礎の理解とデータ要約の手法の理解を目的として展開される(第一部)。第9回の講義から第14回までの講義にかけては、分布の形の理解として、代表的な分布である二項分布および正規分布を扱って説明し、統計処理の基礎を習得することを目的として展開される(第二部)。第15回の講義から第22回までの講義にかけては、推計統計学の理解として、母平均の推定について学ぶ(第三部)。第23回の講義から第28回までの講義にかけては、複数のデータの分析方法を習得することを目的として展開される(第四部)。第29回と第30回の講義では、これまでの学びのまとめとして、第一部から第四部までの学びにおける重要箇所に重きをおいて、ここまでの学びの最終確認のための総合演習を実施する。今回は、全般にわたる演習問題を行い、理解を確実なものにする。
【教材】
(1)コマ用オリジナル資料ワード資料p.3、コマ用オリジナル資料エクセル資料シート5
(2)コマ用オリジナル資料ワード資料p.3、コマ用オリジナル資料エクセル資料シート6
(3)コマ用オリジナル資料ワード資料p.4、コマ用オリジナル資料エクセル資料シート7 

なお、教員が配布するコマ用オリジナル資料_問題は、(1)から(3)について適宜練習問題あるいは復習課題として使用する。

【教具】
PC

【教材・講義レジュメとコマ主題細目との対応】
主題細目① 教材(1)「コマ用オリジナル資料」
主題細目② 教材(2)「コマ用オリジナル資料」
主題細目③ 教材(3)「コマ用オリジナル資料」

【参考】
(1)栗原伸一・丸山敦史(2017)統計学図鑑,オーム社,P4, 42-57、鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 139-161, 191-203、日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 164-187.栗原伸一(2021)入門統計学(第2版),オーム社,P. 69-70. 菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 114-127.

(2)小林克己 (2015)毒性試験による統計解析,薬事日報社,P. 59-62, 104-109、鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 173-190, 213-219, 239-246、日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 8-9, 81-93. 菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 246-260, 270-280, 370-375. 栗原伸一(2021)入門統計学(第2版),オーム社,P. 104-109, 231-253.

(3)小林克己 (2015)毒性試験による統計解析,薬事日報社,P. 59-62, 104-109、鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P. 173-190, 213-219, 239-246、日本統計学会編(2020)改訂版 日本統計学会公式認定 統計検定3級対応 データの分析,東京図書株式会社,P. 8-9, 81-93. 菅 民郎(2020)Excelで学ぶ統計解析入門,オーム社,P. 246-260, 270-280, 370-375. 栗原伸一(2021)入門統計学(第2版),オーム社,P. 104-109, 231-253.

なお、標準正規分布、t分布、χ2分布の確率分布表は担当教員が資料を配布する。この確率分布表は、「鳥居泰彦(1994)はじめての統計学,日本経済新聞出版社,P.125-126, 169, 187」に記載されているものと同様である。F分布表は、担当教員が資料を配布する。この資料は、エクセル関数を用いて担当教員が作成したものである。
コマ主題細目 ① 第三部の総合演習_2 ② 第四部の総合演習_1 ③ 第四部の総合演習_2
細目レベル ① 第三部の「推計統計学の理解」の中で、特に重要と考えられるものは、標準正規分布による解析とt分布による解析といえる。ここでは、t分布による解析について確認する。第二部までに、母分散(母標準偏差)が既知の場合に、標本平均から母平均の区間推定を行う方法と手順を説明した。しかし、一般には母分散σ^2(母標準偏差σ)は既知ではない。そこで標本から得られる標本分散s^2(標本標準偏差s)を使って母平均μを求めることにする。これまで見てきた通り、z = ((Xの上にバー)−μ) / σ√nの確率変数zは標準正規分布に従う。このσを標本標準偏差sに置き換えると新しい確率変数が得られるが、これをTとする。つまり、T = ((Xの上にバー)−μ) / s / √nとなる。この変数の分布は正規分布ではなく「t分布」に従うことがわかっている。この式から分かる通り、正規分布とt分布はよく似ている。両者の使い分けも含めて、t分布について理解を確認する。
② 第四部の「複数のデータの分析方法」の中で、特に重要と考えられるものは、χ2検定と分散分析の理解といえる。ここでは、χ2検定から確認する。χ2検定は別名「独立性の検定」とも呼ばれる。独立という言葉はやや難しいが、「独立である=関係がない」「独立でない=何か関係性がある」と解釈すると、理解しやすいように思う。χ2検定では、以下のステップを踏んで検定を行う。まず、『データをクロス集計表にまとめる』。2番目に、『検定について、帰無仮説と対立仮説を設定する』。3番目に、『期待度数(もし関係が無かったら、きっとこうなるだろうという回数)を求める』。4番目に『データと期待度数との差を求める(この差が大きければ、関係ありとみなせそうである)』。5番目に『χ2値を計算によって求める』。6番目に『得られたχ2値をp値に変換する』。最後に『得られたp値を解釈し、結論づける』という流れである。実際に各自がデータを得た場合を想定し、この分析の流れをおさえる。ここでのポイントは、計算の流れの理解といえる。データについて、クロス集計表によって集計してから、期待度数を計算するなど作業を進めることになる。χ2検定といった統計処理も行うが、データの取りまとめから専用の表によるまとめ方が存在することを理解できているかを確認する。
③ 第四部の「複数のデータの分析方法」の中で、特に重要と考えられるものは、χ2検定と分散分析の理解といえる。ここでは、分散分析の理解を確認する。分散分析を行う際に、「分散分析表」の作成を行う。分散分析表とは、「因子」、「平方和」、「自由度」、「平均平方」、「F値」の列に、「要因」、「残差」、「全体」の値を記入する表である。「平方和」の列にはズレの二乗和の値が入ることになる。・「要因」には「データ全体の平均値からの因子の各水準の平均値のズレ」、・「残差」には「それ以外のズレ」、・「全体」には「データ全体の平均値からの各データのズレ」が入る。次に自由度を求める。・「全体の自由度」では全てのデータの個数から1を引いたもの、・「要因の自由度」では因子の水準(地方)の個数から1を引いたもの、・「残差の自由度」では「全体の自由度」から「要因の自由度」を引いたものとする。次に平均平方を求める。平均平方は「平方和」を「自由度」で割ったもので「要因」と「残差」のみを求める。最後に、統計量Fを「要因の平均平方 / 残差の平均平方」によって求める。得られた統計量Fは、F分布表を用いて棄却域に入っているかを確認する。これによって、帰無仮説が棄却されるかを判断し、結論づける。この流れを、問題を解きながら確認する。
キーワード ① 区間推定 ② 検定 ③ ノンパラメトリック ④ 分散分析 ⑤ t 検定
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト
復習・予習課題 【本コマの復習】
まとめと演習ではあるため、重要箇所の演習問題を多くこなすこととなる。統計処理法を学ぶにおいて、反復練習は最も重要と言える。これは、理解を深めると同時に、統計処理に慣れることができるためである。講義中は、一度説明をした後に各自が練習問題を解き、その後に講義担当教員が解答や解説を示す。しかし、わからなかった問題について、聞いて納得したつもりでも、いざ自分で解こうとすると、必ずしも解けるとは限らない。このようなことを防ぐために、練習問題のプリントを配布する。これを、各自が自宅もしくは大学での空きコマ中に自力で解答することで、真の意味で理解できたといえる。よって、配布した練習問題を自力で解くこととする。ただし、解法がわからない場合は、講義中に使用した資料を参照しても良いこととする。

【次コマの予習】
なし。

履修判定指標
履修指標履修指標の水準キーワード配点関連回
データの基礎知識 与えられたデータについて、そのタイプの違いを判断し、正しく分類することができるかについて、設問によって確認する。「質的変数」とは、いくつかに分類されたものの中から1つのカテゴリを取る変数である。つまり、性別や、大学での成績評価が該当する。この中でも、カテゴリ間に順序関係がないものを「名義尺度」と呼び、順序関係があるものを「順序尺度」と呼ぶ。「量的変数」とは、数値で与えられる変数である。つまり、身長や、距離などがあげられる。 質的変数、量的変数、離散変数、連続変数 30 1, 2, 29, 30
代表的な統計量 与えられたデータについて、代表的な統計量である、「平均」、「分散」、「標準偏差」を計算できるかについて、設問によって確認する。分散と標準偏差について、これらは、与えられたデータがどのようにして得られたデータなのかによって、「母分散」もしくは「標本分散」、「母標準偏差」もしくは「標本標準偏差」に計算方法が分かれる。データを読み取る力とともに、計算方法の扱い方の理解が確実なものかについて、確認をする。 平均、分散、標準偏差 3, 4, 29, 30
5数要約を用いたデータの要約 データを与えられた際に、数量を順位で4等分し、5数要約を用いて示すことができるかについて、設問を用いて確認する。四分位数で表現する際には、第0四分位数、第1四分位数、第2四分位数、第3四分位数、第4四分位数として示される。第0四分位数は、すなわち最小値である。第1四分位数とは、データが100個あった場合に、小さい順に25番目にあるものを探すような作業である。これにより、データの分布が予想できる。また、この方法を用いて「箱ひげ図」も描くことができる。つまり、「ひげ」の端で第0四分位数(または最小値)と第4四分位数(または最大値)を表し、「箱」の両端で第1四分位数と第3四分位数を表す。そして、「箱」の中に「1本の縦線」が引かれているが、これが第2四分位数(または中央値)を表す。また、上記の定義に基づくと、「ひげ」の両端の間の長さは最小値から最大値の「範囲」を示しており、「箱」の長さが四分位範囲を示していることが分かる。以上について、名称およびグラフの特徴を理解できているかを確認する。 四分位数、箱ひげ図、統計グラフ 1, 2, 3, 4, 5, 6, 29, 30
二項分布と正規分布 二項分布、正規分布、それぞれの期待値、分散を理解し、これらの分布の計算、統計分布表を利用できるかについて、設問によって確認する。正規分布は平均値であるμにピークをもち、x=μに関して対称な形をしている。μは正規分布x: N (μ,σ^2)にしたがう確率変数xの平均値、すなわちxの期待値に等しいことがわかる。一方、σ^2を大きくすると、ピークの値は下がり、分布の形は広がる。これらについて理解できていることを確認する。なお、理論式は問題用紙に記載してあるため、暗記する必要はないものとする。 二項分布、正規分布、期待値 70 7, 8, 9, 10, 11, 12, 29, 30
母平均の区間推定 正規分布の標準化、標準正規分布計算ができ、確率密度の関係を理解しているかについて、設問によって確認する。第6回の講義において、例えば、身長が「173.5 cm である確率」という表現は意味をなさず、「173.25≦身長≦173.34である確率」、というように、対象となるデータ群から注目する値の両側にある幅を持った範囲に選びだす確率、ということが意味を持つことを学んだ。また、正規分布の標準化の計算および、得られる結論への解釈が確かなものかを確認する。 母平均、区間推定、標準正規分布 13, 14, 15, 16, 17, 18, 29, 30
パラメトリック検定 t検定について理解し、t分布のパーセント点計算ができるかについて、設問によって確認する。t検定の手順は、次の通りとなる。1. 帰無仮説「2組のデータの平均に差はない(平均値の差は0)」を設定する。2. 2組のデータから統計検定量t0を計算する。3. 有意水準aを0.05 (5%)とするとき、1−a / 2 = 0.975及び、自由度m+n−2を求め、パーセント点 a を計算する。4. aとt0を比較して帰無仮説の採択/棄却を決める。(t0 > a 有意差有、t0 < a 有意差無となる)。パーセント点による判定と同じことではあるが、検定の場合はa値のかわりに|t0 |> aの確率p値(すなわち分布両端±aより外側の部分の面積)を使うことが多い。その場合2,3では、両側検定の場合、a≦ p のとき仮説棄却、すなわち有意差有りとする。これらについて理解できていることを確認する。 平均値の差、検定、t 分布、帰無仮説、対立 仮説 19, 20, 21, 22, 29, 30
ノンパラメトリック検定 ウィルコクソンの順位和検定あるいはウィルコクソンの符号順位和検定について理解し、与えられた2群のデータ間に有意差があるかを調べることができるかについて、設問によって確認する。この2つの検定手法の違いは、データに対応があるのかないのかによるものである。しかし、検定統計量の計算方法は異なることに加え、検定表も異なる。よって、得られる結果も異なる。ここでは、データの性質を正しく理解できているかに加え、ふさわしい検定方法と計算を実施し、結果を得られるかを評価する。 中央値、外れ値、U 検定 23, 24, 25, 26, 29, 30
分散分析 複数の処理条件をもつデータにおいて、要因が結果に影響を与えたかを検定できる。分散分析を行う際に、「分散分析表」の作成を行う。分散分析表とは、「因子」、「平方和」、「自由度」、「平均平方」、「F値」の列に、「要因」、「残差」、「全体」の値を記入する表である。「平方和」の列にはズレの二乗和の値が入ることになる。・「要因」には「データ全体の平均値からの因子の各水準の平均値のズレ」、・「残差」には「それ以外のズレ」、・「全体」には「データ全体の平均値からの各データのズレ」が入る。次に自由度を求める。・「全体の自由度」では全てのデータの個数から1を引いたもの、・「要因の自由度」では因子の水準(地方)の個数から1を引いたもの、・「残差の自由度」では「全体の自由度」から「要因の自由度」を引いたものとする。次に平均平方を求める。平均平方は「平方和」を「自由度」で割ったもので「要因」と「残差」のみを求める。最後に、統計量Fを「要因の平均平方 / 残差の平均平方」によって求める。得られた統計量Fは、F分布表を用いて棄却域に入っているかを確認する。これによって、帰無仮説が棄却されるかを判断し、結論づける。この流れを理解できていることを確認する。 ズレ, 要因, 残差, 分散 分析表 27, 28, 29, 30
クロス集計表 2変量のデータが与えられた際に、正しくクロス集計表に記述することができることを確認する。調査において複数の項目を同時に調査する場合が多い。このときに、質的変数について、単純に1つの項目を集計して各カテゴリの出現度数を調べるだけではなく、いくつかの調査項目を組み合わせて集計し、カテゴリの組合せの出現度数を検討することが多い。このような複数の項目を組合せて、クロス集計表を作成することができることを確認する。 クロス集計表、χ2(カ イ二乗)検定、期待度数 25, 26, 29, 39
評価方法 期末試験(100%)により行う。
評価基準 評語
    学習目標をほぼ完全に達成している・・・・・・・・・・・・・ S (100~90点)
    学習目標を相応に達成している・・・・・・・・・・・・・・・ A (89~80点)
    学習目標を相応に達成しているが不十分な点がある・・・・・・ B (79~70点)
    学習目標の最低限は満たしている・・・・・・・・・・・・・・ C (69~60点)
    学習目標の最低限を満たしていない・・・・・・・・・・・・・ D (60点未満)
教科書 特に既成の教科書は使わない。講義ノートをプリントし配布する。
参考文献 栗原伸一(2021)「入門統計学(第2版): 検定から多変量解析・実験計画法・ベイズ統計学まで」オーム社 ¥2,860(ISBN 978-4274227387)栗原伸一・丸山敦史(2017)「統計学図鑑」オーム社 ¥2,500(ISBN978-4-274-22082-7)、小林克己(2015)「毒性試験に用いる統計解析 2015」薬事日報社 ¥ 3,740(ISBN978-4-8408-1291-7)、菅 民郎(2019)「Excelで学ぶ統計解析入門―Excel 2019/2016対応版」オーム社 ¥3,190(ISBN 978-4-274226410)、鳥居泰彦(1994)「はじめての統計学」日本経済新聞出版社 ¥2,233(ISBN978-4-532- 13-74-9)、日本統計学会編(2020)「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」東京図書株式会社 ¥2,200 (ISBN978-4-489-02332-3)、丹羽勝市(2009)「図解雑学 統計解析」 ナツメ社 ¥1,300(ISBN978-4-8163-3472-6)
実験・実習・教材費 特になし