区分 専門基礎科目-健康と生活支援
ディプロマ・ポリシーとの関係
実践能力 倫理観 専門性探求
地域社会貢献 グローバル性 自己研鑽力
カリキュラム・ポリシーとの関係
豊かな人間性 広い視野 知識・技術
判断力 探求心
カリキュラム全体の中でのこの科目の位置づけ
看護に必要な統計学の基本的な知識を学ぶ
科目の目的
統計学は、多くの学生が苦手意識を持ってしまう科目であるが、この統計学の授業では、様々な統計の概念の習得に焦点を当て、統計的なものの見方をできるようになることが目標です。この目標のために、統計の問題を実際にやりながら学習します。実際にやってみることは、新しい情報を習得する上で最も効果的な学習方法の一つです。さらに、統計学の最も基礎的な変数の概念や確率、確率分布から学習し始めることによって、その後学習するχ2乗検定、t検定、相関、ANOVAなど比較的高度な知識が必要な概念を理解しやすくする。また、医療に関係の深いスクリーニングテストの敏感度や特異度が、ある特定の病気の有病率とどのような関係があるのかを学びます。さらにこの授業では表や図、χ2乗検定、t検定、相関などの解析を行いながら、データを扱いながら学習することで、さらに統計学に興味を持ってもらい、生活の中や看護師として働き始めたあとにも役立ててもらう目的があります。
到達目標
1. データの要約と可視化、Rの基本操作の習得
2. 確率の基礎概念と主要な確率分布の理解
3. 推測統計の基礎概念(推定・仮説検定・標本抽出)の理解と適用
4. 主要な統計解析手法の習得と実践
5. 再現可能なレポート作成能力

科目の概要
この統計学の授業では、様々な統計の概念の習得に焦点を当て、統計的なものの見方をできるようになることが目標です。統計学の最も基礎的な概念である、記述統計、確率、確率分布などから学習し始めます。さらに後半に入ると比較的高度な知識が必要な、二項分布、正規分布、無作為抽出と標本分布、推定、研究デザイン、カイ2乗検定、t検定、相関などを学習します。授業中は統計の概念を学習するだけでなく、統計ソフトでデータを使って、様々な問題を解くことによって学習内容の習得を目指します。授業中に分からないことがあればLiveQを使って、科目担当教員に気軽に質問することも奨励します。また、講義内容で分からいことがあれば担当教員のオフィスアワーまたはアポイントメントを取って、わからない箇所に関して質問し、講義内容を全て習得するようにしましょう。
科目のキーワード
記述統計、確率、確率分布、無作為抽出、カイ2乗検定、t検定、相関、ANOVA
授業の展開方法
各トピックにおいて、まず統計学的コンセプトを理解することに重点を置きます。例えば、確率の基礎や主要な確率分布を学び、次にRで単純な可視化と要約を素早く試すことで、学んだ概念の理解を深めます。具体的には、要約統計量の計算(平均、中央値、分散、IQR)や、ヒストグラム、箱ひげ図、散布図によるデータ可視化を反復します。また、データ分析の過程と結果を「伝える」能力として、R Markdown (.Rmd) を用いたレポート作成を重視します。説明文、数式、Rコード、図表をひとつのファイルに統合し、HTML/PDF/Word形式で出力する演習を継続的に行います。これにより、分析の再現性を確保し、共同作業や報告の際の生産性と信頼性を高めることを目指します。
オフィス・アワー
月曜日・火曜日13:00-14:00
科目コード BG01
学年・期 1年・後期
科目名 統計学
単位数 2
授業形態 講義
必修・選択 必修
学習時間 【授業】30h 【予習・復習】60h
前提とする科目 コンピュータ基礎・情報処理法が前提となる
展開科目 各看護学へ展開する
関連資格 看護師,保健師,養護教諭
担当教員名 正司孝太郎
主題コマシラバス項目内容教材・教具
1 統計学の易しい第一歩 科目の中での位置付け この講義は、データに基づいた意思決定を支える統計学を学ぶための導入として位置づけられています。この講義がRを使ったデータ分析の「やさしい第一歩」となることを目指しており、統計学の最大の敵である「不確実性」を理解し、その不確かさを定量化する技術を習得することの重要性を強調しています。具体的には、統計学を学ぶことで不確実性を「飼いならす」技術、科学・データサイエンスの土台、データに「だまされない」リテラシー、キャリア上のメリット、実生活の問いに「現実解」を出す能力が身につくとされています。
この講義では、今後の学習で必要となるRおよびRStudioという無料の計算環境と統合開発環境の基本的な使い方から、データ収集・分析・解釈のプロセス、さらには再現可能なレポート作成の重要性まで、広範な基礎が紹介されます。単なる知識の羅列ではなく、「とりあえず手を動かしながら」学ぶことを重視しており、コンセプトの理解、Rでの実践、結果の検証、そして伝達という一連の学習サイクルが提示されています。このため、本講義は統計学の全体像と学習アプローチ、そして実践的な環境構築という、学習の根幹をなす部分を担っています。

講義用パワーポイント
講義資料Chapter 1
コマ主題細目 ① データ分析と統計的思考の基礎概念の理解 ② RおよびRStudio(Posit Cloud)を用いたデータ分析環境の構築と基本操作 ③ 記述統計とデータの可視化の導入
細目レベル ① データ分析と統計的思考の基礎概念の理解 このテーマでは、統計学が不確実性(uncertainty)を定量化し、データ収集・分析・解釈を通じて意思決定を支える学問であるという核心的なコンセプトを理解します。「不確かな知識」と「その不確かさの量の把握」が「使える知識」となるというC. R. Raoの言葉を通じて、結論の不確かさを定量化することの重要性を認識します。また、統計学がデータサイエンスや機械学習の基礎体力であり、データに「だまされない」リテラシーを身につけるための強力なツールであるという学習意義を深く掘り下げます。さらに、「統計は何でも証明できる?」や「直感で十分?」といった誤解に対する先回りを読み、方法の健全性と不確かさの開示が説得力のあるデータ分析に不可欠であることを学びます。具体的な学習方法としては、まずこれらのコンセプトを熟読し、なぜ統計学を学ぶのか、何ができるようになるのかといった問いに対する理解を深めます。
② RおよびRStudio(Posit Cloud)を用いたデータ分析環境の構築と基本操作 このテーマでは、Rという無料の計算環境と、その統合開発環境であるRStudioの基本的な使い方を習得します。特に、Posit Cloud(旧 RStudio Cloud)というオンライン版RStudioを用いて、無料アカウントの作成、最初のRStudio Projectの作成、データのアップロード、R Markdown(.Rmd)によるHTMLレポートの生成までを体験します。このプロセスを通じて、RStudioの4ペイン(Source, Console, Environment/History, Files/Plots/Packages/Help)の役割を理解し、コードの編集、実行、結果の表示、パッケージ管理、ヘルプの使用(help()や?関数名)といったRの「超基本操作」を身につけます。また、コマンドをコンソールに直接入力するのではなく、**.RやR Markdownファイルに保存して再実行可能な形にする「スクリプト運用」**の重要性を学び、R Markdownを使って説明文・数式・Rコード・図を一つのファイルにまとめて「再現可能なレポート」を作成する実践的なスキルを習得します。
③ 記述統計とデータの可視化の導入 このテーマでは、データの全体像を把握するための最も基本的な手法である記述統計量と可視化を学びます。具体的には、平均・中央値・分散といった「要約統計量」の意味と計算の目的を理解します。そして、ヒストグラムや箱ひげ図といったグラフを用いてデータを視覚的に表現し、その分布や特徴を捉える方法を学習します。Rではこれらの可視化と要約を素早く実行できるため、章末のミニ演習A(要約と図)を通じて、午前と午後の提供時間の仮データについて中央値と箱ひげ図を使って「どちらが速いか」を実際に確かめる実践を行います。この「試す」ステップを通じて、理論的なコンセプトがRでの具体的な操作とどのように結びつくかを体験し、データの見方を直感的に養うことが学習の主眼となります。
キーワード ① 不確実性 ② R/Rstudio/Posit Cloud ③ R Markdown ④ 再現性 ⑤ 要約統計量と可視化
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 予習として、まず「はじめに」から「なぜ統計学を学ぶの?」までの部分を読み込み、統計学がどのような学問であり、なぜその学習が重要なのかという大局的な理解を深めることが推奨されます。これにより、学習へのモチベーションと方向性を明確にできます。特に、**「この本で学べること(ゴール)」と「この本の進め方」**の項目を事前に確認することで、本章と今後の学習内容の全体像を把握し、自身の学習目標と照らし合わせることができます。また、RStudioの統合開発環境としての機能やPosit Cloudでのアカウント作成とプロジェクト立ち上げに関する説明に目を通し、可能であればブラウザでPosit Cloudにアクセスして無料アカウントを作成し、RStudio IDEが起動するまでを試しておくと、本番の学習がスムーズに進められるでしょう。
復習としては、章の終わりに用意されている演習問題に必ず取り組み、要約統計量と可視化の基本的なR操作、および確率の感覚を実際に手を動かして定着させることが重要です。特に、R Markdown(.Rmd)を用いて「本文+コード+図」を一体化した再現可能なレポート**を作成する練習を積極的に行いましょう。

2 Rのはじめかたと記述統計の基礎(実践編) 科目の中での位置付け この講義は、「Rのはじめかたと記述統計の基礎(実践編)」と題されており、Rを用いたデータ分析の「やさしい第一歩」を実践的に踏み出すための章として位置づけられています。前回示された統計学の全体像と学習の進め方を踏まえ、ここでは特にRとRStudioという具体的な計算環境での「手を動かす」学習に焦点を当てています。統計学の最大の敵である「不確実性」を定量化する技術を習得するためには、まずデータそのものの性質を理解し、適切に要約・可視化する能力が不可欠です。
この講義は、統計学を学ぶ上での基礎体力を養う役割を担っており、データサイエンスや機械学習の土台となるRの基本操作から、データの種類と尺度、そして代表値や散らばりといった記述統計の核心概念を扱います。単に知識を羅列するのではなく、R Markdownを用いた再現可能なレポート作成の重要性を初期段階から強調することで、実践的なスキルと倫理的なデータ分析の姿勢を同時に育むことを目指しています。これにより、データに「だまされない」リテラシーを身につけ、将来的に複雑な統計解析や意思決定を行うための堅固な基盤を築くことができます。

講義用パワーポイント
講義資料Chapter 2
コマ主題細目 ① RおよびRStudioの基本操作と開発環境の理解 ② Rにおけるデータ型・データ構造の基礎とデータの読み込み ③ 記述統計の基礎概念(代表値、散らばり、分布の形状)と基本的な可視化手法
細目レベル ① RおよびRStudioの基本操作と開発環境の理解 このテーマでは、無料の計算環境Rとその統合開発環境であるRStudioの基本的な使い方を深く掘り下げて学習します。具体的には、コードチャンクの挿入(Ctrl + Alt + I)と実行(Ctrl + Enter)、スクリプト(.R)やR Markdown(.Rmd)ファイルにコードを保存し、再現可能な形で運用することの重要性を学びます。RStudioの4ペイン(Source, Console, Environment/History, Files/Plots/Packages/Help)の役割を理解し、それぞれを効果的に使うことで、データ分析のワークフローを効率化します。また、help()関数や?演算子を使った関数のヘルプ参照方法を習得し、自力で問題を解決する能力を養います。章の冒頭で「とりあえず手を動かしながら」学ぶことが強調されており、コマンドを直接コンソールに打ち込むだけでなく、スクリプトファイルに保存しながら学習を進める実践的なアプローチが推奨されています。
② Rにおけるデータ型・データ構造の基礎とデータの読み込み このテーマでは、Rで扱うデータの基本的な「かたち」を理解します。具体的には、ベクトル、行列、データフレーム、因子(カテゴリ変数)、リストといった主要なオブジェクトの種類とそれぞれの特徴を学習します。特に、日常の分析で最も多く使用されるデータフレームに焦点を当て、列参照($)や条件抽出(&, |, ==)などの基本操作を習得します。データの種類(カテゴリーデータと数値データ)と尺度(名目、順序、間隔、比率)を区別する能力を養うことも重要です。CSVファイルの読み込みにはread.csv()関数を使用し、データを読み込んだ直後にhead(), str(), summary()の「3点セット」で中身を素早く把握する習慣を身につけます。これにより、データ分析の初期段階でデータの構造や潜在的な問題(欠損値など)を効率的に特定できるようになります。
③ 記述統計の基礎概念(代表値、散らばり、分布の形状)と基本的な可視化手法 このテーマでは、データの全体像を把握するための基本的な統計量と可視化手法を学びます。平均値、中央値、最頻値といった代表値の意味と、それぞれが外れ値に対してどの程度頑健であるかを理解します。また、**範囲、分散、標準偏差、四分位範囲(IQR)**などの散らばりを表す指標を学習し、データがどの程度ばらついているかを定量的に評価できるようになります。さらに、**歪度(skewness)と尖度(kurtosis)**を通じて、データの分布の形状を直感的に捉える方法を学びます。これらの統計量を計算するだけでなく、**ヒストグラムや箱ひげ図(boxplot)**といったグラフを用いてデータを視覚的に表現し、中心、散らばり、歪み、外れ値といった特徴を一度に把握するスキルを習得します。特に箱ひげ図は、中央値、四分位範囲、ひげ、外れ値から構成されることを理解し、グラフから多様な情報を読み取れるようになることが目標です。
キーワード ① R / Rstudio ② R Markdown ③ 記述統計 ④ データフレーム ⑤ 箱ひげ図
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 予習として、まず前章(Chapter1.md)で学んだRとRStudioの基本的な概念やPosit Cloudでの環境構築について再確認することが重要です。本講義は「実践編」と位置づけられているため、Rの基本的な操作環境が整っている前提で学習が進みます。可能であれば、Posit CloudにログインしてRStudio IDEが起動することを確認し、簡単なRスクリプト(例: 1+1)を実行して環境が正しく機能しているかを試しておくと良いでしょう。また、講義資料の冒頭部分を読み、Rの基本データ型やデータの種類と尺度に関する説明に目を通しておくことで、講義や自習中の理解がスムーズになります。特に、記述統計の概念(平均、分散など)は以前の学習で触れたことがある場合も、この章でRでの実装方法を学ぶ前に、その定義と意味を再確認することが推奨されます。
復習としては、章の最後に用意されている演習問題に必ず取り組むことが最も重要です。Rコンソールとスクリプトの違いや、作業ディレクトリの重要性、データ型・データ構造に関するハンズオン問題を通じて、Rの基本操作と思考プロセスを体に染み込ませます。特に、head(), str(), summary()の「3点セット」をデータを読み込むたびに実行する習慣をつけ、データの中身を素早く把握できるようにします。また、R Markdown(.Rmd)を使って記述統計の結果やグラフをまとめたレポートを作成する練習を積極的に行い、コード、出力、説明文を一体化させる「再現可能な分析」のスキルを定着させます。コードチャンクに#を用いたメモを残す練習も、他の人がコードを理解する際や、自分であとから見返したときに役立ちます。

3 確率Ⅰ 科目の中での位置付け 講義資料Chapter3の前半部分で構成される「確率Ⅰ」は、データに基づいた意思決定を支える統計学を学ぶ上での根本的な概念的基盤を築く章として位置づけられます。本書の「はじめに」では、統計学の最大の敵は「不確実性(uncertainty)」であり、その不確かさを定量化する技術を習得することの重要性が強調されていますが、本章はまさにその技術の土台となる「確率の解釈」から始まります。第一回目の講義で示された学習目標の一つである「確率の基礎:主観確率と客観確率、事象の和・積、確率をもとにした考え方」 を具体的に深掘りする役割を担っています。特に、Rを使ったコイントスシミュレーションを通じて、相対頻度としての確率が理論値に収束する様子を体験的に学ぶことで、抽象的な確率の概念を直感的に理解できるよう促しています。これは、後の推測統計、仮説検定、区間推定といったより高度な内容を理解するために不可欠な「確率的思考」を養う上で、極めて重要な導入部分となります。
講義用パワーポイント
講義資料Chapter 3
コマ主題細目 ① 確率の基本的な解釈(主観確率と客観確率)の理解とシミュレーションによる体験 ② 標本空間と事象の定義、および集合演算(和、積、補集合)の習得 ③ 確率の公理と基本的な法則(余事象の法則、加法定理)の理解と適用
細目レベル ① 確率の基本的な解釈(主観確率と客観確率)の理解とシミュレーションによる体験 このテーマでは、主観確率(専門家の知見や過去情報に基づく確信度)と客観(相対頻度)確率(同一条件での試行を多く繰り返した際の長期的な相対頻度の極限)という、確率の二つの主要な解釈を概念的に理解します。特に、客観確率については、Rを使ったコイントスシミュレーションを通じて学習を深めます。具体的には、replicate()関数などを用いてコイン投げの試行回数(n)を変えながら「表の累積比率」がどのように変化するかを図で観察します。試行回数が少ない場合は比率が大きく変動するものの、nを大きくするにつれて理論上の確率である0.5に収束していく様子を目視で確認することで、相対頻度としての確率の直感的理解と、大数の法則の基礎となる感覚を養います。これにより、単なる定義の暗記ではなく、確率が現実世界の事象にどのように現れるかを体験的に学び、今後の統計的推測の基礎となる直観を培います。
② 標本空間と事象の定義、および集合演算(和、積、補集合)の習得 このテーマでは、確率論の言語である標本空間(起こりうる全ての事象の集合)、事象(標本空間の一部)、和事象(AまたはB)、積事象(AかつB)、互いに排反(排反事象)(共通の事象がない)、余事象(Aではない事象)といった概念を正確に習得します。具体的な学習方法としては、六面体のサイコロの目を例に挙げながら、これらの概念の定義を理解します。さらに、VennDiagramパッケージなどを用いてベン図を作成し、視覚的に事象間の関係性を把握します。Rの集合演算機能(例:union(), intersect(), setdiff())を実際に用いて、和事象、積事象、余事象の要素をプログラムで確認することで、理論的な集合論の概念とRでの実践を結びつけ、理解を定着させます。これにより、確率の問題を解く上で不可欠な「事象の特定と操作」のスキルと、集合論的な思考力を身につけます。
③ 確率の公理と基本的な法則(余事象の法則、加法定理)の理解と適用 このテーマでは、確率を計算するための基本的なルールである確率の公理(全事象の確率は1、事象の確率は0から1、排反事象の加法性)を学びます。そして、これらの公理から導かれる余事象の法則($P(\bar{A}) = 1 - P(A)$)と加法定理($P(A\cup{B}) = P(A) + P(B) - P(A\cap{B})$)を理解します。学習方法としては、六面体のサイコロの例題を通じて、これらの法則がどのように具体的な確率計算に適用されるかをRで検証します。手計算で理論値を求め、その後Rでその計算を再現することで、法則の理解を深め、確率の計算における正確性を高めます。これにより、単純な事象の確率だけでなく、複数の事象が関連する場合の確率を適切に導き出すための基礎的な数学的枠組みを習得し、確率的推論の土台を固めます。
キーワード ① 不確実性(Uncertainty) ② 相対頻度としての確率 ③ 標本空間(Sample Space) ④ 事象と集合演算 ⑤ 確率の公理と加法定理
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 予習として、Chapter1で説明された統計学を学ぶ意義、特に「不確実性を“飼いならす”技術」や「確率的思考の獲得」という全体目標を再確認し、本章がその基礎を築く章であることを認識することが重要です。また、Chapter3の冒頭の「確率の二つの解釈」を読み、主観確率と相対頻度としての確率の概念を概観しておくと良いでしょう。Rでのシミュレーションや集合演算をスムーズに行うために、Chapter1.mdおよびChapter2.mdで習得したRおよびRStudioの基本的な操作(特にコードチャンクの実行、パッケージのインストール・読み込み、Ctrl + Enterでのコード実行)を復習し、Posit Cloudでの作業環境が問題なく稼働することを確認しておくことが推奨されます。
復習としては、コイントスシミュレーションを様々な試行回数で繰り返し実行し、相対頻度が理論確率に収束する「大数の法則」の感覚をRで何度も体験することが最も重要です。サイコロの例題を用いて、標本空間、事象、和事象、積事象、余事象を手計算とRの両方で確認し、ベン図とRの集合演算関数(union(), intersect(), setdiff())を対応付けて理解を深めます。確率の公理とそこから導かれる加法定理、余事象の法則についても、具体的な問題を通じてRで検証し、概念と計算の結びつきを強化します。また、Chapter1で強調されているR Markdown (.Rmd) を用いた再現可能なレポート作成の習慣を維持し、シミュレーション結果や確率計算の過程と考察を一体化させてまとめる練習を行うことが、学習内容の定着と効果的な伝達能力の向上に繋がります。

4 確率Ⅱ 科目の中での位置付け Chapter3の後半部分で構成される「確率Ⅱ」は、「確率Ⅰ」で築かれた確率の概念的基盤の上に立ち、より複雑な確率を正確に計算するための実践的なスキルを習得する章として位置づけられます。特に、数え上げの原理である積の法則、順列、組合せといった組合せ論の基礎を導入することで、膨大な事象の中から特定の条件を満たす「場合の数」を効率的に特定する能力を養います。これは、今後の推測統計学(例えば、Chapter 8の仮説検定 やChapter 12の頻度解析 などで、特定のイベントが発生する確率を評価する際)において、その背景にある確率計算のロジックを深く理解するために不可欠です。Rを用いたこれらの計算の実践を通じて、理論と実装の橋渡しを行い、現実世界における「○○が起こる確率」といった問いに対して、統計学的な「現実解」を導き出す能力を養います。この章で得られる厳密な確率計算の技術は、データサイエンスや機械学習の基礎体力として、モデルの評価やシミュレーションの基盤となり、統計的思考を深化させる上で欠かせない要素となります。
講義用パワーポイント
講義資料Chapter 3
コマ主題細目 ① 確率の基本法則(乗法定理)の応用と多様な確率例題の解法 ② 積の法則(乗法原理)、順列、組合せといった数え上げの原理の習得 ③ Rを用いた順列・組合せ計算の実践と理論値の検証
細目レベル ① 確率の基本法則(乗法定理)の応用と多様な確率例題の解法 このテーマでは、「確率Ⅰ」で学んだ確率の公理と基本法則(特に乗法定理)を、より複雑な確率問題に応用する方法を学習します。具体的には、サイコロを複数回振る、トランプから特定のカードを引く、袋からチェリーを選ぶといった多様な例題を通じて、これらの法則を適用した確率の計算を実践します。特に、「二回サイコロをふって二回とも1が出る確率」や「コイントスを二回して両方共表が出る確率」のような独立事象の積の確率の計算に焦点を当て、乗法定理の理解を深めます。Rを使ってこれらの計算結果を検証し、手計算とプログラムでの結果が一致することを確認することで、確率計算の正確性を高めます。これにより、単一の事象だけでなく、連続して起こる複数の事象の確率を論理的に導き出す能力を養い、複雑な確率的シナリオを分析するための基礎を築きます。
② 積の法則(乗法原理)、順列、組合せといった数え上げの原理の習得 このテーマでは、多くの確率計算の基礎となる数え上げの原理を深く学習します。具体的には、**積の法則(乗法原理)**として「連続するタスクの総数」を計算する方法を理解します。次に、順列(nP_r)については「順序に意味がある選び方」として100メートル競争の例題を、組合せ(nC_r)については「順序を区別しない選び方」としてボール選びの例題を通じて、それぞれの定義、適用場面、そして計算式を習得します。学習方法としては、まずそれぞれの原理の数学的定義と計算式を理解し、その上で例題を解く際に「これは順序が重要か、それとも不要か」といった判断基準を明確にします。これにより、確率問題を解く上で「場合の数」を正確に特定する能力を養い、将来的な確率モデルの構築やデータ分析における基礎的な計数スキルを向上させます。
③ Rを用いた順列・組合せ計算の実践と理論値の検証 このテーマでは、積の法則、順列、組合せの計算をRを使って実践し、その結果が理論値と一致することを検証します。具体的には、factorial()関数などのRの組み込み関数を用いて順列や組合せの計算を行います。例えば、100メートル競争の例題やボール選びの例題について、手計算で求めた「場合の数」とRで算出した結果を比較し、理解を深めます。さらに、これらの数え上げの結果を用いて、特定の確率を計算する演習も行います。この実践的なアプローチを通じて、Rを確率計算の強力なツールとして使いこなすスキルを身につけるとともに、抽象的な数学的概念が具体的なコードとしてどのように表現されるかを体験的に学び、理論と実践のギャップを埋めることを目指します。これにより、複雑な確率計算を効率的かつ正確に実行する能力を確立します。
キーワード ① 乗法定理 ② 積の法則(乗法原理) ③ 順列(Permutation) ④ 組合せ(Combination) ⑤ 場合の数
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 予習として、「確率Ⅰ」で習得した確率の公理と基本法則、特に乗法定理(P(A∩B)=P(A)P(B|A))の概念をしっかり復習しておくことが非常に重要です。これは、本章で扱う順列・組合せが「場合の数」を計算し、それが確率計算の分子・分母となるため、確率の基本ルールがしっかりと身についていることが前提となるからです。Chapter3の「他の確率の例題」の部分を事前に確認し、それぞれの問題でどのような確率のルールが適用されるかを考えておくと、学習がスムーズに進むでしょう。また、Rでの計算に慣れるため、基本的な算術演算や関数の使い方をChapter1およびChapter2で再確認しておくことをお勧めします。
復習としては、本章で学んだ積の法則、順列、組合せの計算方法を、様々な例題(100メートル競争やボール選びなど)を使ってRで繰り返し実践することが不可欠です。それぞれの問題において、「順序が重要か否か」を判断し、適切な計算式(順列または組合せ)を選択できるかを自問自答しながら演習に取り組みます。Rのfactorial()関数などを活用し、手計算で求めた場合の数とRでの計算結果を比較することで、理論的な理解と実践的なスキルの両方を定着させます。また、これらの数え上げの原理を応用して確率を計算する問題にも挑戦し、確率の基本法則との連携を強化します。Chapter1で強調されているR Markdown (.Rmd) を用いた再現可能なレポート作成の練習を継続することで、計算過程や結果、そしてその解釈を一つのレポートにまとめる能力を養い、再現性のあるデータ分析能力を高めることができます。

5 離散型確率分布Ⅰ 科目の中での位置付け 講義資料Chapter4の前半部分で構成される「離散型確率分布Ⅰ」は、データに基づいた意思決定を支える統計学の学習において、不確実性を定量化するための具体的な道具として、最も基本的な「離散型確率分布」を導入する重要な位置づけです。Chapter1で提示された「確率の基礎」を踏まえ、抽象的な確率の概念を、具体的な事象の発生回数をモデル化する「確率分布」へと橋渡しします。特に、ベルヌーイ分布と二項分布は、多くの統計的手法やデータサイエンス、機械学習の基礎となるため、この章でその定義、確率質量関数(pmf)、期待値、分散を深く理解することが求められます。RおよびRStudioという計算環境(Chapter1, Chapter2)を使い、「とりあえず手を動かしながら」pmfやcdfの計算、乱数生成といったRのd/p/q/r系関数の基本操作を習得することは、今後の推測統計や仮説検定(Chapter 8, 9, 11, 12)で統計量の標本分布を理解するための不可欠な基礎体力となります。この学習は、データが「どのようなパターンで出現するか」を理解し、「どれくらい不確かか」を定量的に見積もる能力の獲得に直結します。
講義用パワーポイント
講義資料Chapter 4
コマ主題細目 ① 離散型確率分布の基礎概念とベルヌーイ分布の理解 ② 二項分布の概念、確率質量関数、期待値・分散の習得 ③ Rのd/p/q/r系関数を用いた二項分布の確率計算と可視化
細目レベル ① 離散型確率分布の基礎概念とベルヌーイ分布の理解 このテーマでは、まず離散型確率分布が確率変数が飛び飛びの値を取る分布であることを理解し、その確率を記述する関数が確率質量関数(pmf)ベルヌーイ分布を学習します。これは「成功/失敗」の2種類の結果しか持たないベルヌーイ試行に適用され、成功確率p、失敗確率q=1-pという定義を把握します。そのpmf、期待値(平均)p、分散p(1-p)といった主要な特性を理解することが目標です。Rにはベルヌーイ専用の関数がないため、二項分布のsize = 1として表現できることを確認し、シミュレーションを通じて期待値と分散を近似的に検証することで、概念を体感的に捉えます。
② 二項分布の概念、確率質量関数、期待値・分散の習得 このテーマでは、ベルヌーイ試行を独立にn回繰り返す状況で、成功回数Xに関心を持つ二項分布を深く学習します。記号X ~ Bin(n,p)と、確率質量関数(pmf)$\displaystyle \Pr(X=x)={n \choose x}p^x(1-p)^{n-x}$を理解することが核心です。特に、このpmfが組合せ(${n \choose x}$)と確率の積で構成される理由を、Chapter 3で学んだ積の法則や組合せの知識と結びつけて理解します。また、期待値E[X]=np、分散Var(X)=np(1-p)の意味とその導出の直感(n回の「期待成功数」)を把握します。不良品保証や卵の破損といった具体的な例題を通じて、現実のシナリオで二項分布がどのように適用されるかを学び、数式の背後にある確率的思考を養います。
③ Rのd/p/q/r系関数を用いた二項分布の確率計算と可視化 このテーマでは、Rにおける二項分布の計算関数であるdbinom (pmf)、pbinom (cdf)、qbinom (分位点)、rbinom (乱数生成) の使い方を習得します。与えられたnとpに対して、特定の回数成功する確率(dbinom())、特定回数以下/以上の成功確率(pbinom())、特定の確率に対応する成功回数(qbinom())を計算できるようにします。例えば、「不良が2個以上なら返金」という状況で返金が必要となる確率をpbinom()を用いて計算する演習を行います。また、rbinom()で乱数を生成し、棒グラフなどで分布の形状を可視化することで、理論的な分布とシミュレーション結果を比較し、二項分布の直感を養います。これにより、理論的な理解とRによる実践的なデータ分析スキルの両方を確立します。
キーワード ① 離散型確率分布 ② ベルヌーイ分布 ③ 二項分布 ④ 確率質量関数(pmf) ⑤ d/p/q/r系関数
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 予習として、まずChapter 3で学んだ「確率の基礎」、特に和事象・積事象の確率計算と、順列・組合せによる場合の数え上げの原理を復習しておくことが重要です。二項分布の確率質量関数は組合せの概念を含むため、これらの基礎がしっかりしていると理解がスムーズです。また、Chapter 4の冒頭部分を読み、ベルヌーイ分布と二項分布の基本的な定義、そしてそれぞれの状況設定(何を数えているか)を概観しておくと良いでしょう。Rの基本的な操作(Chapter 1, 2)は前提となるため、Ctrl + Enterでのコードチャンク実行、パッケージの読み込み、help()の使い方などに慣れておくことを推奨します.
復習としては、ベルヌーイ分布と二項分布の各特性(pmf、平均、分散)を数式と概念の両面から完全に理解し、それらを自分の言葉で説明できるようにすることが重要です。特に、Rのdbinom(), pbinom(), rbinom()関数を使いこなせるようになるまで、様々なnとpの組み合わせで演習を繰り返すことが不可欠です。章中の例題(不良品保証など)をRで再現し、計算結果が正しいことを確認します。rbinom()で乱数を生成し、その棒グラフを作成することで、理論的な分布とシミュレーションの関連性を視覚的に把握する練習も行います。また、Chapter 1で強調されているR Markdown (.Rmd) を用いた再現可能なレポート作成のスキルを継続して磨き、二項分布の確率計算結果やシミュレーションの考察をまとめる練習を行うと良いでしょう。

6 離散型確率分布Ⅱ 科目の中での位置付け Chapter4の後半部分で構成される「離散型確率分布Ⅱ」は、前半で学んだベルヌーイ分布と二項分布の基盤の上に立ち、より多様な確率的な事象をモデル化するための発展的な離散型確率分布群を習得する重要な位置づけです。幾何分布、負の二項分布、超幾何分布、ポアソン分布といった各分布は、それぞれ異なる具体的な状況設定(例:成功までの失敗回数、非復元抽出、稀な事象のカウント)に対応しており、「いつ・なぜ使うか」という視点での理解が重視されます。これらの分布をRのd/p/q/r系関数を用いて実践的に計算し、その特性をシミュレーションで体感することは、今後の推測統計学における仮説検定やモデル選択の際に、データの背後にある確率メカニズムを深く洞察するための重要な分析力を養います。また、これらの分布間の近似関係(例:二項分布からポアソン分布への近似)や概念的なつながりを理解することは、統計モデルの柔軟な適用能力を向上させ、データに基づく意思決定の幅を広げることに繋がります。
講義用パワーポイント
講義資料Chapter 4
コマ主題細目 ① 幾何分布と負の二項分布の理解とRでの計算 ② 超幾何分布とポアソン分布の理解とRでの計算 ③ 主要な離散型確率分布の使い分けと概念間のつながり
細目レベル ① 幾何分布と負の二項分布の理解とRでの計算 このテーマでは、幾何分布(はじめて成功が出るまでの失敗回数)と負の二項分布(r回目の成功が出るまでの失敗回数)を学習します。それぞれの状況設定、確率質量関数(pmf)、平均、分散の定義を理解します。特に幾何分布の記憶なし性(メモリレス性)「将来に残る時間の確率は、今までどれだけ生き延びたか(失敗したか)を忘れる」という概念を深く掘り下げ、例題を通じてその特性を検証します。Rのdgeom/pgeom/qgeom/rgeom、およびdnbinom/pnbinom/qnbinom/rnbinomといった関数を習得し、例題(ルーレットなど)を通じて確率計算を実践します。Rのdnbinomが「失敗回数」を数えることに注意しながら、計算の練習を行い、これらの分布がベルヌーイ試行の繰り返しとどのように関連するかを理解します。
② 超幾何分布とポアソン分布の理解とRでの計算 このテーマでは、非復元抽出の状況で使われる超幾何分布と、稀な事象のカウントに使われるポアソン分布を学習します。超幾何分布については、有限母集団からの「戻さない」抽出という状況設定と、pmf、平均、分散(有限母集団補正を含む)を理解します。特に二項分布との違い(復元/非復元)を明確にします。ポアソン分布については、「単位時間(領域)あたりの稀な出来事のカウント」という状況設定と、pmf、平均と分散が共にλとなる特性を学習します。Rのdhyper/phyper/qhyper/rhyperとdpois/ppois/qpois/rpois関数を用いて、それぞれの分布に関する確率計算を実践します。また、二項分布が特定の条件下でポアソン分布に近似されること(nが大きくpが小さい)も学び、その数学的背景を理解します。
③ 主要な離散型確率分布の使い分けと概念間のつながり このテーマでは、これまで学習したベルヌーイ、二項、幾何、負の二項、超幾何、ポアソンの各離散型確率分布について、「何を数えているか」という観点から、それぞれの使い分けを習得します。各分布のキーワードや適用場面をまとめた早見表を活用し、与えられた問題設定に対して適切な分布を選択する能力を養います。また、二項分布がベルヌーイ分布の繰り返しであること、超幾何分布がNが大きい場合に二項分布に近似されること、二項分布がnを大きくpを小さくした極限でポアソン分布に近似されることなど、分布間のつながりを理解することで、より深い知識を身につけます。シミュレーションを通じて、各分布の平均と分散が理論値に近いことを体感し、直感を固めることで、理論と実践を結びつけます。
キーワード ① 幾何分布 ② 負の二項分布 ③ 超幾何分布 ④ ポアソン分布 ⑤ 分布の使い分け
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題
7 連続確率分布 科目の中での位置付け この講義は、「連続確率分布」と題されており、データに基づいた意思決定を支える統計学において、不確実性を定量化するためのもう一つの主要な道具である連続型確率分布を学ぶ章として位置づけられています。Chapter1で提示された学習目標の一つ「確率の基礎」を具体的に発展させ、Chapter4で学んだ離散型確率分布の知識の積み重ねの上に、より広範なデータ現象をモデル化する能力を養います。
本講義の主なねらいは、連続確率変数、確率密度関数(pdf)、累積分布関数(cdf)の基本を理解し、特に正規分布とその標準化(Zスコア)をRで計算・可視化できるようにすることです。また、指数分布、ガンマ分布、ベータ分布、対数正規分布といった多様な連続確率分布の背景、特徴、Rでの扱い方を習得します。これらの知識は、後の推測統計学(仮説検定や区間推定)で登場する様々な統計量の標本分布(例:t分布、カイ二乗分布、F分布などもガンマ分布に関連)を理解するための不可欠な基礎体力となります。Rのd/p/q/r系関数を使いこなすことで、理論的な概念を具体的な確率計算やシミュレーションを通じて実践的に理解し、データが「どのようなパターンで出現するか」「どれくらい不確かか」を定量的に見積もる能力をさらに向上させることが、この章の学習の根幹をなします。

講義用パワーポイント
講義資料Chapter 5
コマ主題細目 ① 連続確率分布の基礎概念と正規分布の理解およびRでの実践 ② 主要な発展的連続確率分布(指数、ガンマ、ベータ、対数正規)の特性とRでの計算 ③ 正規近似と連続性補正、および多様な分布の使い分け
細目レベル ① 連続確率分布の基礎概念と正規分布の理解およびRでの実践 このテーマでは、まず連続確率変数の基本的な性質と、その確率を記述する**確率密度関数(pdf)および累積分布関数(cdf)の定義を理解します。特に、連続型では特定の1点の確率は0であり、確率が「区間の面積」で表されるという直感を養います。次に、(ガウス分布)を深く学習します。そのpdfの定義、平均($\mu$)と標準偏差($\sigma$)という二つのパラメータが分布の形状に与える影響を把握します。特に重要なのは、任意の正規分布を標準正規分布(平均0、標準偏差1)に変換するZスコア(標準化)**の概念と、68-95-99.7%ルールを習得することです。学習方法としては、Rのdnorm, pnorm, qnorm, rnormといったd/p/q/r系関数を使い、身長やテストの点数といった具体的な例題を通じて、正規分布の確率計算、分位点の読み取り、乱数生成を実践します。これにより、理論的な理解とRによる具体的な操作スキルを確立します.
② 主要な発展的連続確率分布(指数、ガンマ、ベータ、対数正規)の特性とRでの計算 このテーマでは、正規分布以外の重要な連続確率分布を学習します。まず、指数分布については、定義、pmf、平均・分散に加え、その記憶なし性(メモリレス性)「将来に残る時間の確率は、今までどれだけ生き延びたか(待ったか)を忘れる」というユニークな特性を理解します。次に、ガンマ分布と、その特殊なケースであるカイ二乗分布の関係性、そしてベータ分布が比率や確率を扱う際に柔軟な形状を表現できる強みを学びます。さらに、対数正規分布が、掛け算的なばらつきを持つ現象(例:収入、寿命)をモデル化するのに適していることを理解します。各分布について、Rのdexp/dgamma/dbeta/dlnormといったd/p/q/r系関数を習得し、待ち時間や比率のシミュレーションといった例題を通じて、それぞれの分布がどのような状況で適用され、どのような特性を持つかを実践的に学びます.
③ 正規近似と連続性補正、および多様な分布の使い分け このテーマでは、実践的な分析で頻繁に用いられる正規近似の概念を学習します。特に、二項分布が大標本の場合($np\ge 5$ かつ $n(1-p)\ge 5$)に正規分布で近似できること、そして離散型確率を連続型で近似する際に必要となる連続性補正($x$を$x\pm 0.5$にズラす)の重要性を理解します。学習方法としては、Rのpnorm()関数を用いて二項分布の確率を正規近似で素早く見積もり、pbinom()による厳密値と比較する演習を行います。また、これまでに学んだすべての連続確率分布について、「どのような場面でどの分布が適しているか」という観点から、それぞれの使い分けを習得します。Rで作成できる**「分布チートシート」**や、Rによるシミュレーションを通じて、各分布の平均や分散が理論値に近いことを体感し、理論と実践を結びつけることで、現実世界のデータに対する適切なモデル選択能力を養います.
キーワード ① 連続確率分布 ② 正規分布 / Zスコア ③ 確率密度関数(pdf) / 累積分布関数(cdf) ④ 指数分布 ⑤ 正規近似 / 連続性補正
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 予習として、まずChapter4で学習した離散型確率分布の概念とRでの計算(特に二項分布のpmf、平均、分散)を復習しておくことが非常に重要です。これは、連続確率分布との対比や、二項分布の正規近似を理解する上で不可欠な基礎となります。また、Chapter5.mdの「この章のねらい」と「連続確率分布の基礎」のセクションを事前に読み、連続型における確率の考え方(面積としての確率、P(X=a)=0を把握しておくと、スムーズに学習に入れるでしょう。Rの基本的な操作(Ctrl + Enterでのコードチャンク実行、パッケージの読み込みなど)はChapter1やChapter2で習得済みであることを前提として進むため、必要に応じてこれらの基本操作を再確認しておくことを推奨します.
復習としては、各連続確率分布の定義、pmf/pdf、期待値、分散を数式とRでの実装の両面から完璧に理解することが重要です。特に、Rのd/p/q/r系関数(dnorm, pnorm, dexp, pexpなど)を使いこなせるようになるまで、章末のミニ演習問題 に繰り返し取り組むことが不可欠です。正規分布のZスコア変換と確率計算は最も頻繁に利用されるため、多くの練習問題を解いて習熟度を高めます。また、二項分布の正規近似を行う際には、連続性補正の有無が結果にどう影響するかをRで検証し、その必要性を深く理解します。rnorm(), rexp()などで乱数を生成し、ヒストグラムなどを用いて分布の形状や平均・分散が理論値に近づく様子を観察することで、理論と実践を結びつけ、確率分布に対する直感を固めることができます。Chapter1.mdで強調されているR Markdown (.Rmd) を用いた再現可能なレポート作成の習慣を継続し、計算結果、シミュレーションの考察、グラフを一体化させてまとめる練習を行いましょう.

8 可視化と集約 科目の中での位置付け この講義は、「可視化と集約ーデータの形をつかむ」と題されており、データに基づいた意思決定を支える統計学を学ぶ上で、データの探索と「伝える」段階に特化した極めて実践的な章として位置づけられています。Chapter1やChapter2で強調された「とりあえず手を動かしながら」学ぶアプローチと、「再現可能なレポート作成」(R Markdownを使用)という学習目標を具体的に実現するための核となる内容を提供します。
この章では、データ分析の初期段階でデータの全体像を把握するために不可欠な基本的な可視化手法(ヒストグラム、箱ひげ図、散布図など)ggplot2という強力なパッケージを用いて「伝わる」洗練されたグラフを作成するスキルを養います。また、applyやtapplyといった関数を使ってデータを効率的に集約する方法を学びます。これらのスキルは、後の推測統計(t検定、ANOVA、相関など)に進む前に、データがどのようなパターンや分布を持っているかを直感的に理解するための「基礎体力」となります。統計解析は適切な可視化と集約から始まるため、この章で得られる知識とRの操作能力は、データサイエンスや機械学習におけるデータ探索フェーズにおいて、不可欠な要素です。

講義用パワーポイント
講義資料Chapter 6
コマ主題細目 ① ベースRによる基本的なデータの可視化 ② Rにおけるデータの要約とグループ別集約 ③ ggplot2による「伝わる」グラフ作成と自作関数の導入
細目レベル ① ベースRによる基本的なデータの可視化 このテーマでは、データの特徴を素早く把握するための基本的なグラフ作成手法を習得します。具体的には、ステム・アンド・リーフ、棒グラフ、ヒストグラム、散布図、箱ひげ図といったグラフについて、それぞれの用途とRの基本作図関数(stem(), barplot(), hist(), plot(), boxplot()) を学びます。学習方法としては、提供されたミニデータセット(bill, wgain, survey, ffood) を用いて、実際にRでこれらのグラフを描画します。特に、小規模データでのざっくりとした分布の確認に便利なステム・アンド・リーフ、地域別の件数を数える棒グラフ、データの分布形状を見るヒストグラム、2変数の関係を捉える散布図(45度線や文字ラベルの追加方法を含む)、そして複数群の中心・散らばり・外れ値を比較する箱ひげ図 の作成と解釈に重点を置きます。これにより、データの初期探索に必要な視覚化スキルを身につけます。
② Rにおけるデータの要約とグループ別集約 このテーマでは、データを行列やデータフレームの行/列で一括処理するapply()関数と、ベクトルを特定のグループで区切って集計するtapply()関数を習得します。apply()では、第2引数を1で行方向、2で列方向に処理を適用できることを理解し、データフレームの列ごとに平均を計算するなどの実践を行います。tapply()は、「対象(X)、インデックス(INDEX)、関数(FUN)」という3点セットで群別の要約を効率的に行う方法を学びます。学習方法としては、具体的なデータ(billデータなど)を用いて、地域別の年齢中央値や資産中央値をtapply()で算出し、それをさらに棒グラフで可視化する演習を行います。また、tapplyでNA(欠損値)を含むデータを処理する際にna.rm = TRUEオプションを使用する重要性も理解し、実践的なデータクリーニングの知識も養います。
③ ggplot2による「伝わる」グラフ作成と自作関数の導入 このテーマでは、より洗練された「伝わる」グラフを作成するために、ggplot2パッケージの使い方を学習します。ggplot2の「データ」+「美的属性(aes)」+「幾何(geom)」という基本的な組み立て方を理解し、散布図にスムーズな傾向線(geom_smooth()) や誤差帯を追加したり、タイトルや軸ラベルをカスタマイズしたり、点の属性(色・形・大きさ)に情報を割り当てることで、一枚の図で多角的な情報を伝えるグラフを作成できるようにします。また、Rで自作関数を作成し、複雑な作業を一つにまとめる方法を学びます。具体的には、バタフライ曲線のような図形を引数を変えるだけで描画する例を通じて、「関数 = 入力 → 出力」というプログラミングの基本的な感覚を掴むことが目標です。
キーワード ① 可視化(Visualization) ② 記述統計(Descriptive Statistics) ③ ggplot2 ④ tapply ⑤ 再現可能なレポート(Reproducible Report)
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 予習として、まずChapter1で学んだ「不確実性を“飼いならす”技術」や「再現可能なレポート作成」という学習目標を再確認し、本章がその実践的なツールを提供することへの認識を深めることが重要です。次に、Chapter2で習得したRの基本操作(特にデータ読み込み、データ型、代表値、散らばり、ヒストグラム、箱ひげ図の基本作図関数)を復習しておくことが不可欠です。これらの基礎知識は本章の学習の前提となります。Chapter6の「この章でやること」セクションを読み、ステム・アンド・リーフ、棒グラフ、ヒストグラム、散布図、箱ひげ図といった基本的なグラフの種類、applyやtapply、ggplot2の利用といった主要な学習テーマを事前に把握しておくと、スムーズに内容に入り込めるでしょう。
復習としては、章末に用意されている「章末ドリル(手を動かす)」に必ず取り組み、ベースRでの基本的な可視化、apply/tapplyを用いたデータ集約、そしてggplot2を使ったより洗練されたグラフ作成のスキルを定着させることが最も重要です。与えられたデータに対して、どのグラフタイプが最も適切か判断し、Rで効果的に描画できるようになるまで練習を重ねます。ggplot2の「データ+美的属性+幾何」という考え方を何度も反復し、様々な属性(色、形、大きさ)をaes()に割り当てて情報量を増やす練習を行うことで、グラフを通じた情報伝達能力を高めます。tapply()を使って、グループごとの平均・中央値・IQRなどを素早く集計し、必要に応じてna.rm = TRUEオプションを適用する練習も徹底します。また、自作関数(例:butterfly())の引数を変更し、どのような変化が図に現れるかを試すことで、関数の「入力→出力」のロジックを体感的に理解することが、プログラミング的思考の基礎となります。Chapter1で強調されているR Markdown (.Rmd) を用いた再現可能なレポート作成の習慣を継続し、可視化結果、集約データ、考察を一つのドキュメントにまとめる練習を行うことが、学習内容の定着と効果的な伝達能力の向上に繋がります。章中に記載されている「つまづきやすいポイント」も再確認し、エラー発生時の対処能力を高めておくことも、今後のRを使ったデータ分析作業でスムーズに進むために不可欠です。

9 標本抽出と標本分布 科目の中での位置付け 本講義は、「標本抽出と標本分布」と題されており、データに基づいた意思決定を支える統計学において、母集団に関する未知のパラメータを標本データから推測する「推測統計」の土台を築く極めて重要な章として位置づけられています。Chapter1で強調された統計学の最大の敵である「不確実性」を定量化する技術を習得するためには、標本から母集団への推測を行う際の不確実性を数量化する標本分布の理解が不可欠です。
この講義は、Chapter3で学んだ確率の基礎、そしてChapter4とChapter5で学んだ離散型・連続型確率分布の知識 を前提とし、それらを「標本から母集団を推測する」という具体的な目的に応用します。特に、中心極限定理(CLT)標準誤差(SE)仮説検定(Chapter 8, 11, 12) や区間推定(Chapter 9) において、統計量の挙動を理解し、その結果の不確かさを評価するために不可欠な「基礎体力」を提供します。Rによるシミュレーションを通じてこれらの概念を体験的に学ぶことで、データサイエンスや機械学習の文脈で統計的推論を行う際の、堅固な理論的・実践的基盤を確立することを目指します。

講義用パワーポイント
講義資料Chapter 7
コマ主題細目 ① 標本抽出の基本概念と主要な確率抽出法 ② 標本平均・標本割合の標本分布と標準誤差の理解 ③ 中心極限定理(CLT)と推定量・平均二乗誤差(MSE)の学習
細目レベル ① 標本抽出の基本概念と主要な確率抽出法 このテーマでは、母集団から標本を取り出す方法として、確率抽出(Probability Sampling)非確率抽出(Non-Probability Sampling)既知で正の確率で選ばれる単純無作為抽出(SRS)、系統抽出、層化抽出、クラスター抽出の各特徴とRでの実装方法(特にsample()関数を用いたSRSWRとSRSWORの違い)を学びます。具体的には、ミニデータセットを用いてSRSWRとSRSWORにおける標本平均の分布を比較し、**標本平均の期待値が母平均に一致する(不偏性)**ことを体感します。非確率抽出法(便宜抽出、判断抽出、割当抽出など)については、その長所・短所と適用場面を理解し、調査目的(母集団への一般化の要否)に応じた適切な抽出法の選択基準を習得します。
② 標本平均・標本割合の標本分布と標準誤差の理解 このテーマでは、標本分布が「同じサイズの標本を繰り返し取り出して計算した統計量(平均、割合など)の確率分布」であることを定義します。独立同分布(i.i.d.)の標本から計算される標本平均 $\bar X$ の期待値が母平均 $\mu$ に一致し、分散が $\sigma^2/n$ となること、また二項モデルにおける標本割合 $\hat p$ の期待値が $p$ に一致し、分散が $p(1-p)/n$ となることを理解します。特に、標本分布の広がりを表す**標準誤差(SE)**が、標本平均では $\sigma/\sqrt{n}$、標本割合では $\sqrt{\hat p(1-\hat p)/n}$ となることを把握します。これらの式を理解するだけでなく、Rでシミュレーションを行い、多数回標本を抽出した際の標本平均や標本割合の分布が、理論的な期待値や分散、SEに近づく様子を観察することで、概念の直感的な理解を深めます。
③ 中心極限定理(CLT)と推定量・平均二乗誤差(MSE)の学習 このテーマでは、統計学の最も重要な定理の一つである中心極限定理(CLT)$n$(標本サイズ)が十分大きいとき、母分布の形にかかわらず標本平均 $\bar X$ が近似的に正規分布 $\mathcal{N}(\mu, \sigma^2/n)$ に従う」という性質を示します。学習方法としては、歪んだ分布(例:指数分布)からRで多数の標本を抽出し、その標本平均のヒストグラムが標本サイズを増やすにつれて正規分布に近づく様子をシミュレーションで可視化・体感します。また、推定量(母パラメータを標本から推定する統計量)のバイアス(期待値と真値とのずれ)と平均二乗誤差(MSE)(分散とバイアス平方和)を学び、不偏推定量と効率の良い推定量の概念、そしてそれらのトレードオフについて理解を深めます。
キーワード ① 標本抽出 ② 標本分布 ③ 標準誤差(SE) ④ 中心極限定理(CLT) ⑤ 推定量とバイアス
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 予習として、Chapter1で提示された統計学の学習目標、特に「不確かさの見積もりと比較」と「確率的思考の獲得」が、この章で具体的にどのように実現されるかを意識することが重要です。Chapter3の確率の基礎、およびChapter4とChapter5の離散型・連続型確率分布 の知識は、標本分布を理解するための前提となるため、特に期待値、分散、そして正規分布の特性とRでのd/p/q/r系関数の使い方を復習しておくことを強く推奨します。Chapter7の「学びの目標」 に目を通し、標本抽出の概念、標本分布、標準誤差、中心極限定理といった主要な学習テーマを事前に把握しておくと、スムーズに学習に入り込めるでしょう。
復習としては、章末に用意されている章末演習 に必ず取り組み、Rを使ったシミュレーションを通じて、理論的な概念を実践的に定着させることが最も重要です。例えば、異なる母集団分布から標本を繰り返し抽出し、標本平均のヒストグラムが正規分布に近づく中心極限定理の現象をRで再現する演習を徹底します。また、標本平均や標本割合の標準誤差を理論式で計算し、それがシミュレーションで得られた標本分布の標準偏差と一致することを確認することで、標準誤差の意味を深く理解します。確率抽出と非確率抽出の長所・短所を比較し、特定の調査目的に対して適切な抽出法を選択する問題にも挑戦します。さらに、Chapter1で強調されているR Markdown (.Rmd) を用いた再現可能なレポート作成 の習慣を継続し、シミュレーション結果、確率計算の過程、そして考察を一体化させてまとめる練習を行うことが、自身の理解を深めるとともに、効果的な情報伝達能力を養う上で非常に有効です。

10 仮説検定 科目の中での位置付け 本講義は、「仮説検定(母平均・母比率の1標本)」と題されており、データに基づいた意思決定を支える統計学において、母集団に関する未知のパラメータを標本データから推測する「推測統計」の中核をなす、極めて重要な章として位置づけられています。Chapter1で強調された統計学の最大の敵である「不確実性」を定量化する技術を習得するためには、標本データが示す情報に基づいて、特定の主張(仮説)がどの程度確からしいかを評価する能力が不可欠です。
この章は、Chapter3で学んだ確率の基礎、そしてChapter7で学習した標本抽出と標本分布、標準誤差、中心極限定理 の知識を直接的に応用し、具体的な仮説を検証するフレームワークを提供します。特に、帰無仮説と対立仮説の設定、第一種・第二種の誤り、検出力(パワー)の理解は、後の章で学習するt検定(Chapter11)や頻度解析(Chapter12)といった様々な統計的手法を適切に適用し、その結果を解釈するための統計的思考の基盤となります。Rを用いた具体的な計算と実践を通じて、理論的な概念を体感的に理解し、データサイエンスや機械学習の文脈で統計的推論を行う際の、堅固な理論的・実践的基盤を確立することを目指します。

講義用パワーポイント
講義資料Chapter 8
コマ主題細目 ① 仮説検定の基本概念、誤りの種類、検出力(パワー)の理解 ② 母平均に関する1標本検定(z検定とt検定)の実践と解釈 ③ 母比率に関する1標本検定の実践と注意点
細目レベル ① 仮説検定の基本概念、誤りの種類、検出力(パワー)の理解 このテーマでは、まず仮説検定が「母集団のパラメータに関する主張が、サンプルデータから見て説得力があるか」を判断する手続きであることを理解します。次に、帰無仮説($H_0$)(検定で反証しようとする現状維持の主張)と対立仮説($H_1$)($H_0$が棄却されたときに採用される研究者が示したい主張)の立て方を習得します。重要なのは、第一種の誤り(Type I error)($H_0$が真なのに棄却する誤り、確率$\alpha$)と第二種の誤り(Type II error)($H_1$が真なのに棄却できない誤り、確率$\beta$)の違いを明確に理解することです。そして、$1-\beta$ で表される検出力(Power)臨界値法やp値法の考え方を図で可視化しながら、棄却域と受容域の概念を直感的に捉えることが推奨されます。
② 母平均に関する1標本検定(z検定とt検定)の実践と解釈 このテーマでは、母平均に関する仮説を1つの標本から検証する具体的な手法を習得します。大標本の場合や母標準偏差$\sigma$が既知の場合にはz検定を、小標本で$\sigma$が不明の場合にはt検定(自由度$n-1$)を用いる理由と、それぞれの検定統計量の計算式を理解します。学習方法としては、製品の含有量や株式リターンに関する例題を用いて、まず手計算でz統計量またはt統計量を算出し、臨界値またはp値と比較して仮説を判定する手順を追体験します。その後、Rのt.test()関数を使って、同様の検定を効率的に実行し、出力されるp値、t統計量、自由度、そして95%信頼区間を正確に読み解く方法を身につけます。これにより、「推定(平均と95%信頼区間)→検定(t, df, p値)」というRでの出力解釈の順番を習得し、信頼区間が帰無仮説の値を「含まない」ことが棄却と対応することを確認します。
③ 母比率に関する1標本検定の実践と注意点 このテーマでは、母集団におけるあるカテゴリの割合(比率)に関する仮説を1つの標本から検証する方法を学びます。大標本の場合には、比率の標本分布が正規近似できることを利用したz検定が適用されることを理解し、その検定統計量 $\displaystyle z=\frac{\hat{p}-p_0}{\sqrt{p_0(1-p_0)/n}}$ を習得します。学習方法としては、失業率や女子の合格率といった具体的な例題を通じて、まず手計算でz統計量を算出し、片側または両側検定の枠組みで仮説を判定します。その後、Rのprop.test()関数(連続性補正を含む)を用いて同様の検定を行い、手計算の結果とRの出力が一致することを確認します。特に、「$n$は比率を計算した母数である」有意差が実務的な重要性と必ずしも一致しないため、効果量の視点も加えることの重要性を学びます。
キーワード ① 仮説検定(Hypothesis Testing) ② 帰無仮説・対立仮説 ③ 第一種の誤りと第二種の誤り ④ z 検定と t 検定 ⑤ 母比率の検定
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 予習として、Chapter7で学習した「標本分布と標準誤差、中心極限定理」の内容を十分に理解していることが極めて重要です。特に、統計量がどのように分布し、そのばらつき(標準誤差)がどのように推定されるかという点が、本章の検定統計量の理解の前提となります。また、Chapter3で学んだ確率の基礎 や正規分布の知識 も復習しておくと良いでしょう。Chapter8の「本章のねらい」 に目を通し、仮説検定の全体像、帰無仮説・対立仮説、第一種・第二種の誤りといった主要な概念を事前に把握しておくことで、学習がスムーズに進みます。Rの基本的な操作(t.test(), prop.test())にも慣れておくことを推奨します。
復習としては、章末に用意されている章末演習に必ず取り組み、Rを使ったシミュレーションや計算を通じて、理論的な概念を実践的に定着させることが最も重要です。具体的には、与えられた問題に対して、を徹底します。その後、Rのt.test()やprop.test()関数を用いて結果を確認し、手計算とRの出力が一致することを確認することで、理解を深めます。特に、練習や、「有意差が実務的に重要であるとは限らない」という点を踏まえて効果量も考慮に入れた解釈を行う練習を重ねます。また、仮説検定の前提条件(独立性、近似正規性、期待度数の目安など)を確認する習慣をつけ、R Markdown (.Rmd) を用いて、仮説、検定結果、考察を一体化した再現可能なレポートを作成するスキルを継続して磨きましょう。

11 推定 科目の中での位置付け この講義は、「推定(点推定と区間推定)」と題されており、データに基づいた意思決定を支える統計学において、母集団の未知のパラメータを標本データから推し量る「推測統計」の中心的な概念を扱う、極めて重要な章として位置づけられています。Chapter1.mdで強調された統計学の最大の敵である「不確実性」を定量化する技術を習得するためには、単に1つの値で推定する点推定だけでなく、その不確かさを考慮した範囲で示す区間推定の理解が不可欠です。
この章は、Chapter3.mdで学んだ確率の基礎、Chapter4.mdおよびChapter5.mdで学んだ離散型・連続型確率分布の知識、そして特にChapter7.mdで学習した標本抽出、標本分布、標準誤差(SE)、中心極限定理(CLT) を直接的に応用します。これらの基礎知識が、信頼区間の構築やその解釈の根拠となります。また、Chapter8.mdで学んだ仮説検定(例えば、95%信頼区間が帰無仮説の値を「含まない」ことが棄却と対応する)との関連性も深めます。Rを用いたモーメント法、最尤法、ベイズ推定といった点推定の手法や、正規モデル、CLT、t分布に基づく区間推定を実践的に学ぶことで、データサイエンスや機械学習の文脈で統計的推論を行う際の、堅固な理論的・実践的基盤を確立することを目指します。

講義用パワーポイント
講義資料Chapter 9
コマ主題細目 ① 点推定の概念と主要手法(モーメント法、最尤法、ベイズ推定の入門) ② 区間推定の概念と主要手法(正規モデル、CLTに基づく大標本、t分布による厳密CI) ③ 標本抽出の考慮、実践的な区間推定の応用、サンプルサイズ設計
細目レベル ① 点推定の概念と主要手法(モーメント法、最尤法、ベイズ推定の入門) このテーマでは、母集団の未知パラメータを1つの値で推定する点推定の概念と、その主要な三つの方法を学習します。まず、モーメント法(MoM)尤度から事後分布を得る考え方を学びます。損失関数に応じてベイズ推定量が事後平均、事後中央値、最頻値(MAP)となること、および共役事前分布の有用性を、RでのBeta-BinomialやGamma-Poissonの計算例を通じて理解を深めます。
② 区間推定の概念と主要手法(正規モデル、CLTに基づく大標本、t分布による厳密CI) このテーマでは、高い確率で真値を含む範囲を示す区間推定の概念と、その具体的な手法を学習します。まず、信頼区間が「この手順で作る区間のうち95%が真のパラメータを含む」という長期頻度の性質を持つことを理解し、「パラメータが95%の確率でこの区間に入る」という誤った解釈を避けるように注意します。ピボット法として「推定値 ± クリティカル値 × 標準誤差」という信頼区間の一般形を学び、母標準偏差$\sigma$が既知の正規モデルに適用します。次に、**中心極限定理(CLT)**を利用した大標本での区間推定として、母分布が不明でも標本サイズが十分大きければ標本平均が正規近似できることを学び、ポアソン分布やベルヌーイ分布の標本割合のSEに基づいた区間推定(Wilsonスコア区間を含む)をRで実践します。最後に、母分散$\sigma^2$が未知の正規母集団において、t分布を用いた信頼区間を構築する方法を理解し、Rのt.test()関数がCIを同時に出力することを学習します。
③ 標本抽出の考慮、実践的な区間推定の応用、サンプルサイズ設計 このテーマでは、区間推定をより実践的に適用するための応用的な側面と、調査計画におけるサンプルサイズ設計を学習します。まず、単純無作為抽出(SRS)Wilson区間の適用(小標本や偏りが大きい場合に頑健)、そしてベイズ推定を用いた割合の安定化(事前分布の活用)といったケーススタディを通じて、適切な推定方法を選択する能力を養います。最後に、サンプルサイズ設計として、許容誤差幅と信頼係数が与えられた場合に、必要な標本サイズを計算する公式を学習します。特に、比率の推定における標本サイズの計算では、$\hat p(1-\hat p)$を最大化する0.25を用いることで、最悪ケースでも十分なサンプルサイズを確保できることを理解します。
キーワード ① 点推定 ② 区間推定 ③ 最尤法(MLE) ④ 信頼区間(CI) ⑤ 中心極限定理(CLT)
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 予習として、Chapter7で学習した「標本分布と標準誤差(SE)、中心極限定理(CLT)」の内容を十分に理解していることが極めて重要です。これらの概念は、信頼区間を構築する際の理論的根拠となるため、特に統計量がどのように分布し、そのばらつきがどのように推定されるかという点を復習しておきましょう。また、Chapter3.mdで学んだ確率の基礎 や、Chapter4.mdおよびChapter5.mdで学習した正規分布などの確率分布の知識も、推定量を理解する上で前提となります。Chapter9の「推定とは」のセクションを読み、点推定と区間推定の定義、およびその違いを事前に把握しておくことで、学習がスムーズに進むでしょう。
復習としては、章末に用意されている演習問題 に必ず取り組み、Rを使ったシミュレーションや計算を通じて、理論的な概念を実践的に定着させることが最も重要です。具体的には、モーメント法、最尤法、ベイズ推定の各点推定手法について、それぞれの概念とRでの計算プロセスを理解し、実際にコードを書いて結果を確認します。区間推定については、正規分布、CLT、t分布のそれぞれの場合で信頼区間をRで計算し、「推定値 ± クリティカル値 × 標準誤差」という一般形を確実に適用できるようにします。特に、信頼区間の「解釈の落とし穴」 を再確認し、自身の言葉で正確に説明できるかを確認しましょう。R Markdown (.Rmd) を用いて、推定結果、区間計算の過程、そして考察を一体化した再現可能なレポートを作成するスキルを継続して磨くことは、自身の理解を深め、効果的な情報伝達能力を養う上で非常に有効です。また、与えられた誤差幅と信頼水準から必要なサンプルサイズを計算する練習も行い、調査計画における実践的な応用力を高めましょう。

12 ピアソン相関 科目の中での位置付け この講義で学ぶピアソンの相関は、統計学における「解析の基礎」 の重要な要素であり、特に2つの量的変数間の 「線形関係の強さ」 を測る技術を提供します。統計学が 不確実性を定量化し、意思決定を支える 学問である中で、相関分析はデータから変数間の関連性を見出し、その 不確かさを評価 する第一歩となります。
具体的には、データの 「収集・分析・解釈」 のフェーズにおいて、可視化(散布図)と要約統計量(相関係数)を用いて、データ全体の像を捉え、変数間の関係性を把握するのに役立ちます。また、データサイエンスや機械学習、AIの基礎体力 としても位置づけられ、後のより複雑なモデル(例:重回帰分析や因果推論)を学ぶ上での土台となります。Rという 無料の計算環境 とRStudioという 統合開発環境 を用いて、「とりあえず手を動かしながら」 学びを進めることで、再現可能な分析 のスキルも同時に習得できるよう設計されています。相関は単位に依存せず、対称であるという性質も学習の重要なポイントです。この章で得られるスキルは、学術・産業・行政のあらゆる現場で 強力な武器 となり、実生活の問いに答える 「現実解」 を導き出すための実用的なツールとなります。

講義用パワーポイント
講義資料Chapter 10
コマ主題細目 ① 相関係数の意味・性質・限界の理解 ② Rでの実務的な計算と可視化 ③ 相関分析の仮定、落とし穴、使い分け
細目レベル ① このテーマでは、ピアソンの相関係数 r がどのような指標であるか、その定義と基本的な性質を学習します。r は2つの量的変数間の 線形関係の強さと方向 を-1から+1の範囲で表し、+1は完全な正の直線関係、-1は完全な負の直線関係、0は線形関係が見られないことを意味します。学習では、r が 単位に依存せず、対称性を持つ といった重要な性質を確認します。また、r の二乗である 決定係数 r^2 が、一方の変数の分散のうち、もう一方の変数との線形関係で 説明される割合 を示すことも理解します。
学習は、まず 散布図 を用いて相関のパターン(完全、高/低、ゼロ、非線形)を 直感的に 把握することから始めます。特に、散布図を平均の縦線と横線で4象限に区切ることで、r の符号と大きさの直感を養います。しかし、ピアソンの r は 「直線的な関係」のみ を測るため、U字型やS字型のような 非線形関係を見落とす 限界があることにも注意を払います。この講義のゴールとして、相関係数 r の意味・性質・限界を直感と図で理解することが掲げられています。

② このテーマでは、R言語を用いて相関分析を 実践的に 実施する方法を習得します。まず、cor() 関数 を使ってピアソンの相関係数を計算する 点推定 を行います。次に、cor.test() 関数 を用いて、相関係数が統計的に有意であるかを判断する 有意性検定 を実行し、p値 と 95%信頼区間 を取得し、その結果を解釈できるようになります。
可視化においては、ggplot2 パッケージ を活用して 散布図 を作成し、2変数間の関係を視覚的に捉えます。散布図には 回帰直線 を重ねて、データの傾向をより明確にする方法も学びます。さらに、複数の変数間の相関を一度に確認できる 相関行列 の計算とその可視化についても触れます。これらのRの操作は、mtcarsのような 実データ を用いたワークフローを通じて、具体的な手順と結果の読み方を体得します。学習の過程で、スクリプト運用やR Markdownの活用を通じて、再現可能な分析レポート 作成のスキルも磨きます。

③ このテーマでは、ピアソンの相関分析を行う上での 前提条件 と、誤った解釈を避けるための 「落とし穴」、そして異なる相関指標(Spearman順位相関など)との 使い分け を深く理解します。ピアソン相関の検定における主な仮定として、観測の独立性、二変量正規性、線形性、等分散性 を確認します。
重要な「落とし穴」としては、相関は因果関係ではない こと、U字型・S字型のような 非線形関係を見逃す 可能性、外れ値が相関係数に大きく影響する こと、範囲制限 や 群の混合 が相関係数の見え方を歪めること、そして 欠測値 の扱いについて学びます。これらの問題を避けるため、必ず散布図を描き、データの形を詳細に観察することの重要性を強調します。また、非線形だが単調な関係や外れ値に強い Spearmanの順位相関 と、Pearson相関との使い分けを具体的な場面に応じて検討できるようになります。これにより、より 頑健(robust)な使い方 を身につけ、データに「だまされない」リテラシーを高めます。

キーワード ① ピアソン相関係数 ® ② 散布図 ③ 決定係数 ④ 有意性検定 (cor.test()) ⑤ Spearman順位相関
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 相関分析を深く理解するためには、これまでの章で学んだ基本的な概念が不可欠です。
• 要約統計量と可視化:平均、中央値、分散、標準偏差といった基本的な記述統計量 や、ヒストグラム、箱ひげ図といった可視化手法 を復習しましょう。これらは、相関係数の定義(共分散の標準化) や、散布図を描く前のデータ理解に直結します。特に、外れ値の概念 は相関係数に大きな影響を与えるため重要です。ggplot2を用いた図の見栄えを良くする方法も再確認しておくと良いでしょう。
• Rの超基本操作:オブジェクト指向の考え方、代入(<-)、関数の使い方、help()、RStudioでのスクリプト運用 といったRの基本的な操作をしっかり身につけておくことが、相関分析の実践的な計算や可視化をスムーズに進めるための土台となります。ggplot2 の基礎的な使い方 も再確認しておくと良いでしょう。

13 t検定 科目の中での位置付け この講義で学ぶt検定は、統計学における「解析の基礎」 の重要な一環であり、特に**2つの量的変数間の「平均値の差」**が統計的に有意であるかを判断する技術を提供します。統計学が 不確実性を定量化し、意思決定を支援する 学問である中で、t検定はデータからグループ間の違いを見出し、その 不確かさを評価 するための主要なツールです。
具体的には、データの 「収集・分析・解釈」 のフェーズにおいて、可視化(箱ひげ図など)と組み合わせて、2つのグループ間に意味のある平均差が存在するかどうかを評価します。t検定は、母分散が不明な場合に、標本分散 $s$ で代用して検定を行うための手法であり、特に小標本においてZ検定を用いると第I種過誤が増加する(誤って差があるとしてしまう)ため、t検定が正しいアプローチとなります。ここで学ぶスキルは、データサイエンスや機械学習、AIの基礎体力としても位置づけられ、後のより複雑なモデル(例:分散分析や回帰分析)を学ぶ上での土台となります。Rという 無料の計算環境 とRStudioという 統合開発環境 を用いて 「とりあえず手を動かしながら」 学びを進めることで、再現可能な分析 のスキルも同時に習得できるよう設計されており、学術・産業・行政のあらゆる現場で 強力な武器 となります。

講義用パワーポイント
講義資料Chapter 11
コマ主題細目 ① t検定の全体像と基礎理論の理解 ② Rを用いた各t検定の実践と結果の解釈 ③ t検定の仮定、落とし穴、研究計画への応用
細目レベル ① このテーマでは、まず t検定の3つの主要なタイプ を学習します。これらは、1標本t検定(標本平均が既知の特定値と異なるか)、2標本t検定(独立)(2つの独立した集団の平均が異なるか)、対応のあるt検定(ペア)(同じ対象の2条件間での平均差が0と異なるか)です。また、片側検定と両側検定の違いとその使い分けも理解します。次に、t検定の基礎となる t分布 の性質について深く掘り下げます。t分布は、自由度(df)裾が重く(極端な値が出やすい)、dfが増加するにつれて標準正規分布に近づくという特徴を、図を用いた重ね描きで直感的に把握します。この理解は、なぜZ検定ではなくt検定を使うのかという核心的な問いにつながります。すなわち、母分散が不明で標本分散 $s$ を用いる場合、特に小標本ではZ検定が第I種過誤を過大に評価してしまうため、t検定を使用する必要があることをシミュレーションを通じて確認します。
② このテーマでは、R言語を用いてt検定を 実践的に 実施する方法を習得します. まず、Rの t.test() 関数 が、1標本、2標本、対応のある検定のすべてに対応していることを学びます。1標本t検定では、仮説設定、t.test()の実行、出力される t値、自由度、p値、95%信頼区間 の読み方をステップバイステップで習得します。特に、95%信頼区間に帰無仮説の母平均が含まれるかどうかと、p値の大小の関係を理解します。2標本t検定では、Welchのt検定(等分散を仮定しない安全な方法で既定)と等分散を仮定したプール分散t検定の使い分けを理解し、実データ例を用いてRでの実行と出力の解釈を行います。さらに、検定結果の統計的有意性だけでなく、**効果量(Cohen''s d)**を計算し、その大きさを評価する方法も学びます。対応のあるt検定では、各ペアの差分に対して1標本t検定を行うことと等価であるという考え方を理解し、実例を通じてその実施と解釈を行います。
③ このテーマでは、t検定を行う上での 前提条件(仮定) と、誤った解釈を避けるための 「落とし穴」 を深く理解します。t検定の主な仮定として、観測の独立性、正規性(特に小標本で望ましい)、等分散性(2標本t検定の場合)を確認します。正規性についてはt検定が比較的 ロバスト であること(歪度±2、尖度<5程度なら大抵OK)を学び、QQプロットなどで雰囲気をチェックします。等分散性については、迷ったらWelch検定(既定)を選ぶのが実務的であること、F検定やBartlett検定は正規性が前提となる補助的なチェックであることを理解します。
仮定が満たされない場合や外れ値が強い場合には、Wilcoxonの順位和検定などの ノンパラメトリック検定 を検討することも学びます。また、有意差≠実務的に重要であるという落とし穴を避け、効果量と併せて結果を解釈する重要性を強調します。最後に、研究計画の段階で、power.t.test() 関数を用いて必要なサンプルサイズを見積もる方法を学び、検出力(パワー)の確保がいかに重要かを理解します。これにより、失敗しない分析手順と、データに「だまされない」リテラシーを高めます。

キーワード ① t検定 ② t分布 ③ 自由度 (df) ④ 有意水準 (p値、95%信頼区間) ⑤ 効果量 (Cohen''s d)
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 復習ポイント】 Chapter 11のt検定を深く理解するためには、これまでの章で学んだ基本的な概念が不可欠です。
• 要約統計量と可視化:平均、中央値、分散、標準偏差といった記述統計量や、ヒストグラム、箱ひげ図といった可視化手法 を復習しましょう。これらは、t検定の前提条件(正規性、外れ値の有無)を視覚的にチェックする上で不可欠です。ggplot2を用いた図の見栄えを良くする方法も再確認しておきましょう.
• Rの超基本操作:オブジェクト指向の考え方、代入(<-)、関数の使い方、help()、RStudioでのスクリプト運用 といったRの基本的な操作をしっかり身につけておくことが、t検定の実践的な計算や可視化をスムーズに進めるための土台となります.
• 確率の基礎:主観確率と客観確率、事象の和・積、確率の求め方 は、検定におけるp値の解釈 や、不確実性への理解を深める上で役立ちます.
【予習ポイント】 Chapter 11のt検定で得た知識は、今後のより発展的な解析手法へと繋がります。
• ピアソンの相関:2つの量的変数間の 線形関係の強さ を測るピアソンの相関係数 は、t検定とは異なるが、量的変数間の関連性を探るという点で共通の目的を持ちます. 相関とt検定がそれぞれどのような問いに答えるのかを理解することで、適切な分析手法の選択能力が向上します。

14 頻度の解析 科目の中での位置付け 本講義「頻度の解析」は、統計学の科目においてカテゴリーデータ(質的データ)の分析に特化した、重要な基礎解析手法を提供します。これまでの章で量的変数間の関係(ピアソンの相関)や量的変数の平均差(t検定)を扱ってきましたが、この章では、名義尺度や順序尺度といった 質的データ、すなわちカウント(頻度)や比率で表されるデータの分析に焦点を当てます。
統計学が「不確実性を定量化し、意思決定を支援する」学問である中で、頻度解析は、集団内の割合を推定したり、カテゴリー変数間の関連性を評価したりする際に不可欠なツールとなります。例えば、アンケートの回答結果や疫学調査における疾病発生率など、実社会の多くのデータはカテゴリー形式で存在します。この章で学ぶ手法は、それらのデータからパターンを見出し、その「不確かさ」を定量化し、科学的・実務的な意思決定を支える上で欠かせないスキルとなります。Rという 無料の計算環境 とRStudioという 統合開発環境 を用いて 「とりあえず手を動かしながら」 学習を進めることで、再現可能な分析 のスキルも同時に習得できるよう設計されており、データサイエンスや機械学習の基礎体力としても位置づけられます。

講義用パワーポイント
講義資料Chapter 12
コマ主題細目 ① 頻度データの基本操作と比率の推定・検定 ② χ²(カイ二乗)検定の発想と適用 ③ 効果量、連関の大きさ、順位に基づくノンパラメトリック検定
細目レベル ① このテーマでは、まずカテゴリーデータから クロス集計表 を作成する基本的なRの操作を習得します。具体的には、table() 関数で度数を、xtabs() で集計済みデータから表を、prop.table() で比率表を作成し、データを集約・整理する方法を学びます。次に、1標本の比率(割合・プロポーション)の推定と検定に焦点を当てます。あるカテゴリーに属する人数の割合が、特定の仮説上の母比率と異なるかを検証します。
学習では、比率の 信頼区間 を算出する方法と、仮説検定 をRで実行・解釈できるようになります。大標本の場合には 正規近似 を用いた信頼区間や検定 (prop.test()) を、標本サイズが小さい場合や端の確率では 二項検定(正確法) (binom.test()) を使い分ける知識を習得します。信頼区間が仮説上の母比率を含まない場合に「有意に異なる」と結論付ける解釈方法も実践的に学びます。

② このテーマでは、χ²適合度検定 と χ²独立性の検定 という二つの主要なカイ二乗検定を学習します。χ²適合度検定 は、1つの変数の分布が、ある理論的な分布(例:各カテゴリーが等確率)と合致するかどうかを評価します。例えば、曜日ごとの発生数が均等であるかといった問いに答えることができます。χ²独立性の検定 は、2つのカテゴリー変数間に統計的な関連性があるかどうか(独立であるか)を評価します。例えば、軽食の提示タイミングと選択に独立性があるかなどを分析します。
学習では、観測度数 (O) と 期待度数 (E) のズレを $\chi^2 = \sum \frac{(O - E)^2}{E}$ で評価する発想を理解し、その 自由度 の計算方法(適合度:カテゴリー数-1、独立性:(行数-1)×(列数-1))を習得します。また、検定の 前提(独立な観測、相互排他的かつ網羅的なカテゴリー、期待度数 $\gtrsim 5$)と、前提が満たされない場合に Fisherの正確確率検定 (fisher.test()) を使用する重要性を学びます。検定結果は 標準化残差 や モザイク図 で可視化し、「どこが異なっているか」を具体的に解釈できるようになります。

③ このテーマでは、χ²検定が統計的に有意であると判断された場合に、その 効果の大きさや連関の強さ を示す指標を学習します。具体的には、Cramer''s V や φ(ファイ)係数 といった効果量を計算し、その目安を理解します。さらに、2x2のクロス集計表でよく用いられる 相対リスク(RR) と オッズ比(OR) を計算し、それぞれの95%信頼区間を算出する方法と、その解釈(RR/ORが1をまたぐかどうかで有意性を判断)を学びます。
また、正規性の仮定が満たされない場合や、データが順序尺度である場合に用いる 順位ベースのノンパラメトリック検定 を導入します。具体的には、順位データに対する相関分析として Spearmanのρ を、2群間の比較として Mann–WhitneyのU検定 (wilcox.test()) を、3群以上の比較として Kruskal–Wallis検定 (kruskal.test()) の使い方を習得します。これにより、パラメトリック検定の仮定が困難な場面でも、データから有効な知見を引き出すための選択肢を増やします。

キーワード ① カイ二乗検定 (χ²検定) ② 比率の検定 (prop.test, binom.test) ③ オッズ比 (OR) / 相対リスク (RR) ④ ノンパラメトリック検定 ⑤ クロス集計表
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 復習ポイント】 Chapter 12の頻度解析を習得するためには、これまでの章で学んだ統計学の基礎が不可欠です。
• Rの超基本操作とデータ型:table(), xtabs() などの関数をスムーズに使うため、Rの基本的なデータ型(ベクトル、データフレーム、因子)、データの読み込み、オブジェクト指向の考え方、およびスクリプト運用 を復習しましょう。特に、カテゴリー変数をRで factor として適切に扱う方法が重要です。
• 仮説検定の一般手順:帰無仮説と対立仮説の設定、有意水準 ($\alpha$)、第一種・第二種の誤り、p値、信頼区間 といった仮説検定の基本的な枠組み は、比率やχ²検定の結果を正しく解釈するために不可欠です。
【予習ポイント】 Chapter 12で得た知識は、今後のより発展的な解析手法へと繋がります。
• 分散分析(ANOVA):次のChapter 13で学ぶANOVAは、3群以上の量的変数間の平均差を検定する手法です。質的変数(グループ)が量的変数に影響を与えるという点で、頻度解析とは異なるアプローチですが、カテゴリー変数と量的変数の関係性を分析する共通の目的を持ちます。

15 一元配置分散分析(One-way ANOVA) 科目の中での位置付け この講義で学ぶ一元配置分散分析(One-way ANOVA)は、統計学における平均値の比較に関する主要な解析手法の一つであり、特に 3つ以上のグループの平均値に統計的に有意な差があるかどうか を包括的に検定する際に用いられます。これまでの章で2つのグループ間の平均差を評価する t検定 を学習しましたが、ANOVAはこれを発展させ、多重比較に伴う第一種の過誤(誤って差があると判断してしまう確率)の増加 という問題を回避するために開発されました。
統計学が「不確実性を定量化し、意思決定を支援する」学問である中で、ANOVAは、複数の介入効果や異なる条件が量的変数に与える影響を効率的かつ信頼性高く評価するための強力なツールです。例えば、複数の肥料が作物の成長に与える影響や、異なる学習方法が試験の成績に与える差などを分析する際に活用されます。この手法は、データサイエンス、機械学習、AIの基礎体力としても位置づけられ、Rという 無料の計算環境 とRStudioという 統合開発環境 を用いて 「とりあえず手を動かしながら」 学習を進めることで、再現可能な分析 のスキルも同時に習得できるよう設計されています。この章で得られるスキルは、学術・産業・行政のあらゆる現場で 強力な武器 となり、実生活の問いに答える 「現実解」 を導き出すための実用的なツールとなります。

講義用パワーポイント
講義資料Chapter 13
コマ主題細目 ① ANOVAの概念と基礎理論の理解 ② RでのANOVA実施と効果量・事後比較 ③ 仮定と診断、結果のAPA形式での報告
細目レベル ① このテーマでは、一元配置ANOVAが 3水準以上の平均差 を検定する 包括(omnibus)検定 であることを理解します。ANOVAの基本的なアイデアは、「群間のばらつき(グループ間の平均の差)」と「群内のばらつき(各グループ内のデータの散らばり)」の比をとった F統計量 で判断するというものです。もし群平均どうしの差が群内の散らばりに比べて十分に大きければ、F値は1より大きくなり、帰無仮説(すべての母平均は等しい)が棄却され、「どこかの平均に差がある」と結論付けられます。
学習では、帰無仮説(例:$\mu_A=\mu_B=\mu_C$)と 対立仮説(どこかの母平均が異なる)の立て方を明確にします。ANOVAが、どの群が高いかまでは特定しない包括的な検定である点も重要なポイントです。また、多重比較の問題、すなわち複数のt検定を繰り返すことによって 家族内誤差率 が増加し、誤って有意差を検出する確率が高まるため、ANOVAが推奨される理由を深く理解します。

② このテーマでは、R言語を用いて一元配置ANOVAを 実践的に 実施する方法を習得します。Rの aov() 関数を用いてANOVAモデルを構築し、summary() 関数で ANOVA表(Df / Sum Sq / Mean Sq / F value / Pr(>F))を出力し、その結果(特にF値とp値)を読み解けるようになります。p値が有意であれば「どこかの平均が違う」と判断し、次に 効果量(η²) の計算に移ります。η²は「効果の平方和 / 総平方和」として手計算でも確認しますが、実務では effectsize パッケージの eta_squared() 関数を使うのが便利であることを学びます。
ANOVAが包括検定であるため、有意な差が認められた場合には、事後比較(post-hoc test) を行い、「どのグループ間に具体的な差があるのか」を特定します。最も一般的な事後比較法の一つである TukeyのHSD(Honest Significant Difference) を TukeyHSD() 関数で実行し、出力される「差(diff)、95%信頼区間(lwr/upr)、調整済みp値(p adj)」を解釈する方法を習得します。これにより、家族内誤差率を制御 しつつ、具体的なグループ間の差を明らかにします。

③ このテーマでは、ANOVAを行う上での 前提条件(仮定) と、分析の信頼性を確保するための 診断 方法を深く理解します。ANOVAの主な仮定は、観測の独立性、各群のデータの 正規性、そして 等分散性(各群の分散が等しいこと)です。特に等分散性が崩れると、ANOVAのp値が信頼できなくなり、第一種の過誤が増加する可能性が高まるため、Levene検定 (car::leveneTest()) を用いて等分散性をチェックする重要性を学びます。
また、残差の診断(正規性や外れ値のチェック)を通じて、モデルの妥当性を評価する方法も習得します。仮定が満たされない場合(例:正規性が著しく欠如している場合)には、Kruskal-Wallis検定 といったノンパラメトリックな代替手法を検討する必要があることも学びます。最後に、統計解析の結果をAPA形式(American Psychological Association形式)で標準的に報告する方法を習得します。apa::anova_apa() 関数などを用いて、自由度、F値、p値、効果量 を簡潔かつ適切な書式でまとめるスキルを身につけます。

キーワード ① 分散分析 (ANOVA) ② F統計量 ③ 包括検定 (omnibus test) ④ 事後比較 (Tukey HSD) ⑤ 等分散性 (Levene検定)
コマの展開方法 社会人講師 AL ICT PowerPoint・Keynote 教科書
コマ用オリジナル配布資料 コマ用プリント配布資料 その他 該当なし
小テスト 「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施します。
復習・予習課題 【復習ポイント】 Chapter 13の分散分析を深く理解するためには、これまでの章で学んだ基本的な概念が不可欠です。
• Rの超基本操作とデータ操作:factor 変数の扱い方、データフレームの操作、plot() や ggplot2 を用いた可視化 は、ANOVAを行う上で不可欠なスキルです。特に、箱ひげ図 による複数群の分布比較 は、ANOVAのアイデアを視覚的に理解するのに役立ちます。
• 仮説検定の一般手順:帰無仮説と対立仮説の設定、有意水準、第一種・第二種の誤り、p値、信頼区間 といった仮説検定の枠組み は、ANOVAの結果を正しく解釈するために不可欠です。
【予習ポイント】 Chapter 13の分散分析で得た知識は、今後のより発展的な解析手法へと繋がります。
• 多因子分散分析(Two-way ANOVAなど):一元配置ANOVAは1つの因子(グループ変数)しか扱いませんが、複数の因子が目的変数に与える影響や、因子間の 交互作用(interaction) を分析する多因子分散分析 へと発展します。

履修判定指標
履修指標履修指標の水準キーワード配点関連回
データの要約と可視化、Rの基本操作の習得 統計解析の出発点として、与えられたデータセットの全体像を迅速かつ正確に把握し、主要な特徴を数値(平均、中央値、分散、四分位範囲など)で要約できる能力が求められます。さらに、これらの情報を視覚的(ヒストグラム、箱ひげ図、散布図、棒グラフなど)に表現し、その図からデータの特徴を読み取ることができる必要があります。RおよびRStudioの基本的な操作(オブジェクト指向の理解、<-による代入、データの読み込み、help()機能の利用、スクリプト運用など)を習得し、実際のデータ分析作業に着手できること。特に、データの型(ベクトル、データフレーム、因子)を理解し、欠損値(NA)の扱いに注意しながら、カテゴリ変数と数値変数を適切に処理できることが重要です。 要約統計量、可視化、Rstudio 20 1, 2, 8
確率の基礎概念 主観確率と客観確率(相対頻度としての確率)の違いを理解し、ランダム試行における標本空間、事象、和事象、積事象、互いに排反な事象、余事象といった概念を、確率の公理と関連付けて説明できること。 確率の公理 10 3, 4
主要な確率分布の理解 また、統計的推測の土台となる離散型確率分布(ベルヌーイ、二項、幾何、超幾何、負の二項、ポアソン)と連続確率分布(正規分布、指数分布、ガンマ分布、ベータ分布、対数正規分布)について、「いつ、なぜその分布を使うのか」を説明し、それぞれのpmf/pdf、cdf、平均、分散の計算方法を理解する。Zスコアを用いた標準化や、Rのd/p/q/r系関数(例:dbinom, pnorm)を使いこなして確率計算やシミュレーションを実行できる能力も含まれます。 pmf/pdf/cdf、正規分布 10 5, 6, 7
推測統計の基礎概念(推定・仮説検定・標本抽出)の理解と適用 母集団の特性を推測するために、確率抽出(単純無作為抽出、系統抽出、層化抽出、クラスター抽出)と非確率抽出の各手法の長所・短所を説明し、適切な抽出法を選択できること。標本平均や標本割合の標本分布、その広がりを示す標準誤差(SE)区間推定(信頼区間、信頼係数の解釈)の違いを説明し、母平均や母比率の信頼区間をRで算出し、その結果を適切に解釈できること。仮説検定の枠組み(帰無仮説・対立仮説の設定、第一種・第二種の誤り、検出力(パワー)、p値法・臨界値法)を理解し、1標本の母平均(z検定/t検定)および母比率の検定をRで実行・解釈できることが求められます。 推定、仮説検定、標準誤差 20 9, 10, 11
主要な統計解析手法の習得と実践 二変数の線形関係の強さを測るピアソン積率相関係数の意味、性質、限界を理解し、Rで計算(cor(), cor.test())および散布図による可視化ができること。相関係数の有意性検定と信頼区間、決定係数3タイプ(1標本、2標本独立、対応あり)とその前提条件を理解し、Welch検定と等分散を仮定するt検定の使い分け、効果量(Cohen''s d)独立性検定、相対リスク(RR)・オッズ比(OR)の計算と解釈ができること。さらに、3群以上の平均差を検定する一元配置分散分析(ANOVA)の基本手順、F統計量、効果量(η²)、事後比較(Tukey HSD)をRで実行し、結果を適切に解釈できることが求められます。 相関係数、t検定、カイ二乗検定、分散分析 30 12, 13, 14, 15
再現可能なレポート作成能力 データ分析のプロセスと結果を透明かつ再利用可能な形で共有するため、R Markdown(.Rmd)再現性担保、共同作業の効率化、信頼性向上)を理解し、分析結果を他者に正確かつ効率的に伝えることができること。分析の過程で必要なパッケージのインストールと読み込み、作業ディレクトリの理解と設定、データの読み込みを適切に行い、つまずきやすいポイント(例:文字コード、欠損値の扱い)に対処できることも含まれます。 R Markdown、再現性、レポート 10 1, 10, 11
評価方法 期末試験100%
評価基準 評語
    学習目標をほぼ完全に達成している・・・・・・・・・・・・・ S (100~90点)
    学習目標を相応に達成している・・・・・・・・・・・・・・・ A (89~80点)
    学習目標を相応に達成しているが不十分な点がある・・・・・・ B (79~70点)
    学習目標の最低限は満たしている・・・・・・・・・・・・・・ C (69~60点)
    学習目標の最低限を満たしていない・・・・・・・・・・・・・ D (60点未満)
教科書
参考文献 小波秀雄著 『統計学入門』  http://konamih.sakura.ne.jp/Stats/Text/ 無料
実験・実習・教材費