区分
環境情報科目
ディプロマ・ポリシーとの関係
カリキュラム・ポリシーとの関係
カリキュラム全体の中でのこの科目の位置づけ
近年、社会のあらゆる分野においてデータに基づく意思決定の重要性が高まっており、統計的な考え方を身につけることは専門分野を問わず不可欠となっている。本科目は、データ処理に対する解析技術の基本から応用までを取り扱う科目群の入門的位置づけである。特に、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力は、情報社会における基礎的なリテラシーとして求められている。本科目は、こうした背景を踏まえ、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶことを目的とする。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
科目の目的
Society 5.0の進展に伴い、データを根拠として状況を把握し、合理的な判断を行う能力は、専門分野を問わずすべての学習者に求められる基礎的素養となっている。統計学を初めて学ぶ段階においては、数式や理論の理解に偏るのではなく、実際のデータを扱いながら統計的な見方・考え方を身につけることが重要である。本科目は、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、グラフによる可視化といった基本的な統計処理を段階的に修得させることを目的とする。さらに、可視化されたデータを読み取り、その意味や限界を考察する力を養うことで、将来の統計学・データサイエンス分野の学修や、実社会におけるデータ活用の基礎となる統計的リテラシーの育成を目指す。
到達目標
1.<基礎>データを入力・整理し、平均・中央値・分散などの基本的な統計量を算出できる。
2. <基礎>ヒストグラム、箱ひげ図、散布図、時系列グラフなどの代表的な可視化手法を適切に選択して表現できる。
3. <基礎>Excelにおいては、関数やグラフ作成機能を活用し、データの集計から可視化までの一連の操作ができる。
4. <応用>Pythonを用いた基礎的なデータ処理およびグラフ描画ができる。
5. <発展>回帰分析や時系列データの可視化に関する基本的な考え方を理解し、可視化された結果を読み取り、その妥当性や限界を考察することができる。
科目の概要
本科目の内容は、大きく5つの構成に分類できる。第1回から3回までが「統計とは何か・データの基礎」を取り扱う。第4回から14回までが「分布・代表値およびグラフによる可視化」について取り扱う。第15回から17回が「時系列データと可視化」について取り扱う。第18回から27回が「Pythonによる代表値算出・可視化」について取り扱う。第28回から30回が「EDA・ストーリーテリング」について取り扱う。
以下では、各回の構成について、より詳細に説明する。第1回では、統計学の役割や身近な利用例を通して、データと情報の違いや、統計でできること・できないことを理解し、本科目全体の学修内容と目的を確認する。第2回および第3回では、Excelを用いてデータの種類や尺度(名義・順序・間隔・比例尺度)を学び、統計処理を行う際の基礎的な考え方を身につける。
第4回から第5回までは、平均・中央値・最頻値などの代表値を扱い、数値によるデータの要約方法を学ぶ。第6回から第9回までは、データの特徴を可視化する方法を、実習を通して理解する。棒グラフ・円グラフ・折れ線グラフなどの基本的なグラフ表現を取り上げ、グラフの選択や読み取りにおける注意点を理解する。特にヒストグラムについては、度数分布表と合わせて、分布の偏りも読み取れるように実習を通じて理解する。第10回から第11回では、分散・標準偏差といった散布度を扱い、第12回では、箱ひげ図を用いて分布の広がりや外れ値を読み取る力を養う。第13回から第14回では、クロス集計から比率を取り扱い、次に続く時系列への理解につながるよう可視化と、考え方について学ぶ。
第15回から第17回では、時系列データを対象として、折れ線グラフによる変化の把握、増減率や移動平均の考え方を学習し、時間的推移を読み取る力を身につける。
第18回および第19回では、Pythonの基本操作およびデータの読み込み方法を学び、Excelで扱ってきたデータをPython環境で処理するための基礎を固める。第20回から第23回では、Pythonを用いて代表値の算出やヒストグラム、箱ひげ図などの可視化を行い、ツールの違いによる操作方法と結果の対応関係を理解する。第24回から第26回では、2変数間の関係性に着目し、Pythonによる散布図や時系列グラフの作成を通して、データの関係性や変化を可視化する方法を学ぶ。特に、関係性の強度を算出する相関係数について算出できるようにする。相関関係と因果関係の違いについて、擬相関を例に挙げながら学ぶ。第27回では、散布図に回帰直線を重ねることでデータの傾向を線で表現する考え方を学び、回帰分析の基本的な意味と限界を理解する。
第28回では、探索的データ分析の考え方を取り上げ、複数の可視化結果を統合してデータの特徴を把握する方法を学ぶ。第29回では、データ可視化によるストーリーテリングをテーマとし、事実を示すグラフと主張を伝えるグラフの違いについて理解を深める。最終回(第30回)では、可視化と主張の妥当性を検討するとともに、良い可視化・悪い可視化を振り返り、統計と可視化を活用するための視点を総括する。
科目のキーワード
統計リテラシー データ活用 数理・データサイエンス Excel操作 Pythonプログラミング データの種類と尺度 度数分布表 代表値(平均・中央値・最頻値) 分散・標準偏差 四分位数・箱ひげ図 グラフ作成(棒・円・折れ線・ヒストグラム) クロス集計 時系列データと指数 散布図と相関 相関係数 データの可視化 統計的思考 AI・情報教育基礎
授業の展開方法
本科目では、一コマ90分のなかで重要用語の解説と実機による実習を交互に織り交ぜ、概念的な理解にとどまらず、操作スキルの向上をはかる。そのため、毎回の授業で重要用語の解説とパソコン上の操作を指示する図版を掲載したテキストを配布し、テキストに沿って講師が説明を行い、それにしたがって各自が実機で操作を行うという手順で実習を進める。
・1回の授業構成
1. 導入(10分):前回の内容を振り返り、今回の学びの目標を提示する。
2. 講義(60分):テーマに基づき、具体例を交えた解説を行います。スライドや映像を活用し、視覚的にも分かりやすい授業を展開する。
3. 小テスト(10分):講義内容の理解を深める。
4. まとめと次回予告(10分):授業内容の要点をまとめ、次回の予告を行い、予習の確認を行う。
第1回では、統計でできること・できないことを理解し、本科目全体の学修内容と目的を確認するため、基本的に座学となる。以降の各回においては、ExcelまたはPythonを使った演習が多く存在する。
第2回および第3回では、Excelを用いてデータの種類や尺度(名義・順序・間隔・比例尺度)を学ぶ。演習を通して、統計処理を行う際の基礎的な考え方を身につける。
第4回から17回までは、Excelの演習が主となる。第4回と第5回は代表値の算出をし、第6回から9回までは、算出された代表値を可視化する。第10回から12回はデータの散らばりを示す代表値である分散について取り扱うため、また数値算出が主となるが、その代表値の可視化も取り扱うことで、データのバラつきを感覚的に理解する。そのため、関数を使っての数値算出、グラフ作成が交互に実施される。第13回と14回は、クロス集計について取り扱うが、焦点をあてるのは、比率や割合についてである。比率の理解を促しつつ、Excelでクロス集計表とそのグラフ作成を実施する。第15回から17回では、第13回と14回で取り扱った比率から、増減率・変化率・指数の理解に発展し、折れ線グラフとの関係を、数値算出とグラフ作成を通じて理解する。
第18回から30回までPythonを使用する。PythonはVScodeで使用し、Jupyter Notebookを使用する。第18回から22回までは、Excelで実施した内容をPythonで実施できるようにしつつ、これまでの内容を振り返る。第23回から27回では、ExcelとPython両方使用する。ここでは、分布の形から、2変数間の関係性を示す代表値と、可視化である散布図を、ExcelとPythonで作成し、その見え方を確認しつつ、解釈を理解していく。第28回から30回までは、Pythonのみとなる。
オフィス・アワー
請園正敏:【前期】
月曜4限、水曜4限、金曜5限
【後期】
環境統計学概論月曜4限、水曜4限
渡辺謙:【前期】
環境データベース概論
環境データベースⅡ
環境プログラミングⅣ(永続化技法)
全科目:木曜5限
【後期】
環境データベースⅠ
環境データベースⅢ
コンピュータ・アーキテクチャ論
全科目:木曜5限
科目コード
UC4060
学年・期
2年・後期
科目名
環境統計学概論
単位数
4
授業形態
演習
必修・選択
選択
学習時間
前提とする科目
展開科目
関連資格
担当教員名
請園正敏・渡辺謙
回
主題
コマシラバス項目
内容
教材・教具
1
統計とは何か・データの意味を知る
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第1回目の授業では、統計学がどのような場面で利用されているのかを身近な事例を通して紹介し、統計を学ぶ意義について理解することから始める。あわせて、データと情報の違いを整理し、数値やグラフがどのように解釈され、意思決定に活用されているかを確認する。さらに、統計で「できること」と「できないこと」を区別することで、統計的手法の限界を理解し、本科目全体を通して統計をどのような姿勢で学ぶべきかを明確にする。本回は、以降の各回で扱う可視化や分析手法の基礎となる考え方を身につける導入回として位置づけられる。
コマ主題細目
① 統計の役割と身近な利用例 ② データと情報の違い ③ 統計でできること・できないこと
細目レベル
① 統計学が現代社会のさまざまな場面でどのように活用されているかを、具体例を通して理解するまでを目的とする。まず、ニュースや広告、行政資料、スポーツの成績、SNS上のランキングなど、学生の日常生活に身近な場面に統計が数多く用いられていることを示す。たとえば、世論調査の結果が政策判断に利用されている例や、売上データの分析によって商品戦略が立てられている例を取り上げ、統計が意思決定の根拠として機能していることの理解まで。
次に、統計の役割を「大量のデータを整理し、全体の傾向を把握する手段」であることの理解まで。個々の数値をそのまま眺めるのではなく、平均や割合、グラフなどを用いることで、データ全体の特徴が理解しやすくなる点を示す。また、統計は必ずしも専門家だけが使うものではなく、一般市民が情報を正しく読み取るためにも必要な基礎的知識であることを説明する。
さらに、統計を「計算技術」としてではなく、「考えるための道具」として扱うことを理解するまで。数式を暗記することよりも、数値やグラフが何を示しているのかを理解し、自分の言葉で説明できるようになることが重要であることを確認し、今後の学修に向けた心構えを形成する。
② 「データ」と「情報」という二つの言葉の違いを明確にし、統計学におけるデータの位置づけを理解するまで。まず、データとは観測や記録によって得られた数値や記号の集合であり、それ自体には必ずしも意味が付与されていないことを説明する。一方で、情報とは、データが整理・加工・解釈され、何らかの判断や行動に結びつく形になったものであることを示す。
具体例として、試験の点数の一覧表や気温の記録などを提示し、それらが単なる数値の集まりである段階と、平均値やグラフとしてまとめられた段階とでは、理解のしやすさや得られる意味が大きく異なることを確認する。この過程を通して、統計とは「データを情報へと変換するための方法」であることを理解させる。
さらに、データは必ずしも完全ではなく、欠損や誤差、ばらつきを含んでいることにも触れる。数値が示されているからといって無条件に信頼できるわけではなく、どのように集められ、どのように整理されたデータなのかを考える必要があることを強調する。本科目全体を通して、データを鵜呑みにせず、背景や前提条件を意識して読み取る姿勢を身につけるための基礎としての位置づけである。
③ 統計学の有用性を理解すると同時に、その限界についても正しく認識することまで。まず、統計で「できること」として、多数のデータから全体の傾向を把握したり、異なる集団を比較したりすることが可能である点を説明する。平均値やグラフを用いることで、複雑なデータを簡潔に表現できることを具体例とともに確認する。
一方で、統計には「できないこと」も存在することを明確にする。たとえば、相関関係と因果関係や、過去のデータから将来を完全に予測することはできないことを取り上げる。誤った解釈や過度な一般化が、誤解や不適切な判断につながる可能性があることを示し、統計結果を慎重に扱う必要性を理解させる。
また、統計はあくまで判断を支援する道具であり、最終的な意思決定そのものを代替するものではない点を強調する。本科目では、統計的手法を用いて得られた結果をどのように読み取り、どこまで信頼できるのかを考える姿勢を重視することを確認する。以降の回でグラフや分析結果を扱う際の基本的な判断基準となる重要な導入として位置づけられる。
キーワード
① 統計学 ② 数値データ ③ 可視化 ④ データ活用 ⑤ 意思決定
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
授業で取り上げた身近な事例の中から一つを選び、「どのようなデータが使われていたか」「そのデータから何が分かるとされていたか」を簡潔にまとめるように。また、「データ」と「情報」の違いについて、生成AIを活用し、自身で問題を作成し、その回答と解説を生成AIにて作成するように。
◆次コマの予習
自分の身の回りにあるデータ(例:成績、身長、アンケート回答、商品価格など)を一つ挙げ、それがどの尺度に該当するかを考えてきなさい。
2
データの種類と尺度
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第2回目の授業では、第1回で確認した「データと情報の違い」「統計でできること・できないこと」を踏まえ、統計処理の前提となるデータの種類と尺度について理解する回である。統計で扱われるデータの種類を整理し、特に「尺度」という観点からデータを分類する考え方を学ぶ。あわせて、身近な具体例を用いながら、尺度の違いによって可能な計算やグラフ表現が異なることを理解し、今後の統計処理や可視化を正しく行うための基礎的な判断力を養う。
◆コマ主題細目①
・第2回テキスト「データの種類と尺度」 第1節「データの種類(質的データ・量的データ)」
◆コマ主題細目②
・第2回テキスト「データの種類と尺度」 第2節「尺度の考え方(名義・順序・間隔・比例尺度)」
◆コマ主題細目③
・第2回テキスト「データの種類と尺度」 第3節「尺度と統計処理・可視化の関係」
コマ主題細目
① データの種類(質的データ・量的データ) ② 尺度の考え方(名義・順序・間隔・比例尺度) ③ 尺度と統計処理・可視化の関係
細目レベル
① 統計学で扱われるデータを大きく「質的データ」と「量的データ」に分類する考え方を理解することまで。まず、質的データとは、数値で表されていても大小や加減算に意味を持たないデータであり、カテゴリや分類を示すものであることを説明する。性別、血液型、アンケートの選択肢などを例に挙げ、これらのデータは数値として扱われていても、平均値を求めることに意味がないことを確認する。
一方で、量的データとは、数値の大小や差、割合に意味を持つデータであり、身長、体重、点数、売上金額などが該当することを示す。量的データはさらに、連続量と離散量に分けられることにも触れ、測定値と個数データの違いを整理する。
これらの区別が重要である理由として、データの種類を誤って判断すると、不適切な統計処理や誤解を招くグラフ表現につながることを説明する。この学びを通して、統計処理を始める前に「このデータは何を表しているのか」を考える姿勢を身につけることを目標とする。
② データをより詳細に分類するための「尺度」という考え方を学び理解するまで。まず、名義尺度とは、単なる分類や区別を目的とした尺度であり、数値の大小に意味がないことを説明する。次に、順序尺度は、大小関係や順位に意味があるものの、その差の大きさまでは保証されない尺度であることを確認する。
さらに、間隔尺度と比例尺度については、数値の差に意味がある点で共通しているが、原点の意味が異なることを中心に説明する。間隔尺度ではゼロが相対的な基準であるのに対し、比例尺度ではゼロが「量が存在しない」ことを意味する点を具体例とともに整理する。
ここでは、各尺度について定義を暗記することを目的とせず、実際のデータがどの尺度に該当するかを判断できるようになることを重視する。身近なデータを題材にしながら、尺度の違いが統計処理の前提条件となることを理解させる。
③ データの尺度が統計処理や可視化の方法にどのような影響を与えるのかを具体的に確認する。まず、名義尺度や順序尺度のデータでは、平均値といった計算が必ずしも適切ではないことを説明し、度数や割合、棒グラフなどによる表現が有効であることの理解まで。
一方で、間隔尺度や比例尺度のデータでは、代表値や散布度の計算が可能であり、ヒストグラムや箱ひげ図などのグラフ表現が有効であることを確認する。ここでは、誤った尺度の理解が、誤解を招くグラフや不適切な結論につながる可能性があることを強調する。
これらの学習を通して、統計処理や可視化は機械的に行うものではなく、データの性質を踏まえて選択すべきものであることを理解させる。これは、第3回以降のExcel実習やグラフ作成に直結する重要な基礎であり、今後の学修全体を支える判断基準となる。
キーワード
① 質的データ ② 量的データ ③ データの性質 ④ 可視化の基礎
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
名義尺度・順序尺度・間隔尺度・比例尺度について、それぞれの特徴を整理しなさい。その際、生成AIを活用して各尺度に関する問題を作成させ、自身で解答したうえで、解説も生成AIに作成させ、それを基に内容をまとめること。単なる定義の暗記ではなく、どの尺度でどのような統計処理が可能か、どの代表値が適切か、どのような可視化が適しているかという観点から整理すること。尺度と統計処理の関係を体系的に理解することを目標とする。
◆次コマの予習
自分の身の回りにあるデータ(例:成績、アンケート結果、商品価格など)を一つ選び、そのデータが質的データか量的データかを判断し、さらにどの尺度に該当するかを整理してきなさい。あわせて、そのデータがどのような分布になり得るかを想定し、代表値や散らばりを考える際にどのような点に注意すべきかを考察すること。次回扱う分布や度数分布表との関連を意識し、データの性質と統計的整理の方法とを結びつけて準備すること。
3
データの整理と度数分布表
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第3回目の授業では、これまでに学んだ統計の役割と、データの種類や尺度の考え方を踏まえ、データを集計するという統計学の基本的な考え方を学ぶ回である。大量のデータをそのまま眺めるだけでは全体の特徴を把握することは難しいため、統計では目的に応じてデータを整理・集約する必要がある。本回では、度数分布表を中心に、データをまとめる際の考え方と基本用語を理解し、Excelを用いて実際に度数分布表を作成することで、以降の可視化学習(ヒストグラム等)の基礎を固める。まず集計の目的を明確にしたうえで、度数・階級・階級値といった基本概念を学ぶ。次に、Excelを用いた実習を通して、数値データを度数分布表として整理する方法を習得し、データの分布を把握するための基礎的な技能を身につける。
◆コマ主題細目①
・第3回テキスト「データの整理と度数分布表」 第1節「集計の目的と考え」
◆コマ主題細目②
・第3回テキスト「データの整理と度数分布表」 第2節「度数・階級・階級値」
◆コマ主題細目③
・第3回テキスト「データの整理と度数分布表」 第3節「度数分布表の作成」
コマ主題細目
① 集計の目的と考え ② 度数・階級・階級値 ③ 度数分布表
細目レベル
① 統計において「集計」が果たす役割と、その基本的な考え方の理解まで。まず、生データ、個々の数値が並んだ状態、をそのまま見ても、全体の傾向や特徴を把握することが難しいことを確認する。例えば、テストの点数が多数並んでいる場合、それだけでは成績の分布や多い点数帯を直感的に理解することは困難である。このような場合に、データをまとめて整理する操作が集計であることを説明する。
次に、集計の目的は単にデータを減らすことではなく、「全体像を把握すること」「比較や判断をしやすくすること」にある点を強調する。集計方法は目的によって異なり、何を明らかにしたいのかを意識せずに集計を行うと、かえって誤解を招く可能性があることを示す。
これらの学習を通して、集計は機械的な作業ではなく、分析や可視化の前段階として重要な判断を伴う工程であることを理解させ、次に学ぶ度数分布表の意義を明確にする。
② 度数分布表を理解するために必要な基本用語である「度数」「階級」「階級値」の意味の理解まで。まず、度数とは、ある条件を満たすデータがいくつ存在するかを表す数であり、データの多さや偏りを把握するための基本的な指標であることを説明する。
次に、数値データの範囲が広い場合には、値をいくつかの区間に分けて整理する必要があることを示し、その区間を「階級」と呼ぶことを説明する。階級を設定することで、細かすぎる情報を整理し、分布の形を把握しやすくなる点を確認する。
さらに、各階級を代表する値として用いられる階級値について説明し、階級値が分布の代表として扱われる理由を理解させる。ここででは、計算方法の暗記ではなく、「なぜそのような概念が必要なのか」を重視し、度数分布表がヒストグラム作成や分布理解の基礎となることを意識させる。
③ Excelを用いて実際に度数分布表を作成する実習を行い、その方法論の理解まで。まず、数値データをExcelに入力した状態から、データの最小値・最大値を確認し、適切な階級幅を設定する手順を示す。階級幅の選び方によって分布の見え方が変わることを確認し、機械的に決めるのではなく目的を意識する重要性を強調する。
次に、Excelの関数や機能を用いて各階級の度数を求め、度数分布表を完成させる。操作手順そのものよりも、「どの列が何を意味しているのか」を理解しながら作業を進めることを重視する。
この学習を通して、度数分布表はヒストグラム作成の前段階であり、データの分布を数値として把握するための重要な道具であることを理解させる。ここで作成した度数分布表は、以降のグラフによる可視化へと直接つながる。ここではヒストグラムを作成するところまでを実施する。
キーワード
① 度数分布表 ② 階級幅 ③ 分布
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
階級幅の設定によって、データの分布の見え方がどのように変わるかを確認しておく。今回、用語が多く出ているので、各用語が回答となるように生成AIで問題を作成させ、問題を解きながら用語を覚えるようにしておく。これまでの用語について、リスト化し、意味についてしっかり覚えるため、自身で問題を作成しながら記憶する。
◆次コマの予習
第3回で作成した度数分布表を見直し、その分布がどのような形(山の位置・広がりなど)をしているかを言葉で表現してみなさい。次回の平均値につなげるため、山の形のうち、平均値はどこになるのかを確認し、山の形、広がりと、平均値との関連について確認しておく。
4
平均値の求め方と意味
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第4回目の授業では、第3回で学んだ度数分布表によるデータの整理を踏まえ、代表値の一つである「平均値」について理解を深める回である。平均値は、データの中心を表す指標として最も広く用いられているが、その意味や限界を正しく理解せずに用いると、誤解を招く可能性がある。本回では、平均値の計算方法を確認するとともに、分布との関係や外れ値の影響を考察することで、平均値を統計的に適切に解釈するための基礎を身につける。数値データを対象として平均値を求める方法を、Excel実習を通して確認し、度数分布やヒストグラムと平均値との関係を視覚的に捉える。さらに、外れ値が平均値に与える影響を具体例によって確認することで、平均値を用いる際の注意点を理解し、以降に扱う中央値や他の代表値との比較につなげる。
◆コマ主題細目①
・第4回テキスト「平均値の求め方と意味」 第1節「平均の計算方法」
◆コマ主題細目②
・第4回テキスト「平均値の求め方と意味」 第2節「平均と分布の関係」
◆コマ主題細目③
・第4回テキスト「平均値の求め方と意味」 第3節「外れ値の影響」
コマ主題細目
① 平均の計算方法 ② 平均と分布の関係 ③ 外れ値の影響
細目レベル
① 平均値の基本的な計算方法と、その意味を理解するまで。まず、平均値とは、すべてのデータの合計をデータ数で割った値であり、データ全体の「代表的な大きさ」を表す指標であることを確認する。単純平均の計算方法を具体的な数値例を用いて示し、計算手順そのものよりも、平均値が「全体を均等に分配したときの値」として解釈できる点を強調する。
次に、Excelを用いた平均値の算出方法を確認し、関数を用いることで多数のデータに対しても容易に平均値を求められることを体験する。操作方法の説明にとどまらず、どのデータを平均の対象にしているのかを意識しながら計算する重要性を指摘する。
平均値は計算できればよいのではなく、「何を平均しているのか」「その平均値は何を表しているのか」を考えることが重要であることを理解させ、以降の代表値学習の基礎を形成する。
② 平均値とデータの分布との関係を理解するまで。まず、第3回で作成した度数分布表やヒストグラムを用い、分布の形と平均値の位置関係を確認する。分布が左右対称に近い場合には、平均値が分布の中央付近に位置することが多い一方、分布が偏っている場合には、平均値が必ずしも「代表的な値」とは言えない場合があることを示す。
具体例として、同じ平均値を持つ異なる分布を比較し、平均値だけでは分布の特徴を十分に表せないことを視覚的に確認する。これにより、平均値は分布の情報を要約した一つの指標にすぎず、分布全体と合わせて解釈する必要があることを理解させる。
この学習を通して、平均値を単独で用いるのではなく、度数分布表やヒストグラムと組み合わせて考える姿勢を養い、可視化と統計量を結びつける基礎的な考え方を身につける。
③ 外れ値が平均値に与える影響について理解するまで。外れ値とは、多くのデータから大きく離れた値のことであり、入力ミスや特殊な事象によって生じる場合がある。まず、外れ値を含むデータと含まないデータの平均値を比較し、少数の極端な値が平均値を大きく変化させる可能性があることを具体例で示す。
次に、ヒストグラムを用いて外れ値を視覚的に確認し、数値だけでは気づきにくい特徴をグラフによって把握できることを説明する。外れ値の存在を無視して平均値のみを用いると、実態とは異なる解釈につながる可能性がある点を強調する。
この学習を通して、平均値は便利な指標である一方で、外れ値に弱い性質を持つことを理解させる。この理解は、次回以降に扱う中央値や箱ひげ図、さらには最終回での「良い可視化・悪い可視化」を判断するための重要な基礎となる。
キーワード
① 平均値(算術平均) ② 代表値 ③ 外れ値
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
外れ値が平均値に与える影響について、具体例を考えなさい。授業の解説教材を用いて生成AIで問題を作成し、各概念が記憶に定着したかどうかを確認しなさい。度数分布表を作成し、山の形を確認しつつ、平均値の位置、山の形が、外れ値の有無によってどのように変化するかを、複数パターンで確認しなさい。
◆次コマの予習
平均値が代表値として適切でないと考えられる場面を一つ挙げ、その理由を考えてきなさい。次回取り扱う中央値が平均値と同じとき、異なるときには、データがどのようになっているかを確認し、平均値と中央値の関係を確認しなさい。その際、度数分布表と山も作成し、その関係についても確認しなさい。
5
中央値と最頻値
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第5回目の授業では、第4回で学んだ平均値の特徴と限界を踏まえ、代表値の他の指標である中央値および最頻値の特徴を理解する回である。平均値は広く用いられる代表値である一方、分布の偏りや外れ値の影響を受けやすいという性質を持つ。本回では、中央値と最頻値がどのような特徴を持つ代表値であるのかを確認し、分布との関係から代表値を使い分ける考え方を学ぶ。中央値および最頻値を「計算方法」よりも「特徴」に重点を置いて扱い、平均値と比較することで、それぞれの代表値がどのような場面で適しているかを具体例と可視化を通して理解する。これにより、代表値を単独で用いるのではなく、分布全体を踏まえて解釈する姿勢を身につけ、次回以降の箱ひげ図や分布比較の学習へとつなげる。
◆コマ主題細目①
・第5回テキスト「中央値と最頻値」 第1節「中央値の特徴」
◆コマ主題細目②
・第5回テキスト「中央値と最頻値」 第2節「最頻値の特徴」
◆コマ主題細目③
・第5回テキスト「中央値と最頻値」 第3節「平均・中央値・最頻の比較」
コマ主題細目
① 中央値の特徴 ② 最頻値の特徴 ③ 平均・中央値・最頻の比較
細目レベル
① 中央値がどのような性質を持つ代表値であるのかを理解するまで。中央値とは、データを大きさの順に並べたときに中央に位置する値であり、分布の中心を示す指標であることを確認する。ここでは計算手順の詳細よりも、「中央値が何を表しているか」に焦点を当てて説明する。
中央値の最も重要な特徴として、外れ値の影響を受けにくい点を取り上げる。極端に大きい値や小さい値が含まれていても、中央値はデータの順序に基づいて決まるため、大きく変化しないことを具体例で示す。これにより、平均値と比較した際の安定性を理解させる。
さらに、分布が左右に偏っている場合に、中央値が「典型的な値」として有効である理由を、ヒストグラムを用いて視覚的に説明する。所得や住宅価格など、分布が右に偏りやすいデータにおいて中央値が用いられる実例を紹介し、統計的指標が社会の中でどのように使われているかを理解させる。この学習を通して、中央値は「中心の位置」を示す代表値として重要な役割を果たすことを理解させる。
② 最頻値の特徴とその利用場面について理解するまで。最頻値とは、データの中で最も頻繁に出現する値であり、「最もよく現れる値」を示す代表値であることを確認する。最頻値は平均値や中央値とは異なり、必ずしも分布の中央に位置するとは限らない点を強調する。
最頻値の特徴として、質的データにも適用可能である点を取り上げる。アンケート結果やカテゴリデータにおいて、どの選択肢が最も多いかを把握する際に有効であることを具体例で示す。一方で、数値データにおいては、最頻値が一つに定まらない場合や、明確な最頻値が存在しない場合があることにも触れる。
最頻値は「典型的な値」を示す指標である一方で、分布全体の情報を十分に反映しない場合があることを理解させる。最頻値のみを用いてデータを解釈することの限界を認識し、他の代表値や分布と組み合わせて用いる必要性を強調する。
③ 平均値・中央値・最頻値の三つの代表値を比較し、それぞれの特徴と使い分けについて理解するまで。まず、左右対称な分布と偏りのある分布において、三つの代表値がどのような位置関係を取るかを、ヒストグラムを用いて確認する。分布の形によって、三つの値が一致する場合と大きく異なる場合があることを視覚的に理解させる。
次に、外れ値の有無が各代表値に与える影響を比較し、平均値が外れ値に敏感である一方、中央値は比較的安定していること、最頻値は外れ値の影響を受けにくい場合があることを整理する。これにより、どの代表値を用いるべきかは、データの性質や分析の目的によって異なることを理解させる。
この学習を通して、代表値は「正解が一つある指標」ではなく、目的に応じて選択すべき道具であることを強調する。この考え方は、次回以降の箱ひげ図による分布理解や、最終回での可視化結果の妥当性判断につながる重要な基礎となる。
キーワード
① 中央値 ② 最頻値 ③ 代表値 ④ 分布
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
同じデータであっても、平均値・中央値・最頻値が異なる場合がある理由を、分布との関係から説明できるようにしておく。各代表値について、生成AIで問題を作成し、各代表値について言語的に理解しておく。
◆次コマの予習
次コマではこれまでに学修した全内容に関する問題演習を扱うため、これまでの内容の復習を行っておく。特に、尺度、度数分布表、平均値、中央値、最頻値を確認し、それに合致する可視化はどれになるのかを考えておく。
6
グラフの作り方①(棒・円)
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第6回目の授業では、代表値の理解を踏まえ、データを視覚的に表現するための基本的なグラフについて学ぶ回である。本回では、棒グラフおよび円グラフを対象として、それぞれの特徴や適した利用場面を理解するとともに、Excelを用いて実際にグラフを作成する方法を習得する。数値や集計結果をそのまま表として提示する場合と、グラフとして可視化する場合とを比較し、グラフによって情報の理解がどのように変わるかを確認する。特に、棒グラフと円グラフは統計の初学段階で頻繁に用いられる一方で、使い方を誤ると誤解を招きやすいグラフでもある。本回では、グラフを「きれいに作る」ことよりも、「目的に合った形で正しく伝える」ことを重視し、今後扱うさまざまな可視化手法の基礎を固める。
◆コマ主題細目①
・第6回テキスト「グラフの作り方①(棒・円)」 第1節「棒グラフと円グラフの使い分け」
◆コマ主題細目②
・第6回テキスト「グラフの作り方①(棒・円)」 第2節「Excelでの作成手順」
◆コマ主題細目③
・第6回テキスト「グラフの作り方①(棒・円)」 第3節「グラフの見やすさ」
コマ主題細目
① 棒グラフと円グラフの使い分け ② Excelでの作成手順 ③ グラフの見やすさ
細目レベル
① 棒グラフと円グラフがそれぞれどのような目的に適したグラフであるかの理解まで。まず、棒グラフはカテゴリごとの値の大小を比較することに適しており、複数の項目間の差を直感的に把握しやすいグラフであることを確認する。一方で、円グラフは全体に対する各項目の割合、すなわち構成比を示すことに適している点を説明する。
次に、同じ集計結果を棒グラフと円グラフの両方で表現し、どのように印象や読み取りやすさが異なるかを比較する。これにより、グラフの種類はデータの内容や伝えたい目的によって選択すべきであり、どちらか一方が常に優れているわけではないことを理解させる。
これらの学習を通して、グラフを作成する前に「何を伝えたいのか」「比較したいのか、割合を示したいのか」を考えることの重要性を理解させ、以降の可視化学習における基本的な判断基準を形成する。
② Excelを用いて棒グラフおよび円グラフを作成する基本的な手順の理解まで。作成は実習を通して学ぶ。まず、度数分布表や集計結果をもとに、グラフ作成に適したデータ範囲の選択方法を確認する。次に、グラフ挿入機能を用いて棒グラフや円グラフを作成し、軸や凡例、データラベルの基本的な設定を行う。
操作手順の習得にとどまらず、「どの列をグラフ化しているのか」「この設定で正しい情報が伝わるか」を意識しながら作業を進めることを重視する。特に、円グラフでは合計が全体を表しているか、棒グラフでは縦軸の目盛りが適切であるかといった点を確認する。
これらの学習を通して、Excelは単に自動でグラフを作る道具ではなく、作成者の意図を反映させるためのツールであることを理解させ、主体的に操作・判断する姿勢を養う。
③ 作成したグラフを「見やすく」「誤解を招かない」形に整えるための基本的な考え方の理解まで。まず、タイトルや軸ラベル、凡例の有無が、グラフの理解しやすさに大きく影響することを確認する。情報が不足しているグラフは、読み手に誤った解釈を与える可能性がある点を具体例で示す。
次に、色の使い方や項目数にも注意が必要であることを説明する。特に円グラフでは、項目数が多すぎると割合の違いが分かりにくくなるため、グラフの種類を再検討する必要があることを理解させる。
これらの学習を通して、グラフは単に見た目を整えるものではなく、情報を正確に伝えるための表現であることを強調する。この考え方は、後半のストーリーテリングや良い可視化・悪い可視化を判断する力へとつながる。
キーワード
① 棒グラフ ② 円グラフ ③ 可視化 ④ カテゴリデータ ⑤ グラフの使い分け
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだ棒グラフと円グラフについて、それぞれがどのような目的に適したグラフであるかを整理し、両者の違いを自分の言葉で説明できるようにすることを復習課題とし、実際に生成AIで問題を作成し、記憶の定着をはかるようにする。あわせて、同一のデータであっても、グラフの種類や表現方法によって受ける印象が変化する理由について考察する。また、グラフを作成する際に、見やすさや誤解を招かない表現を確保するために注意すべき点を整理し、次回以降の可視化学習に備える。
◆次コマの予習
次回の授業では、折れ線グラフおよび複合グラフを用いて、データの時間的変化を表現する方法を学ぶ。そのため、配布テキストの該当箇所を事前に読み、折れ線グラフがどのようなデータや場面に適しているかを確認しておくことを予習課題とする。あわせて、複数の指標を同時に表現する複合グラフの特徴について概略を把握し、時系列データをグラフで表す際にどのような工夫が必要になるかについて考えておくことで、次回の学修を円滑に進められるよう準備する。
7
グラフの作り方②(折れ線・複合)
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第7回目の授業では棒グラフ・円グラフによる基本的な可視化を踏まえ、時間の経過に伴う変化を表現するためのグラフとして、折れ線グラフおよび複合グラフを扱う回である。数値の比較や構成比の把握に加え、データが時間とともにどのように変化しているかを理解することは、統計的思考において重要な要素である。本回では、折れ線グラフの特徴を理解し、複数の指標を同時に示す複合グラフの作成方法を学ぶことで、時系列データを適切に可視化する基礎を身につける。折れ線グラフがどのような場面に適しているかを確認したうえで、Excelを用いて実際に作成する。さらに、複合グラフを用いることで、異なる指標の変化を同時に示す際の利点と注意点を理解する。本回は、後半で扱う時系列データの分析や可視化に向けた重要な導入回として位置づけられる。
◆コマ主題細目①
・第7回テキスト「グラフの作り方②(折れ線・複合)」 第1節「折れ線グラフの特徴」
◆コマ主題細目②
・第7回テキスト「グラフの作り方②(折れ線・複合)」 第2節「複合グラフの作成」
◆コマ主題細目③
・第7回テキスト「グラフの作り方②(折れ線・複合)」 第3節「時系列変化の表し方」
コマ主題細目
① 折れ線グラフの特徴 ② 複合グラフの作成 ③ 時系列変化の表し方
細目レベル
① 折れ線グラフの特徴の理解まで。折れ線グラフは、時間の経過に伴う数値の変化を表すことに適したグラフであり、増減の傾向や変化のタイミングを把握しやすいという特徴を持つ。棒グラフが主に項目間の比較に用いられるのに対し、折れ線グラフは連続的な変化を示す表現であることを確認する。
時間を横軸に配置することの意味を整理し、データの順序がグラフの解釈に大きな影響を与える点について理解する。折れ線グラフでは、データの並び順が変わると示される意味が変化するため、時系列データを正確に配置する必要があることを、具体例を通して確認する。
こうした特徴を踏まえ、折れ線グラフは単に点を線で結ぶものではなく、時間的な流れや変化を表現するための可視化手法であることを理解し、以降の時系列データの学習に備える。
② 複合グラフの作成方法の手順理解まで。複合グラフは、棒グラフと折れ線グラフなど、異なる種類のグラフを一つの図に組み合わせて表現する方法であり、複数の指標の動きを同時に示す際に用いられる。売上と来客数、気温と電力使用量など、単位や性質の異なるデータを同時に扱う場面を例に、その有効性を確認する。
Excelを用いた実習を通して、複合グラフの作成手順を確認し、主軸と第2軸の設定方法や凡例の表示方法について理解する。特に、軸の設定が不適切な場合、データの関係が実際以上に強調されてしまう可能性がある点に注意を促す。
複合グラフは多くの情報を一度に伝えられる反面、読み手に誤解を与えやすい表現でもあることを踏まえ、使用目的を明確にしたうえで慎重に用いる必要があることを理解する。
③ 時系列データの表示方法の理解まで。時系列データを分かりやすく表現するためには、グラフの基本構造だけでなく、表示方法にも工夫が求められる。目盛りの設定や表示範囲の調整によって、変化の大きさや傾向の見え方が大きく変わることを確認し、不適切な設定が誤解を招く可能性がある点を具体例で示す。
また、補助線やマーカー、注釈を適切に用いることで、重要な変化点や特徴的な時期を強調できることを確認する。一方で、装飾を過度に加えると、情報がかえって伝わりにくくなる点にも注意を向ける。
時系列グラフは、変化を正確に伝えることを目的とした表現であり、見やすさと正確さの両立が重要であることを理解する。この考え方は、後半で扱う時系列分析や、ストーリーテリングにおけるグラフ表現の基礎となる。
キーワード
① 折れ線グラフ ② 複合グラフ ③ 時系列データ ④ 可視化による比較
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで扱った折れ線グラフおよび複合グラフについて、それぞれがどのようなデータや目的に適しているかを整理し、棒グラフとの違いを踏まえて説明できるように、生成AIで問題を作成し、その問題を解くことを復習課題とする。特に、折れ線グラフが時間の経過に伴う変化を表すための表現である点や、複合グラフが複数の指標を同時に示す際に有効である一方、軸の設定によって誤解を招く可能性がある点について理解を深める。また、時系列データをグラフで表現する際に、見やすさや正確さを確保するためにどのような工夫が必要であるかを振り返り、グラフ表現の基本的な判断基準を確認する。
◆次コマの予習
次回の授業では、作成されたグラフをどのように読み取り、解釈するかを学ぶ。そのため、配布テキストの該当箇所を事前に読み、グラフからどのような傾向が読み取れるのか、また表現の仕方によって受ける印象がどのように変化するのかについて考えておくことを予習課題とする。特に、軸の取り方や表示範囲の違いが、グラフの解釈に与える影響に着目し、正しい読み取りとは何かを意識しながら次回の学修に備える。
8
グラフの読み取りと解釈
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第8回目の授業では第6回および第7回で学んだグラフの作成方法を踏まえ、作成されたグラフをどのように読み取り、解釈すべきかを学ぶ回である。統計においては、グラフを作成できることだけでなく、その内容を正しく理解し、過不足なく意味を読み取る力が重要である。本回では、グラフから読み取れる傾向や特徴を整理するとともに、表現方法によって生じる印象の違いに注意を向け、統計的に妥当な解釈を行うための基礎を身につける。棒グラフ・円グラフ・折れ線グラフなど、これまで扱ってきたグラフを題材として、どのような情報が読み取れるのかを確認する。あわせて、グラフ表現が読み手に与える影響について考察し、誤解を招かないために必要な視点を整理する。本回は、後半で扱う散布図や回帰、ストーリーテリングにつながる「グラフを読む力」を養う重要な回として位置づけられる。
◆コマ主題細目①
・第8回テキスト「グラフの読み取りと解釈」 第1節「グラフから読み取れる傾向」
◆コマ主題細目②
・第8回テキスト「グラフの読み取りと解釈」 第2節「グラフの印象操作」
◆コマ主題細目③
・第8回テキスト「グラフの読み取りと解釈」 第3節「グラフを正しく解釈」
コマ主題細目
① グラフから読み取れる傾向 ② グラフの印象操作 ③ グラフの正しい解釈
細目レベル
① グラフから読み取れる傾向を理解するまで。グラフは、数値の一覧表では把握しにくい全体的な傾向や特徴を視覚的に示す手段である。棒グラフからは項目間の大小関係や差の有無を、円グラフからは構成比や割合の偏りを、折れ線グラフからは時間的な増減の傾向を読み取ることができる。それぞれのグラフが、どのような情報を伝えることに適しているかを整理する。
具体的な例を用いて、増加・減少の傾向、変化の大きさ、ピークや谷の位置など、グラフから読み取れる代表的なポイントを確認する。また、複数のグラフを比較することで、単独のグラフだけでは見えにくい特徴が明らかになる場合があることにも触れる。
グラフを読む際には、まず全体を俯瞰し、その後に細部を確認するという段階的な読み取りが有効であることを理解し、感覚的な印象だけで判断しない姿勢を身につける。
② グラフの印象を操作できるようになるまで。グラフは客観的な情報を示す手段である一方、表現方法によって読み手に与える印象が大きく変わる場合がある。縦軸の目盛りの取り方や表示範囲の設定によって、変化が実際よりも大きく、あるいは小さく見えることがある点を、具体例を通して確認する。
また、色の使い方や項目の並び順、補助線や強調表示の有無によって、特定の部分が強調されることがある。こうした表現は必ずしも誤りではないが、意図的・無意識的に印象を操作してしまう可能性があることを理解する。
このような印象操作の例を検討することで、グラフを見る際には「どのように作られているか」にも注意を向ける必要があることを認識し、情報を批判的に読み取る視点を養う。
③ グラフを正しく解釈できるようになるまで。そのためには、読み取れる事実と読み取れない事柄を区別することが重要である。グラフが示しているのはデータに基づく傾向や関係であり、必ずしも因果関係や将来の予測を意味するものではない点を確認する。
また、グラフを解釈する際には、データの対象や条件、集計方法などの前提を意識する必要がある。これらの情報が不明確な場合、解釈には慎重さが求められる。
正しい解釈とは、グラフの形から安易に結論を導くことではなく、示されている範囲内で妥当な説明を行うことであることを理解する。この考え方は、今後扱う散布図や回帰分析、最終回の「可視化と主張の妥当性」を判断するための重要な基礎となる。
キーワード
① グラフの読み取り ② 傾向の把握 ③ 比較 ④ 時間的変化
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで扱ったグラフの読み取りと解釈について、棒グラフ・円グラフ・折れ線グラフを例に、それぞれのグラフからどのような傾向や特徴が読み取れるのかを整理し、生成AIで問題を作成し、その課題を解くことを復習課題とする。あわせて、縦軸の目盛りや表示範囲、色の使い方などの表現方法によって、同じデータであっても受ける印象が変化する理由について振り返る。グラフが示している事実と、そこから安易に読み取ってはいけない内容を区別し、統計的に妥当な解釈とは何かを自分の言葉で説明できるようにすることを目標とする。
◆次コマの予習
次回の授業では、度数分布表をもとにヒストグラムを作成し、数値データの分布の形を読み取る方法を学ぶ。そのため、配布テキストの該当箇所を事前に読み、度数分布表とヒストグラムの関係について確認しておくことを予習課題とする。特に、階級幅の設定によってヒストグラムの形がどのように変化するか、また分布の偏りがどのように表現されるかに着目し、分布をグラフから読み取るとはどういうことかを意識しながら次回の学修に備える。
9
ヒストグラム
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第9回目の授業では、第3回で学んだ度数分布表による集計の考え方、および第8回で確認したグラフの読み取りと解釈を踏まえ、数値データの分布を視覚的に表現する方法としてヒストグラムを扱う回である。ヒストグラムは、データの中心やばらつき、偏りの有無といった分布の特徴を把握するための基本的なグラフであり、以降に扱う箱ひげ図や正規性の考え方の基礎となる重要な可視化手法である。度数分布表とヒストグラムの関係を整理したうえで、Excelを用いてヒストグラムを作成する。さらに、階級幅の設定によってグラフの形がどのように変化するかを確認し、分布の偏りをどのように読み取るかについて考察する。本回は、「数値の集まり」を「分布」として捉えるための重要な転換点として位置づけられる。
◆コマ主題細目①
・第9回テキスト「ヒストグラム」 第1節「度数分布表からヒストグラム」
◆コマ主題細目②
・第9回テキスト「ヒストグラム」 第2節「階級幅と形の関係」
◆コマ主題細目③
・第9回テキスト「ヒストグラム」 第3節「分布の偏りを読む」
コマ主題細目
① 度数分布表からヒストグラム ② 階級幅と形の関係 ③ 分布の偏りを読む
細目レベル
① ヒストグラムは、度数分布表をもとに作成されるグラフであり、数値データがどの範囲にどれくらい分布しているかを視覚的に示す。度数分布表で整理された階級と度数が、ヒストグラムでは横軸と縦軸にどのように対応しているかを確認することで、表とグラフの関係を理解するまで。
Excelを用いた実習では、度数分布表を準備した状態からヒストグラムを作成し、各階級が隣り合った棒として表現される理由を確認する。棒グラフとの違いに触れながら、ヒストグラムではデータが連続的な数値であることを前提としており、棒と棒の間に隙間がないことが特徴である点を整理する。
こうした操作を通して、ヒストグラムは単なるグラフ作成の技術ではなく、分布の形を捉えるための表現であることを理解し、以降の分布理解につなげる。
② ヒストグラムの形は、階級幅の設定によって大きく左右される。階級幅が狭すぎる場合には、細かな変動が強調され、全体の傾向が把握しにくくなる。一方で、階級幅が広すぎる場合には、分布の特徴が隠れてしまう可能性があることを、具体例を通して確認する。階級幅と分布の形を視覚的に理解するまで。
Excelを用いた演習では、同じデータに対して異なる階級幅を設定し、ヒストグラムの形がどのように変化するかを比較する。これにより、階級幅は機械的に決めるものではなく、データの範囲や目的に応じて調整する必要があることを理解する。
ヒストグラムを解釈する際には、その形がデータの性質を反映したものなのか、階級設定の影響を強く受けた結果なのかを考える姿勢が重要であることを確認し、グラフを批判的に見る視点を養う。
③ 分布の偏りを視覚的に理解するまで。ヒストグラムを用いることで、データの分布に偏りがあるかどうかを視覚的に把握することができる。分布が左右対称に近い場合と、片側に裾を引くような形になる場合とを比較し、偏りの有無がどのように表れるかを確認する。
具体的には、右に偏った分布や左に偏った分布の例を用い、平均値や中央値との関係についても触れる。分布の偏りによって、代表値の解釈が変わる可能性があることを理解し、前回までに学んだ代表値の内容と結びつける。
分布の偏りを読むことは、単に形を眺めることではなく、データがどのような性質を持っているかを考える手がかりとなる。この視点は、次回以降に扱う箱ひげ図や、最終的な探索的データ分析において重要な基礎となる。
キーワード
① ヒストグラム ② 度数分布表 ③ 階級 ④ 分布の偏り
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだヒストグラムについて、度数分布表との関係を整理し、ヒストグラムが数値データの分布をどのように表現しているかを、生成AIで問題を作成し、確認することを復習課題とする。特に、階級幅の設定によってヒストグラムの形がどのように変化するかを振り返り、分布の形が必ずしも一意に決まるものではないことを理解する。また、ヒストグラムから分布の偏りを読み取る際に、どのような点に着目すべきかを整理し、代表値との関係も含めて分布を解釈する視点を身につけることを目標とする。
◆次コマの予習
次回の授業では、データの「散らばり」に注目し、範囲や分散といった指標を用いて、データの広がりを数値として捉える方法を学ぶ。そのため、配布テキストの該当箇所を事前に読み、「散らばり」とは何を意味するのかを確認しておくことを予習課題とする。あわせて、ヒストグラムで確認した分布の形を思い出し、同じ平均値を持つデータであっても、散らばりの大きさが異なる場合があることに着目する。分布の広がりを数値で表すとはどういうことかを考えながら、次回の学修に備える。
10
散らばり①:範囲と分散
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第10回目の授業では、第4回・第5回で学んだ代表値(平均・中央値・最頻値)および第9回で扱ったヒストグラムによる分布の把握を踏まえ、データの「散らばり」に注目する回である。代表値がデータの中心を示すのに対し、散らばりはデータがどの程度広がっているかを表す指標であり、データの特徴を理解するうえで欠かせない視点である。まず散らばりとは何を意味するのかを整理し、範囲および分散という基本的な指標を用いて、データの広がりを数値として捉える方法を学ぶ。あわせて、ヒストグラムなどの可視化と結びつけながら、散らばりの大きさを視覚的に理解することで、数値とグラフを対応づけて解釈する力を養う。本回は、次回以降に扱う標準偏差や箱ひげ図の基礎となる重要な回として位置づけられる。
◆コマ主題細目①
・第10回テキスト「散らばり①:範囲と分散」 第1節「散らばりとは」
◆コマ主題細目②
・第10回テキスト「散らばり①:範囲と分散」 第2節「範囲と分散」
◆コマ主題細目③
・第10回テキスト「散らばり①:範囲と分散」 第3節「分散を視覚的に理解」
コマ主題細目
① 散らばりとは ② 範囲と分散 ③ 分散を視覚的に理解
細目レベル
① データの散らばりとは、個々の値がどの程度ばらついているか、すなわちデータの広がりの度合いを表す概念であり、その理解まで。同じ平均値を持つデータであっても、値が平均の近くに集中している場合と、広い範囲に分布している場合とでは、データの性質は大きく異なることを、具体例を通して確認する。
ヒストグラムを用いて、散らばりが小さい分布と大きい分布を比較し、分布の幅や形の違いが散らばりの違いとして表れることを理解する。代表値だけでは把握できないデータの特徴を、散らばりという視点から補う必要がある点を強調する。
こうした考察を通して、散らばりは代表値と組み合わせて解釈されるべき指標であり、データの全体像を捉えるための重要な要素であることを理解する。
② 散らばりを表す最も基本的な指標として、範囲と分散の理解まで。範囲は、データの最大値と最小値の差によって定義され、データがどれだけ広い区間に分布しているかを簡潔に示す指標である。一方で、極端な値の影響を受けやすいという特徴があることにも触れる。
分散は、各データが平均からどれだけ離れているかに注目した指標であり、散らばりの大きさをより体系的に捉えるための方法である。計算の仕組みについては、数式の暗記を目的とするのではなく、「平均との差を考える」という発想を中心に説明する。
範囲と分散を比較することで、散らばりを捉える方法には複数の視点があることを理解し、それぞれの指標が持つ特徴と限界を整理する。
③ 分散を視覚的に理解するまで。分散は数値として定義される指標であるが、ヒストグラムなどの可視化と結びつけることで、その意味を直感的に理解することができる。平均値の周囲にデータが集中している場合と、平均から離れた位置に多く分布している場合とを比較し、分散の大小が分布の広がりとしてどのように表れるかを確認する。
同じ平均値を持つ複数のデータセットを例に取り、ヒストグラムの形の違いと分散の値を対応づけることで、分散が「平均との差のばらつき」を表していることを視覚的に理解する。
このように、分散を単なる計算結果としてではなく、分布の形と結びつけて解釈する姿勢を身につけることで、次回以降に扱う標準偏差や箱ひげ図、さらには探索的データ分析へと理解を発展させる基礎を固める。
キーワード
① 散らばり ② データの広がり ③ 範囲 ④ 分散
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだ「散らばり」という考え方について、代表値だけでは把握できないデータの特徴を補う視点として整理し、生成AIで問題を作成し、それを解くことを復習課題とする。特に、範囲と分散がそれぞれどのようにデータの広がりを表しているかを確認し、同じ平均値を持つデータであっても散らばりの大きさが異なる場合があることを、ヒストグラムなどの可視化と結びつけて理解する。分散が平均からの離れ具合に着目した指標であることを踏まえ、数値と分布の形を対応づけて説明できるようにすることを目標とする。
◆次コマの予習
次回の授業では、分散を基にした指標である標準偏差を扱い、散らばりの大きさをより直感的に解釈する方法を学ぶ。そのため、配布テキストの該当箇所を事前に読み、分散と標準偏差の関係について確認しておくことを予習課題とする。あわせて、分散の値が大きい場合と小さい場合で、データの分布がどのように異なるかを思い出し、標準偏差が散らばりの指標としてどのような意味を持つのかを考えながら次回の学修に備える。
11
散らばり②:標準偏差
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第11回目の授業では、第10回で学んだ範囲および分散による散らばりの捉え方を踏まえ、分散を基にした指標である標準偏差について理解を深める回である。分散は散らばりを定量的に表す重要な指標である一方、その値の大きさを直感的に解釈することが難しい場合がある。標準偏差は、分散の平方根として定義され、元のデータと同じ単位で散らばりの大きさを表すことができるため、実際のデータ分析において広く用いられている。標準偏差の考え方を分散との関係から整理し、数値としての意味を理解する。あわせて、Excelを用いた計算方法を確認し、複数のデータの散らばりを比較することで、標準偏差が分布の広がりを把握するための有効な指標であることを理解する。本回は、以降に扱う箱ひげ図や探索的データ分析において、分布を比較・解釈するための基礎として位置づけられる。
◆コマ主題細目①
・第11回テキスト「散らばり②:標準偏差」 第1節「標準偏差の考え方」
◆コマ主題細目②
・第11回テキスト「散らばり②:標準偏差」 第2節「Excelでの計算」
◆コマ主題細目③
・第11回テキスト「散らばり②:標準偏差」 第3節「分布の広がりと比較」
コマ主題細目
① 標準偏差の考え方 ② Excelでの計算 ③ 分布の広がりと比較
細目レベル
① 標準偏差は、データの散らばりの大きさを表す指標であり、「平均との差がどの程度ばらついているか」を示す量として理解するまで。この考え方を直感的に捉えるため、まず身近な例を用いて説明する。
例えば、同じ平均点を持つ二つのテスト結果を考える。一方は多くの学生が平均点付近の点数を取っており、もう一方は高得点と低得点に分かれている場合、平均点は同じでも点数のばらつき方は大きく異なる。この違いを表す指標が標準偏差であり、点数が平均からどれだけ離れて分布しているかを数値として表している。
同様に、身長データを例に取ると、平均身長が同じ集団であっても、身長がほぼ同じ範囲に集中している場合と、低い人から高い人まで幅広く分布している場合とでは、集団の特徴は異なる。このとき、身長の散らばりの大きさを示す指標として標準偏差が用いられる。
標準偏差は分散の平方根として定義され、元のデータと同じ単位で散らばりを表す点に特徴がある。そのため、「平均との差が平均してどのくらいあるか」という感覚で理解しやすく、分散よりも直感的に解釈しやすい指標となっている。こうした日常的な例を通して、標準偏差はデータの性質を把握するための実用的な指標であることを理解する。
② 標準偏差をExcelで計算できるようになるまで。標準偏差は、Excelの関数を用いることで効率的に計算することができる。実習では、データ範囲を指定して標準偏差を算出し、複数のデータセットに対して同様の操作を行うことで、散らばりの違いを数値として確認する手段について理解するまで。
操作手順の確認にとどまらず、どのデータを対象として計算しているのかを意識することの重要性を強調する。欠損値や異常値が含まれている場合、標準偏差の値に影響を与える可能性があるため、計算前のデータ確認が必要であることにも触れる。
Excelを用いた計算を通して、標準偏差は理論上の概念ではなく、実際のデータ分析において容易に活用できる指標であることを理解し、実務的な活用への基礎を固める。
③ 標準偏差を視覚的に理解するまで。標準偏差は、異なるデータセット間で分布の広がりを比較する際に特に有効である。同じ平均値を持つ複数のデータを例に取り、標準偏差の値が異なる場合に、分布の形や広がりがどのように異なるかをヒストグラムと併せて確認する。
また、平均値と標準偏差を組み合わせて解釈することで、データの中心と散らばりを同時に把握できることを理解する。標準偏差の値だけを単独で見るのではなく、分布の形や外れ値の有無と併せて考える必要がある点を強調する。そのため、外れ値の有無による平均値と標準偏差への影響を、色々な外れ値で確認する。
このような比較を通して、標準偏差は分布の特徴を定量的に比較するための重要な指標であることを理解し、次回以降に扱う箱ひげ図や分布比較の学習へとつなげる。
キーワード
① 標準偏差 ② 散らばり ③ 分散 ④ 分布
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだ標準偏差について、日常的な例(テストの点数や身長など)を用いて、その意味を整理し、生成AIで問題を作成し、問題を解くことを復習課題とする。特に、同じ平均値を持つデータであっても、標準偏差の大きさによって分布の広がり方が異なることを確認し、標準偏差が「平均との差の大きさ」を表す指標であることを自分の言葉で説明できるようにする。あわせて、分散との関係や、標準偏差が分布の比較にどのように役立つかについて理解を深め、数値とヒストグラムを結びつけて解釈する姿勢を身につけることを目標とする。
◆次コマの予習
次回の授業では、箱ひげ図を用いてデータの分布や散らばりを視覚的に表現する方法を学ぶ。そのため、配布テキストの該当箇所を事前に読み、四分位数および箱ひげ図がどのような情報を表すグラフであるかを確認しておくことを予習課題とする。あわせて、これまでに学んだ代表値や標準偏差と比べて、箱ひげ図では分布のどのような特徴が強調されるのかを考えながら、次回の学修に備える。
12
四分位数と箱ひげ図
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第12回目の授業では、第9回で学んだヒストグラムによる分布の把握、および第10回・第11回で扱った散らばり(範囲・分散・標準偏差)の考え方を踏まえ、分布の特徴を簡潔に表現する方法として、四分位数および箱ひげ図を扱う回である。箱ひげ図は、データの中心、散らばり、偏り、外れ値の有無を一つの図で示すことができる可視化手法であり、分布を比較する際にも有効である。四分位数および四分位範囲(IQR)の意味を整理したうえで、箱ひげ図の構成と読み取り方を学ぶ。さらに、外れ値がどのように定義され、どのように扱われるかについて理解し、統計的に妥当な解釈を行うための基礎を身につける。本回は、以降に扱う分布比較や探索的データ分析に直結する重要な回として位置づけられる。
◆コマ主題細目①
・第12回テキスト「四分位数と箱ひげ図」 第1節「四分位数・IQR」
◆コマ主題細目②
・第12回テキスト「四分位数と箱ひげ図」 第2節「箱ひげ図の読み取り方」
◆コマ主題細目③
・第12回テキスト「四分位数と箱ひげ図」 第3節「外れ値の扱い」
コマ主題細目
① 四分位数・IQR ② 箱ひげ図の読み取り方 ③ 外れ値の扱い
細目レベル
① 四分位数は、データを小さい順に並べたときに、全体を四等分する位置に対応する値であり、第1四分位数、第2四分位数(中央値)、第3四分位数によって構成されることの理解まで。これらの指標を用いることで、データの中心や広がりを把握することができる。
第1四分位数から第3四分位数までの範囲は四分位範囲(IQR)と呼ばれ、データの中央部分にどの程度の広がりがあるかを示す指標として用いられる。IQRは外れ値の影響を受けにくいという特徴を持ち、分散や標準偏差とは異なる視点から散らばりを捉えることができる。
具体例を通して、同じ平均値を持つデータであっても、四分位数やIQRが異なる場合には分布の特徴が異なることを確認し、四分位数が分布理解において重要な役割を果たすことを理解する。
② 箱ひげ図は、四分位数を基にして分布の特徴を視覚的に表現するグラフであり、箱の位置や長さ、ひげの広がりから、データの中心や散らばり、偏りの有無を読み取ることができることの理解まで。箱の中央に示される線は中央値を表し、箱の上下端は第1四分位数および第3四分位数に対応している。
ヒストグラムと比較しながら、箱ひげ図が分布の形を詳細に示すものではない一方で、分布の特徴を簡潔に把握しやすい点を確認する。複数の箱ひげ図を並べることで、異なる集団の分布を比較しやすくなることにも触れる。
こうした読み取りを通して、箱ひげ図は分布を要約するための可視化手法であり、代表値や散らばりの指標と組み合わせて解釈することが重要であることを理解する。
③ 箱ひげ図では、四分位範囲(IQR)を基にして外れ値が定義されることが一般的であり、箱やひげから大きく離れた値は外れ値として示されることの理解まで。外れ値は、入力ミスや測定誤差によって生じる場合もあれば、データの性質として自然に現れる場合もあることを確認する。
外れ値をどのように扱うかは、分析の目的によって異なる。単純に除外するのではなく、その原因や意味を考察することが重要である点を強調する。外れ値の存在が平均値や分散に与える影響を振り返り、代表値や散らばりの解釈との関係を整理する。
外れ値の扱いに関する判断は、統計的思考を要する重要な場面であり、後半の探索的データ分析や、可視化を用いた主張の妥当性判断につながる基礎となる。
キーワード
① 四分位数 ② 四分位範囲(IQR) ③ 箱ひげ図 ④ 外れ値
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだ四分位数および箱ひげ図について、分布の中心や散らばりをどのように要約して表現しているかを整理し、生成AIで問題を作成し、問題を解くことを復習課題とする。特に、四分位範囲(IQR)がデータの中央部分の広がりを示す指標であることや、箱ひげ図が分布の偏りや外れ値の有無を一つの図で把握できる点に着目する。ヒストグラムや標準偏差と比較しながら、箱ひげ図がどのような場面で有効であるかを自分の言葉で説明できるようにすることを目標とする。
◆次コマの予習
次回の授業では、二つの項目を組み合わせてデータを整理する方法として、クロス集計を扱う。そのため、配布テキストの該当箇所を事前に読み、データを一つの項目だけで見る場合と、二つの項目を同時に見る場合とで、どのように情報の捉え方が変わるかを確認しておくことを予習課題とする。あわせて、行比率や列比率といった考え方が、集計結果の解釈にどのような影響を与えるかに着目し、割合を用いてデータを比較するとはどういうことかを意識しながら次回の学修に備える。
13
クロス集計①:分類と表づくり
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第13回目の授業では、第12回までに学んだ一つの変数に着目した分布や散らばりの理解を踏まえ、二つの項目を同時に扱う方法としてクロス集計を学ぶ回である。クロス集計は、二つの分類項目の組み合わせによってデータを整理し、項目間の関係や特徴を把握するための基本的な手法であり、以降に扱う散布図や相関の理解にもつながる重要な基礎となる。まず二つの項目を組み合わせてデータを分類する考え方を確認し、次に行比率・列比率を用いた集計結果の読み取り方を学ぶ。さらに、Excelのピボットテーブル機能を用いてクロス集計表を作成することで、実際のデータを効率的に整理・分析する方法を身につける。本回は、単一の指標を見る段階から、項目間の関係に注目する段階への重要な転換点として位置づけられる。
◆コマ主題細目①
・第13回テキスト「クロス集計①:分類と表づくり」 第1節「2つの項目を組み合わせる」
◆コマ主題細目②
・第13回テキスト「クロス集計①:分類と表づくり」 第2節「行比率と列比率」
◆コマ主題細目③
・第13回テキスト「クロス集計①:分類と表づくり」 第3節「ピボットテーブル」
コマ主題細目
① クロス集計 ② 行比率と列比率 ③ ピボットテーブル
細目レベル
① クロス集計は、二つの項目を組み合わせてデータを分類し、それぞれの組み合わせがどの程度存在するかを整理する方法である。例えば、性別と購買行動、学年と成績区分など、二つの分類項目を同時に扱うことで、単一の項目だけでは見えなかった特徴が明らかになる。
具体的な例を用いて、片方の項目だけで集計した場合と、二つの項目を組み合わせて集計した場合とで、情報量や解釈がどのように変化するかを確認する。これにより、クロス集計はデータを細かく分けるための手法ではなく、関係性を把握するための手法であることを理解する。
二つの項目を組み合わせる際には、それぞれが分類(質的)データであることが多く、カテゴリの設定や区分の仕方が結果の解釈に影響を与える点にも注意を向ける。
② クロス集計表では、単に度数を見るだけでなく、比率を用いることで結果をより適切に解釈できる場合が多い。行比率は、各行の合計を基準として割合を計算する方法であり、行に配置した項目ごとの構成を把握するのに適している。一方、列比率は、各列の合計を基準として割合を計算する方法であり、列に配置した項目ごとの構成を比較する際に有効である。
同じクロス集計表であっても、行比率と列比率のどちらを見るかによって、注目すべき点や解釈が変わることを具体例を通して確認する。これにより、「どちらが正しいか」ではなく、「何を知りたいか」に応じて比率の見方を選択する必要があることを理解する。
比率を用いた解釈は、以降に扱うデータ分析や可視化においても重要な視点となるため、数値の大小だけで判断しない姿勢を身につける。
③ ピボットテーブルは、Excelに備わっている集計機能の一つであり、大量のデータを効率的にクロス集計することができる。実習では、元データからピボットテーブルを作成し、行と列に配置する項目を変更することで、集計結果がどのように変化するかを確認する。
操作手順の習得に加え、ピボットテーブルを用いることで、同じデータからさまざまな視点で集計表を作成できる点を理解する。行や列の入れ替えによって、行比率・列比率の解釈が変わることにも注意を向ける。
ピボットテーブルは単なる操作技術ではなく、データを多角的に見るための道具であることを理解し、次回以降に扱うクロス集計の応用や関係性の分析へとつなげる。
キーワード
① クロス集計 ② 2変量データ ③ 分類 ④ 行列比率 ⑤ ピボットテーブル
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだクロス集計について、二つの項目を組み合わせてデータを整理することで、どのような情報が得られるかを振り返り、生成AIで問題を作成し、問題を解くことを復習課題とする。特に、単純な度数の比較だけでなく、行比率や列比率を用いることで、集計結果の解釈がどのように変わるかに着目する。あわせて、ピボットテーブルを用いた集計が、データを多角的に見るための有効な手段であることを整理し、項目間の関係を読み取る際の基本的な考え方を確認する。
◆次コマの予習
次回の授業では、クロス集計の結果を比率や割合を用いて整理し、グラフによって可視化する方法を学ぶ。そのため、配布テキストの該当箇所を事前に読み、度数だけで集計結果を見る場合と、比率・割合を用いて見る場合とで、どのように解釈が変わるかを確認しておくことを予習課題とする。あわせて、行比率や列比率をグラフで表現することにより、結果の比較がどのようにしやすくなるかに着目し、クロス集計結果を「数値」と「グラフ」の両面から理解するとはどういうことかを意識しながら次回の学修に備える。
14
クロス集計②:比率とグラフ
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第14回目の授業では、第13回で学んだクロス集計による分類と表づくりを踏まえ、集計結果を比率や割合を用いて整理し、グラフとして可視化する方法を学ぶ回である。クロス集計では、度数そのものを見るだけでなく、比率を用いることで項目間の関係をより適切に比較・解釈できる場合が多い。本回では、比率・割合の計算方法を確認したうえで、比率を用いたグラフ作成を通して、集計結果を視覚的に比較する力を養う。行比率・列比率の違いを意識しながら比率を計算し、それらを棒グラフなどで表現する。さらに、比率グラフを用いた結果の比較と解釈を行うことで、クロス集計結果を「表で読む段階」から「関係を説明する段階」へと発展させる。本回は、後半に扱う散布図や回帰分析に向けて、関係性を可視化する考え方の基礎として位置づけられる。
◆コマ主題細目①
・第14回テキスト「クロス集計②:比率とグラフ」 第1節「比率・割合の計算」
◆コマ主題細目②
・第14回テキスト「クロス集計②:比率とグラフ」 第2節「比率グラフ作成」
◆コマ主題細目③
・第14回テキスト「クロス集計②:比率とグラフ」 第3節「結果の比較・解釈」
コマ主題細目
① 比率・割合の計算 ② 比率グラフ作成 ③ 結果の比較・解釈
細目レベル
① クロス集計結果を解釈する際には、度数だけでなく比率や割合を用いることが重要である。行比率は行の合計を基準として計算され、特定の条件下での構成を把握するのに適している。一方、列比率は列の合計を基準として計算され、別の条件から見た構成の違いを比較する際に有効である。
同じクロス集計表であっても、行比率と列比率のどちらを見るかによって、注目すべき点や結論が異なる場合があることを具体例を通して確認する。これにより、比率の計算は機械的に行うものではなく、「何を比較したいのか」という目的に基づいて選択すべきであることを理解する。
比率・割合の考え方は、以降に扱うグラフ作成や結果の解釈に直結するため、数値の意味を丁寧に確認しながら計算する姿勢を身につける。
② 比率や割合をグラフとして表現することで、クロス集計結果を直感的に比較しやすくなる。実習では、行比率や列比率を基にした棒グラフを作成し、どの項目間に違いがあるのかを視覚的に確認する。
Excelを用いた操作を通して、元データや集計表から比率グラフを作成する手順を確認するとともに、グラフの種類や表示方法によって見え方が変わることを理解する。特に、グラフの軸や凡例の設定が、結果の解釈に影響を与える点に注意を向ける。
比率グラフは、数値を正確に伝えるだけでなく、関係性を分かりやすく示すための手段であることを理解し、適切な可視化を行うための基礎を固める。
③ 比率グラフを用いることで、クロス集計結果の比較や解釈が容易になる一方で、読み取り方には注意が必要である。比率の違いがどの程度意味のある差なのかを考え、安易に結論を導かない姿勢が求められる。
複数の比率グラフを比較しながら、どの項目間に特徴的な差が見られるかを整理し、その差がどのような条件の違いに対応しているのかを考察する。ここでは、比率の大小だけでなく、元の度数や全体の規模にも目を向ける必要があることを確認する。
このような比較と解釈を通して、クロス集計結果を単なる集計結果として終わらせるのではなく、データに基づいた説明へとつなげる力を養う。この考え方は、後半のストーリーテリングや主張の妥当性を判断する力の基礎となる。
キーワード
① クロス集計 ② 比率・割合 ③ 比率グラフ ④ 棒グラフによる比較
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだクロス集計結果の比率化およびグラフ化について、度数による集計と比率・割合による集計とでは、どのように見え方や解釈が変わるかを整理し、生成AIで問題を作成し、問題を解くことを復習課題とする。特に、行比率と列比率の違いに着目し、それぞれがどのような比較に適しているかを確認する。あわせて、比率グラフを用いることで項目間の関係がどのように視覚的に把握しやすくなるかを振り返り、クロス集計結果を説明する際の基本的な考え方を身につけることを目標とする。
◆次コマの予習
次回の授業では、データの時間的な変化に注目し、増減率や指数を用いて変化の大きさや傾向を捉える方法を学ぶ。そのため、配布テキストの該当箇所を事前に読み、「増減率」や「変化率」がどのような意味を持つ指標であるかを確認しておくことを予習課題とする。あわせて、ある年や時点を基準(100)とした指数を用いることで、異なる時点の値をどのように比較できるかに着目し、時系列データを数値とグラフの両面から理解するとはどういうことかを意識しながら次回の学修に備える。
15
時系列①:増減率と指数の基礎
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第15回目の授業では、第14回までに学んだ分類データの比較や関係性の整理を踏まえ、データの「時間的な変化」に注目する時系列分析の導入回である。実社会においては、売上高、人口、物価、気温など、多くのデータが時間の経過とともに変化する形で記録されている。こうした変化を適切に捉えるためには、単なる数値の比較だけでなく、増減の割合や変化の大きさを相対的に評価する視点が重要となる。増減率・変化率の考え方を整理し、異なる時点の値を比較するための基本的な指標として指数(基準年=100)を学ぶ。さらに、Excelを用いて増減率や指数を計算し、折れ線グラフによって可視化することで、時系列データの変化を数値とグラフの両面から理解する力を養う。本回は、次回以降の時系列データの読み取りや傾向分析につながる基礎として位置づけられる。
◆コマ主題細目①
・第15回テキスト「時系列①:増減率と指数の基礎」 第1節「増減率・変化率」
◆コマ主題細目②
・第15回テキスト「時系列①:増減率と指数の基礎」 第2節「指数とは」
◆コマ主題細目③
・第15回テキスト「時系列①:増減率と指数の基礎」 第3節「Excelで増減率・指数を計算し、グラフ化」
コマ主題細目
① 増減率・変化率 ② 指数とは ③ Excelで計算およびグラフ化
細目レベル
① 時系列データを扱う際には、ある時点から別の時点へどの程度変化したかを捉えることが重要である。増減率や変化率は、数値の増加・減少を割合として表す指標であり、異なる規模のデータ同士を比較する際にも有効である。
例えば、売上高が10増加した場合でも、もとの値が100であった場合と1000であった場合とでは、変化の意味は大きく異なる。このような違いを捉えるために、増減率を用いることで「どの程度の変化があったか」を相対的に評価できることを確認する。
具体例を通して、増減率が正の場合と負の場合の解釈や、変化率を用いる際の注意点を整理し、単なる差分ではなく割合で変化を見ることの意義を理解する。
② 指数は、ある時点の値を基準として、他の時点の値を相対的に表す方法であり、時系列データの比較に広く用いられている。一般に、基準となる年や時点の値を100とし、それ以外の時点の値を相対的な数値として表すことで、変化の大きさを直感的に把握することができる。
指数を用いることで、異なる単位や規模を持つデータであっても、変化の傾向を比較しやすくなる点を確認する。例えば、複数の商品の売上や異なる地域の人口推移などを同一の基準で比較できることを具体例を通して理解する。
このように、指数は時系列データの変化を整理し、傾向を捉えるための有効な手法であることを理解し、次の実習へとつなげる。
③ 実習では、Excelを用いて実際の時系列データから増減率および指数を計算する。セル参照を用いた計算方法を確認し、どの時点を基準としているかを意識しながら数式を設定することの重要性を理解する。
次に、計算結果を折れ線グラフとして可視化し、数値の変化がどのような形で表れるかを確認する。グラフ化することで、増加傾向や減少傾向、変動の大きさが視覚的に把握しやすくなる点を体験的に理解する。
この演習を通して、時系列データは数値だけでなく、グラフと組み合わせて解釈することで理解が深まることを確認し、次回以降の時系列データの分析や読み取りに備える。
キーワード
① 時系列データ ② 時間的変化 ③ 増減・変化率 ④ 指数 ⑤ 基準年(基準時点)
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだ増減率および指数について、時系列データの変化を相対的に捉えるための指標として整理し、生成AIで問題を作成し、問題を解くことを復習課題とする。特に、単純な数値の差だけでは捉えにくい変化の大きさを、増減率や指数を用いることでどのように比較できるかを確認する。あわせて、Excelを用いた計算結果と折れ線グラフによる可視化を振り返り、数値とグラフを組み合わせて時系列の変化を解釈することの重要性を理解することを目標とする。
◆次コマの予習
次回の授業では、時系列データを指数化し、複数の系列を同一の基準で比較する方法を学ぶ。そのため、配布テキストの該当箇所を事前に読み、「指数」とは何を意味する指標であるかを確認しておくことを予習課題とする。特に、基準となる年や時点を100とすることで、異なる規模や単位を持つデータ同士をどのように比較できるようになるかに着目する。あわせて、指数化したデータをグラフで表現することで、各系列の増減の傾向や違いがどのように読み取りやすくなるかを意識しながら、次回の学修に備える。
16
時系列②:指数と基準化の考え方
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第15回目の授業では、第15回で学んだ増減率および指数の基礎的な考え方を踏まえ、指数を用いて複数の時系列データを比較する方法を学ぶ回である。実社会における時系列データは、規模や単位が異なる複数の系列として示されることが多く、そのままでは変化の大きさや傾向を比較することが難しい場合がある。指数の意味を改めて整理したうえで、複数の系列を同一の基準にそろえて比較する「基準化」の考え方を理解する。さらに、指数化したデータをグラフとして描画し、そこからトレンドを読み取ることで、時系列データを相対的に比較・解釈する力を養う。本回は、時系列データを「単独で見る段階」から「複数を比較して意味を読み取る段階」へ進む重要な回として位置づけられる。
◆コマ主題細目①
・第16回テキスト「時系列②:指数と基準化の考え方」 第1節「指数とは」
◆コマ主題細目②
・第16回テキスト「時系列②:指数と基準化の考え方」 第2節「複数系列を基準化して比較する」
◆コマ主題細目③
・第16回テキスト「時系列②:指数と基準化の考え方」 第3節「指数グラフからのトレンドの読み取り」
コマ主題細目
① 指数とは ② 複数系列を基準化して比較 ③ 指数グラフからのトレンドの読み取り
細目レベル
① 指数は、ある時点の値を基準として、他の時点の値を相対的に表現するための指標であり、その理解まで。一般に、基準となる年や時点の値を100とし、それ以外の値を相対的な数値として示すことで、変化の大きさや方向を直感的に把握できるようになる。
指数を用いる最大の利点は、元の値の大きさや単位に依存せず、変化の割合に注目できる点にある。例えば、売上高や人口など、規模の異なるデータであっても、指数化することで増減の傾向を同じ尺度で比較できる。
このように、指数は単なる計算結果ではなく、時系列データを相対的に捉えるための考え方であることを理解し、次に扱う基準化による比較へとつなげる。
② 複数の時系列データを比較する際には、それぞれの系列を同一の基準にそろえることが重要である。基準化とは、各系列について基準年や基準時点を設定し、その値を100として指数化することで、変化の大きさを同じ尺度で比較できるようにする操作を指し、その理解まで。
例えば、異なる商品の売上や、複数地域の人口推移をそのまま比較すると、元の規模の違いによって変化が分かりにくくなる場合がある。これらを指数化することで、「どの系列がどの程度増加・減少しているか」という相対的な変化に注目できるようになる。
基準化は、時系列データの比較を可能にするための重要な前処理であり、どの時点を基準に設定するかによって解釈が変わる可能性がある点にも注意を向ける。
③ 指数化した時系列データを折れ線グラフとして描画することで、複数の系列のトレンドを同時に把握することができる。指数グラフでは、基準時点からの増減の方向や変化の速さが視覚的に示されるため、系列間の違いを直感的に比較の理解まで。
グラフを読み取る際には、どの系列が一貫して上昇しているか、どの時点で傾向が変化しているかといった点に着目する。また、短期的な変動と長期的なトレンドを区別し、全体としてどのような流れが見られるかを考察することが重要である。
指数グラフは、変化を強調して示す表現である一方、元の値の大きさを直接示すものではない点にも注意を向ける。指数の意味と限界を踏まえたうえでトレンドを読み取る姿勢が、時系列データを正しく解釈するために不可欠である。
キーワード
① 時系列データ ② 指数 ③ 基準年・基準時点 ④ 指数グラフ ⑤ トレンド
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだ指数および基準化の考え方について、複数の時系列データを比較するための方法として整理し、生成AIで問題を作成し、問題を解くことを復習課題とする。特に、基準年や基準時点を100とすることで、元の規模や単位が異なるデータ同士であっても、変化の傾向を相対的に比較できる点に着目する。あわせて、指数グラフを用いることで、どの系列がどの程度増加・減少しているか、トレンドに違いが見られるかを視覚的に読み取れることを振り返り、指数の意味と限界を踏まえた解釈ができるようになることを目標とする。
◆次コマの予習
次回の授業では、時系列データに含まれる短期的な変動をならし、全体の傾向をより明確に捉える方法として移動平均を扱う。また、時系列データに現れる変化を、季節変動・循環変動・不規則変動といった異なる要素に分けて考える視点を学ぶ。さらに、指数的に増加・減少するデータを扱う際に有効な対数グラフ(logスケール)の特徴と使い方について理解を深める。
そのため、配布テキストの該当箇所を事前に読み、移動平均がどのような目的で用いられる手法であるかを確認しておくことを予習課題とする。あわせて、これまでに扱った指数グラフや折れ線グラフを思い出し、変化の見え方がグラフの表現方法によってどのように異なるかに着目する。特に、対数グラフを用いることで、指数的な変化がどのように表現されるのかを意識しながら、次回の学修に備える。
17
時系列③:移動平均と変動の種類
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第17回は、第15回および第16回で学んだ時系列データの増減率・指数・基準化による比較を踏まえ、時系列データに含まれる変動を整理し、より本質的な傾向を読み取るための考え方を学ぶ回である。実際の時系列データには、短期的な上下動や周期的な変化が重なって現れるため、そのままでは全体の傾向を把握しにくい場合が多い。そこで、移動平均によるトレンドの平滑化を通して短期変動をならす方法を学ぶとともに、季節変動・循環変動・不規則変動といった時系列特有の変動の種類を区別する考え方を理解する。さらに、指数的な変化を持つデータを扱う際に有効な対数グラフ(logスケール)を取り上げ、表現方法の違いによってトレンドの見え方がどのように変化するかを確認する。本回は、時系列データを多面的に解釈する力を養うための重要な回として位置づけられる。
◆コマ主題細目①
・第17回テキスト「時系列③:移動平均と変動の種」 第1節「移動平均」
◆コマ主題細目②
・第17回テキスト「時系列③:移動平均と変動の種」 第2節「季節変動・循環変動・不規則変動の区別」
◆コマ主題細目③
・第17回テキスト「時系列③:移動平均と変動の種」 第3節「対数グラフの特徴と使い方」
コマ主題細目
① 移動平均 ② 季節変動・循環変動・不規則変動の区別 ③ 対数グラフの特徴と使い方
細目レベル
① 時系列データには、短期間の偶然的な上下動が含まれており、これらが全体の傾向を見えにくくしている場合がある。移動平均は、一定期間のデータを平均することで、こうした短期的な変動をならし、長期的なトレンドを把握しやすくするための手法である。本細目では、移動平均の理解まで。
具体的な時系列データを用いて、元の折れ線グラフと移動平均を重ねて描画し、短期的な変動が抑えられ、全体の流れが明確になる様子を確認する。移動平均の期間を変えることで、平滑化の程度がどのように変化するかにも注意を向ける。
移動平均は、トレンドを把握するための有効な方法である一方、変化のタイミングが遅れて表れる場合がある点にも触れ、目的に応じて適切に用いる必要があることを理解する。
② 時系列データに含まれる変動は、性質の異なる複数の要素が重なって現れている。季節変動は、季節や月ごとに繰り返される規則的な変動であり、気温や消費行動などに見られる。一方、循環変動は、景気変動のように数年単位で現れる比較的長期の変動を指す。ここでは、季節変動と循環変動の理解まで。
これらに対して、不規則変動は突発的な出来事や偶然によって生じる変動であり、明確な規則性を持たない点が特徴である。具体的なデータを例に、どの部分が季節変動に該当し、どの部分が循環変動や不規則変動と考えられるかを整理する。
変動の種類を区別して捉えることで、時系列データを単なる数値の並びとしてではなく、構造を持ったデータとして理解する姿勢を身につける。
③ 対数グラフ(logスケール)は、縦軸を対数目盛で表現することで、指数的な増加や減少を直線的に捉えやすくする表現方法である。一定の割合で増加しているデータは、通常の目盛では曲線として表れるが、対数グラフでは直線に近い形として表示される。ここでは、対数グラフの理解まで。
具体例として、人口や市場規模、感染者数などのデータを用い、通常の折れ線グラフと対数グラフとを比較し、トレンドの見え方がどのように異なるかを確認する。これにより、表現方法の選択が解釈に大きく影響することを理解する。
対数グラフは変化の割合に注目する際に有効な一方、値の差を直感的に読み取りにくい場合がある点にも注意を向け、目的に応じて使い分ける必要があることを理解する。
キーワード
① 時系列データ ② 移動平均 ③ 平滑化 ④ 季節変動 ⑤ 対数グラフ(logスケール)
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだ移動平均および時系列データに含まれる変動の種類について、時系列データの変化をどのように整理し、全体の傾向を読み取るかという観点から整理することを復習課題とする。特に、移動平均によって短期的な変動がならされ、長期的なトレンドが把握しやすくなる点に着目する。また、季節変動・循環変動・不規則変動という異なる性質の変動が、同一の時系列データの中に同時に含まれていることを理解し、データを構造的に捉える姿勢を身につけることを目標とする。
あわせて、通常の折れ線グラフと対数グラフを比較し、指数的な変化がグラフ表現によってどのように見え方を変えるかを振り返り、可視化の方法が解釈に与える影響について理解を深める。
◆次コマの予習
次回の授業では、これまでExcelを用いて行ってきたデータの整理や可視化を、Pythonを用いて実行する方法を学ぶ。そのため、配布テキストの該当箇所を事前に読み、Pythonがどのような場面でデータ分析や可視化に用いられているかを確認しておくことを予習課題とする。あわせて、時系列データやグラフ表現をプログラムによって扱うことで、どのような利点があるかを考えながら、次回の学修に備える。
18
Python入門①:基本操作
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第18回は、これまでExcelを用いて行ってきたデータの整理・可視化・解釈を、Pythonというプログラミング言語を用いて実行するための導入回である。近年、データ分析や可視化の分野では、Pythonが広く利用されており、再現性の高い分析や大量データの処理に適している。本科目後半では、Pythonを用いた可視化を段階的に学ぶため、本回ではその基礎となる操作や考え方を扱う。Pythonの実行環境としてGoogle Colaboratory(Colab)やJupyter Notebookの基本的な使い方を確認したうえで、print文や変数といった最も基本的な命令を体験する。さらに、listやfor文を用いた簡単な繰り返し処理を通して、Pythonがどのようにデータを扱うのかを体感的に理解する。本回は、プログラミングの文法習得を目的とするのではなく、Pythonを「データを扱う道具」として使うための第一歩として位置づけられる。
◆コマ主題細目①
・第18回テキスト「Python入門①:基本操作」 第1節「Python・Colab・Jupyterの使い方」
◆コマ主題細目②
・第18回テキスト「Python入門①:基本操作」 第2節「print文と変数」
◆コマ主題細目③
・第18回テキスト「Python入門①:基本操作」 第3節「list, for文の体験」
コマ主題細目
① Python・Colab・Jupyterの使い方 ② print文と変数 ③ list, for文の体験
細目レベル
① ここでは、Pythonの使い方の理解まで。Pythonは、データ分析や可視化、機械学習など幅広い分野で利用されているプログラミング言語であり、シンプルな記述で処理を行える点が特徴である。授業では、Pythonを実行する環境としてGoogle ColaboratoryやJupyter Notebookを用い、ブラウザ上でコードを書いて実行できる仕組みを確認する。
ノートブック形式の画面構成について、セルの概念やコードセルとテキストセルの違いを整理し、どのようにコードを入力・実行するかを、演習を通して理解する。また、実行結果がその場で表示される点や、上から順に処理が行われる点に注意を向ける。
これらの操作を通して、Pythonは難解なものではなく、Excelと同様に「操作して結果を確認できる環境」であることを理解し、以降の実習に対する心理的なハードルを下げることを目的とする。
② print文と変数の理解まで。Pythonにおけるprint文は、処理結果や文字列を画面に表示するための基本的な命令であり、プログラムの動作を確認するために頻繁に用いられる。簡単な例を通して、文字や数値がどのように出力されるかを確認する。
続いて、変数の考え方を取り上げ、数値や文字列を名前に対応づけて保存する仕組みを理解する。変数は、Excelにおけるセルに近い役割を持ち、後の計算や処理で再利用できる点に着目する。
変数を用いた簡単な計算や表示を体験することで、Pythonでは「値を記憶し、それを使って処理を行う」という基本的な考え方が重要であることを理解し、次のデータ処理につなげる。
③ listとfor文の使い方の理解まで。データ分析では、複数の値をまとめて扱う場面が多く現れる。Pythonでは、listと呼ばれる仕組みを用いることで、複数の値を一つのまとまりとして扱うことができる。簡単な数値のリストを例に、listの基本的な使い方を確認する。
次に、for文を用いた繰り返し処理を体験し、listの中の要素を順番に取り出して処理する流れを確認する。for文は、同じ処理を複数のデータに対して繰り返す際に用いられる基本的な構文であり、データ処理や可視化において欠かせない考え方である。
この体験を通して、Pythonでは「データの集まりに対して処理を行う」という発想が重要であることを理解し、次回以降に扱うデータの集計やグラフ描画への基礎を固める。
キーワード
① Python ② Google Colaboratory(Colab) ③ Jupyter Notebook ④ list ⑤ 繰り返し処理
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだPythonの基本操作について、ColabやJupyter Notebookの画面構成やコードの実行方法を振り返り、Pythonを実行する環境に慣れることを復習課題とする。特に、print文を用いた出力や、変数に値を代入して計算・表示する仕組みを整理し、Pythonでは値を名前に対応づけて扱うという基本的な考え方を理解する。また、listやfor文を用いた簡単な繰り返し処理を振り返り、複数のデータをまとめて処理する発想がデータ分析において重要であることを確認する。
◆次コマの予習
次回の授業では、Pythonを用いて表形式のデータを扱う方法を学ぶ。そのため、配布テキストの該当箇所を事前に読み、Pythonにおけるデータ分析用ライブラリであるpandasがどのような役割を持つかを確認しておくことを予習課題とする。あわせて、CSVファイルとはどのような形式のデータであるかを理解し、Pythonで外部ファイルを読み込むことで、どのようにデータを利用できるようになるかに着目する。
さらに、表形式データを扱う際には、データの内容や構造を最初に確認することが重要である点を意識し、行や列、変数名といった要素をどのように把握するかを考えながら次回の学修に備える。Excelで行ってきた表データの確認作業と、Pythonでのデータ確認とを比較し、両者の共通点や違いを意識しておくことも望ましい。
19
Python入門②:表データの扱い
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第19回は、第18回で学んだPythonの基本操作を踏まえ、実際のデータ分析で頻繁に用いられる「表形式データ」をPythonで扱う方法を学ぶ回である。これまでExcelを用いて行ってきた表データの確認や整理を、Pythonのライブラリを利用して実行することで、より柔軟で再現性の高いデータ処理の基礎を身につける。ここでは、Pythonにおけるデータ分析用ライブラリであるpandasの基本的な役割を理解したうえで、CSVファイルを読み込み、表形式データの構造や内容を確認する操作を行う。ここでは高度な分析を行うことを目的とせず、Pythonで「データを読み、眺め、把握する」ための基本的な流れを体験する。本回は、次回以降に行う集計や可視化の前提となる重要な導入回として位置づけられる。
◆コマ主題細目①
・第19回テキスト「Python入門②:表データの扱い」 第1節「pandasの基本」
◆コマ主題細目②
・第19回テキスト「Python入門②:表データの扱い」 第2節「CSVファイルの読み込み」
◆コマ主題細目③
・第19回テキスト「Python入門②:表データの扱い」 第3節「表形式データの確認」
コマ主題細目
① pandasの基本 ② CSVファイルの読み込み ③ 表形式データの確認
細目レベル
① pandasの基本的な使い方の理解まで。pandasは、Pythonで表形式データを扱うための代表的なライブラリであり、データ分析や可視化の前処理に広く利用されている。pandasでは、DataFrameと呼ばれる構造を用いて、行と列からなるデータを効率的に扱うことができる。
授業では、pandasを読み込む方法を確認し、DataFrameがExcelのワークシートと似た構造を持つことを理解する。列が変数、行が観測値に対応している点を整理し、Pythonにおける表データの基本的な考え方を確認する。
このように、pandasは新しい操作体系である一方、これまでExcelで行ってきたデータ整理の考え方と共通点が多いことを理解し、Pythonによるデータ処理への抵抗感を減らすことを目的とする。
② CSVファイルの読み込み方法の理解まで。実際のデータ分析では、CSV形式のファイルとして保存されたデータを扱う場面が多い。CSVファイルは、表形式データをテキスト形式で保存したものであり、ExcelやPythonなど、さまざまなソフトウェアで利用できる点が特徴である。
授業では、pandasを用いてCSVファイルを読み込む操作を体験し、外部ファイルのデータがPython上でどのように扱われるかを確認する。ファイルを正しく指定し、読み込みに成功した場合にDataFrameとして表示される点に注目する。
また、読み込み時に起こりやすいエラーや、文字コード・区切り文字の違いによる影響にも触れ、データを扱う際にはファイル形式や構造を意識する必要があることを理解する。
③ 表形式データそのものの理解まで。表形式データを扱う際には、分析や可視化を行う前に、データの内容や構造を確認することが重要である。pandasでは、データの先頭部分を表示したり、列名や行数を確認したりするための機能が用意されている。
授業では、これらの機能を用いて、データがどのような項目から構成されているか、欠損値や不自然な値が含まれていないかを確認する操作を行う。ここでの目的は、データを細かく分析することではなく、「このデータで何ができそうか」を把握することである。
この確認作業を通して、Pythonによるデータ分析では、最初にデータをよく観察することが重要である点を理解し、次回以降に扱う集計や可視化の準備を整える。
キーワード
① pandas ② DataFrame ③ 表形式データ ④ CSVファイル ⑤ データの読み込み
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだPythonによる表形式データの扱いについて、pandasを用いてCSVファイルを読み込み、DataFrameとしてデータを確認する流れを振り返ることを復習課題とする。特に、行と列がどのように構成されているか、各列がどのような変数を表しているかを意識しながらデータを確認する姿勢を身につける。また、分析や可視化を行う前に、データの内容や構造を把握することが重要である点を理解することを目標とする。
◆次コマの予習
次回の授業では、Pythonを用いて平均値・中央値・最頻値といった代表値を求める方法を学ぶ。そのため、配布テキストの該当箇所を事前に読み、pandasに用意されている mean、median、mode といった基本的な関数が、どのような役割を持つかを確認しておくことを予習課題とする。
あわせて、実際のデータには欠損値や不完全なデータが含まれている場合が多いことを踏まえ、代表値を計算する前にデータを整形・確認する必要がある点に注意を向ける。これまでExcelで行ってきた代表値の計算とPythonでの計算を比較し、操作方法や考え方の違いを意識しながら次回の学修に備える。
20
Pythonで代表値を求める
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第20回は、第19回で学んだpandasを用いた表形式データの読み込みと確認を踏まえ、Pythonを用いて代表値を計算する方法を学ぶ回である。代表値は、データの中心的な傾向を把握するための基本的な統計量であり、これまでExcelを用いて繰り返し扱ってきた内容でもある。本回では、同じ代表値の計算をPythonで行うことで、Excelとの共通点や違いを理解し、Pythonによるデータ処理の特徴を体験的に学ぶ。ここでは、pandasに用意されている mean、median、mode といった関数を用いて平均値・中央値・最頻値を求める方法を確認する。あわせて、欠損値を含むデータに対する計算の考え方や、代表値を計算する前に行うデータの整形についても扱う。さらに、Excelでの代表値計算と比較することで、Pythonによる処理の利点や注意点を理解する。本回は、Pythonによる統計処理の基礎を固める重要な回として位置づけられる。
◆コマ主題細目①
・第20回テキスト「Pythonで代表値を求める」 第1節「mean, median, modeの使い方」
◆コマ主題細目②
・第20回テキスト「Pythonで代表値を求める」 第2節「データの整形と欠損値対応」
◆コマ主題細目③
・第20回テキスト「Pythonで代表値を求める」 第3節「Excelとの比較」
コマ主題細目
① mean, median, modeの使い方 ② データの整形と欠損値対応 ③ Excelとの比較
細目レベル
① 平均・中央値・最頻値をPythonで算出する方法の理解まで。pandasには、表形式データから代表値を簡単に計算するための関数が用意されている。mean は平均値、median は中央値、mode は最頻値を求めるための関数であり、DataFrameやSeriesに対して適用することができる。
授業では、数値データの列を対象としてこれらの関数を実行し、代表値がどのように計算されるかを確認する。単に関数を実行するだけでなく、どの列のどのデータを対象にしているかを意識することの重要性を強調する。
また、最頻値が複数存在する場合や、データの性質によって代表値の意味が異なる点にも触れ、Pythonで得られた結果をそのまま受け取るのではなく、内容を解釈する姿勢を身につける。
② データの整形と欠損値対応の方法の理解まで。実際のデータには、欠損値や不完全な値が含まれていることが多く、代表値の計算に影響を与える場合がある。そのため、計算を行う前にデータの状態を確認し、必要に応じて整形を行うことが重要である。
授業では、欠損値が含まれているデータを例に取り、pandasが欠損値をどのように扱うかを確認する。欠損値を除外して計算する場合と、別の値で補完する場合とで、結果がどのように変わるかにも注意を向ける。
このような操作を通して、代表値は単なる計算結果ではなく、前処理の方法によって解釈が変わり得ることを理解し、データ整形の重要性を認識する。
③ ExcelとPythonでの処理の違いを比較を通じたそれぞれの特徴の理解まで。これまでExcelを用いて代表値を計算してきた経験を踏まえ、同じデータをPythonで処理した場合との比較を行う。Excelでは関数やセル操作によって代表値を求めるのに対し、Pythonではコードによって一連の処理を記述する点に違いがある。
この比較を通して、Pythonでは処理の手順が明示的に記録されるため、再現性の高い分析が可能であることを確認する。一方で、操作に慣れるまでに時間がかかる点や、コードの意味を理解する必要がある点にも触れる。
ExcelとPythonのそれぞれの特徴を理解したうえで、目的や状況に応じて適切なツールを選択する姿勢を身につけ、今後のデータ分析や可視化に備える。
キーワード
① 平均値(mean) ② 中央値(median) ③ 最頻値(mode) ④ pandas
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだPythonによる代表値の計算について、pandasを用いて平均値・中央値・最頻値を求める一連の流れを整理することを復習課題とする。特に、どの列のデータを対象として計算しているかを意識しながら、mean、median、mode の結果を確認し、代表値がデータの中心的傾向をどのように表しているかを理解する。また、欠損値を含むデータに対して計算を行う際に、前処理や整形の方法によって結果の解釈が変わる可能性がある点に注意を向け、代表値を「計算結果」ではなく「解釈すべき情報」として捉える姿勢を身につけることを目標とする。
◆次コマの予習
次回の授業では、Pythonを用いてデータをグラフとして可視化する方法を学ぶ。そのため、配布テキストの該当箇所を事前に読み、Pythonにおける代表的なグラフ描画ライブラリであるmatplotlibがどのような役割を果たすかを確認しておくことを予習課題とする。
あわせて、これまでExcelで作成してきた棒グラフ・折れ線グラフ・円グラフについて、それぞれがどのような目的で用いられてきたかを振り返り、同じ種類のグラフをPythonで描くとどのような違いが生じるかを意識する。特に、グラフのタイトル、軸ラベル、凡例といった表示要素を自分で指定することが、情報の伝わり方にどのような影響を与えるかに注意を向けながら、次回の学修に備える。
21
Pythonでグラフを描く
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第21回は、第20回で学んだPythonによる代表値の計算を踏まえ、数値として得られた結果をグラフとして可視化する方法を学ぶ回である。これまでExcelを用いて行ってきたグラフ作成を、Pythonのライブラリを用いて実行することで、可視化の手順や表現方法をより明示的に理解することを目的とする。ここでは、Pythonにおける代表的なグラフ描画ライブラリであるmatplotlibの基本的な使い方を確認し、棒グラフ・折れ線グラフ・円グラフを実際に作成する。さらに、タイトルや軸ラベル、凡例といった表示要素を調整することで、グラフの見やすさや情報の伝わり方がどのように変化するかを確認する。本回は、Pythonによる可視化の基礎を固め、次回以降の分布グラフや関係性の可視化へとつなげる重要な回として位置づけられる。
◆コマ主題細目①
・第21回テキスト「Pythonでグラフを描く」 第1節「matplotlibの基本」
◆コマ主題細目②
・第21回テキスト「Pythonでグラフを描く」 第2節「棒・折れ線・円グラフ作成」
◆コマ主題細目③
・第21回テキスト「Pythonでグラフを描く」 第3節「表示のカスタマイズ」
コマ主題細目
① matplotlibの基本 ② 棒・折れ線・円グラフ作成 ③ 表示のカスタマイズ
細目レベル
① matplotlibの使い方の基本の理解まで。matplotlibは、Pythonでグラフを描画するための基本的なライブラリであり、データ分析や可視化の分野で広く利用されている。matplotlibを用いることで、数値データをグラフとして表現し、その結果を画面上に表示することができる。
授業では、matplotlibを読み込む方法を確認し、最小限のコードでグラフを描く流れを体験する。グラフの作成から表示までがどのような手順で行われるかを理解し、コードを上から順に実行することの重要性に注意を向ける。
これらの操作を通して、Pythonによるグラフ作成は、Excelの操作とは異なり、手順をコードとして明示することで再現性の高い可視化が可能である点を理解する。
② matplotlibを用いて、棒グラフ・折れ線グラフ・円グラフといった基本的なグラフの作成の理解まで。棒グラフはカテゴリごとの値の比較に、折れ線グラフは時間的な変化の把握に、円グラフは構成比の理解に適している点を整理し、それぞれの目的に応じた使い分けを確認する。
授業では、pandasで扱ってきた表形式データをもとに、Pythonでグラフを描画する操作を行い、数値データが視覚的にどのように表現されるかを確認する。Excelで作成したグラフと比較しながら、Pythonでのグラフ作成の特徴を理解する。
これにより、Pythonによるグラフ作成は、データと可視化を一体として扱うための手段であることを理解し、次回以降の分布グラフ作成に備える。
③ グラフの表示のカスタマイズ方法の理解まで。グラフを作成する際には、単に描画するだけでなく、見やすさや情報の正確な伝達を意識した表示の調整が重要である。タイトルや軸ラベル、凡例を適切に設定することで、グラフの意味が読み手に伝わりやすくなる。
授業では、これらの表示要素をコードで指定し、設定の違いによってグラフの印象がどのように変化するかを確認する。表示範囲や目盛りの調整によって、データの見え方が変わる点にも注意を向ける。
このようなカスタマイズを通して、グラフは単なる装飾ではなく、情報を正確に伝えるための表現であることを理解し、後半で扱うストーリーテリングや可視化の妥当性判断につなげる。
キーワード
① matplotlib ② データ可視化 ③ 表示のカスタマイズ
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだPythonによるグラフ作成について、matplotlibを用いてデータを可視化する基本的な流れを整理することを復習課題とする。特に、棒グラフ・折れ線グラフ・円グラフがそれぞれどのような目的に適しているかを振り返り、数値データをグラフとして表現することで、情報の理解がどのように変化するかを確認する。また、タイトルや軸ラベル、凡例などの表示要素を調整することで、グラフの見やすさや伝わり方が大きく変わる点に着目し、可視化は「描くこと」ではなく「伝えること」であるという視点を身につけることを目標とする。
◆次コマの予習
次回の授業では、Pythonを用いてデータの分布を可視化し、ヒストグラムおよび箱ひげ図を作成する方法を学ぶ。そのため、配布テキストの該当箇所を事前に読み、ヒストグラムが数値データの分布の形を表すグラフであること、箱ひげ図が分布の中心や散らばり、外れ値を要約して示すグラフであることを確認しておくことを予習課題とする。
あわせて、これまでExcelで作成してきたヒストグラムや箱ひげ図を思い出し、Pythonで同様のグラフを作成することで、どのようにデータの比較や解釈がしやすくなるかに着目する。特に、複数のデータを並べて分布を比較する際に、可視化がどのような役割を果たすかを意識しながら、次回の学修に備える。
22
Pythonでヒストグラムと箱ひげ図
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第22回は、第21回で学んだPythonによる基本的なグラフ作成を踏まえ、数値データの分布を可視化する方法として、ヒストグラムおよび箱ひげ図をPythonで作成する回である。これまでExcelを用いて学んできた分布の考え方や可視化手法を、Pythonを用いて再現することで、ツールが変わっても統計的な解釈の基本は共通であることを理解することを目的とする。ここでは、matplotlibの機能を用いてヒストグラムを描画し、データの分布の形や偏りを視覚的に把握する。あわせて、箱ひげ図を作成することで、分布の中心、散らばり、外れ値を簡潔に比較する方法を学ぶ。さらに、複数のデータを並べて表示することで、分布の違いを比較・解釈する力を養う。本回は、Pythonによる探索的データ分析(EDA)の入口として重要な位置づけを持つ。
◆コマ主題細目①
・第22回テキスト「Pythonでヒストグラムと箱ひげ図」 第1節「hist()で分布を見る」
◆コマ主題細目②
・第22回テキスト「Pythonでヒストグラムと箱ひげ図」 第2節「箱ひげ図の作成」
◆コマ主題細目③
・第22回テキスト「Pythonでヒストグラムと箱ひげ図」 第3節「データの比較」
コマ主題細目
① hist()で分布を見る ② 箱ひげ図の作成 ③ データの比較
細目レベル
① hist()でのヒストグラム作成方法の理解まで。ヒストグラムは、数値データがどの範囲にどの程度分布しているかを表すための基本的なグラフである。Pythonでは、matplotlibの hist() 関数を用いることで、簡単にヒストグラムを描画することができる。
授業では、pandasで読み込んだ数値データを対象として hist() を実行し、データの分布の形や広がりを確認する。階級数(ビン数)の設定を変えることで、ヒストグラムの見え方がどのように変化するかにも注意を向ける。
これらの操作を通して、ヒストグラムは単に描画するための機能ではなく、分布の特徴を読み取るための重要な可視化手法であることを理解する。
② matplotlibによる箱ひげ図作成方法の理解まで。箱ひげ図は、四分位数を基にしてデータの分布を要約するグラフであり、分布の中心、散らばり、外れ値の有無を一目で把握できる点に特徴がある。Pythonでは、matplotlibを用いて箱ひげ図を作成することができる。
授業では、数値データから箱ひげ図を描画し、箱やひげがそれぞれ何を表しているかを確認する。ヒストグラムと比較しながら、箱ひげ図が分布の詳細な形を示すものではなく、分布を簡潔に要約するための可視化である点を理解する。
このように、箱ひげ図は分布を比較する際に特に有効であり、次のデータ比較の学習につながる重要な手法であることを確認する。
③ 複数図を並べて比較し、データへの理解の仕方を理解するまで。ヒストグラムや箱ひげ図を複数並べて表示することで、異なるデータ同士の分布を比較することができる。授業では、複数のグループや条件に分かれたデータを例に取り、分布の中心や広がり、偏りの違いを視覚的に比較する。
比較の際には、単にグラフを並べるだけでなく、同じ尺度や条件で描画することが重要である点に注意を向ける。表示範囲やビン数が異なる場合、見え方が変わり、誤解を招く可能性があることを確認する。
このような比較を通して、Pythonによる分布の可視化は、データの特徴を把握し、次に行う分析や解釈の出発点となることを理解し、探索的データ分析の基礎を固める。
キーワード
① matplotlib ② ヒストグラム ③ hist()
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだPythonによるヒストグラムおよび箱ひげ図の作成について、分布の中心、散らばり、偏り、外れ値といった特徴が、それぞれのグラフでどのように表現されているかを整理することを復習課題とする。特に、ヒストグラムでは分布の形や広がりがどのように読み取れるか、箱ひげ図では分布がどのように要約され、比較しやすくなるかに着目する。あわせて、ビン数や表示範囲の設定によって見え方が変わる点を振り返り、可視化結果をそのまま受け取るのではなく、条件を意識して解釈する姿勢を身につけることを目標とする。
◆次コマの予習
次回の授業では、ヒストグラムや箱ひげ図を用いて、分布の形を比較しながら読み取る方法を学ぶ。そのため、配布テキストの該当箇所を事前に読み、分布が左右対称な場合と、右に偏っている場合、左に偏っている場合とで、グラフの形がどのように異なるかを確認しておくことを予習課題とする。
あわせて、分布の形と代表値との関係に着目し、平均値と中央値がどのような位置関係になるかを考えておく。さらに、同じデータであっても、通常の目盛と対数目盛(対数グラフ)で表示した場合に、分布の見え方や比較のしやすさがどのように変化するかに注意を向け、複数のグラフを比較して分布を解釈するとはどういうことかを意識しながら次回の学修に備える。
23
分布の形を比べる
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第23回は、第22回で学んだPythonによるヒストグラムおよび箱ひげ図の作成を踏まえ、分布の「形」に注目してデータを解釈する回である。分布の中心や散らばりだけでなく、左右の偏りや形状を把握することは、代表値や統計量を正しく解釈するために不可欠である。ここでは、分布が左右対称である場合と、右に偏っている場合、左に偏っている場合の違いを整理し、それぞれの特徴をグラフから読み取る。さらに、分布の形と平均値・中央値の位置関係を確認し、代表値が分布の影響をどのように受けるかを理解する。加えて、通常の目盛と対数目盛を含む複数のグラフを比較する演習を通して、表現方法の違いが分布の見え方に与える影響を考察する。本回は、分布を「描く」段階から「比べて説明する」段階へ進む重要な回として位置づけられる。
◆コマ主題細目①
・第23回テキスト「分布の形を比べる」 第1節「対称・右偏・左偏の理解」
◆コマ主題細目②
・第23回テキスト「分布の形を比べる」 第2節「平均と中央値の関係」
◆コマ主題細目③
・第23回テキスト「分布の形を比べる」 第3節「対数グラフも含めた複数グラフの比較演習」
コマ主題細目
① 対称・右偏・左偏の理解 ② 平均と中央値の関係 ③ 対数グラフも含めた複数グラフの比較演習
細目レベル
① 分布の形は、大きく左右対称な分布、右に偏った分布、左に偏った分布に分類することができる。左右対称な分布では、データが中心付近を軸としてほぼ均等に広がっており、ヒストグラムの左右の形が似た形になる。一方、右に偏った分布では、低い値にデータが集中し、高い値の方向に裾が長く伸びる形となる。左に偏った分布では、その逆に、高い値にデータが集中し、低い値の方向に裾が伸びる。
具体的なヒストグラムを例に、どのような形が「偏り」として判断されるのかを確認し、分布の形を言葉で説明する練習を行う。分布の形を把握することで、代表値や散らばりを解釈する際の前提条件が明確になる点を理解する。
② 分布の形は、平均値と中央値の位置関係に影響を与える。左右対称な分布では、平均値と中央値はほぼ同じ位置に現れることが多い。一方、右に偏った分布では、裾が長い方向に平均値が引きずられるため、平均値が中央値より大きくなる傾向がある。左に偏った分布では、その逆の関係が見られる。
ヒストグラムや箱ひげ図を用いて、分布の形と代表値の位置関係を確認し、なぜそのような違いが生じるのかを考察する。これにより、平均値だけを見て判断することの危険性や、中央値が有効な場面について理解を深める。
分布の形を踏まえて代表値を解釈する姿勢は、後半で扱う回帰直線やストーリーテリングにおいても重要な基礎となる。
③ 同じデータであっても、グラフの種類や目盛の取り方によって分布の見え方は大きく変化する。通常の目盛で描いたヒストグラムと、対数目盛を用いたグラフとを比較し、分布の形や偏りがどのように強調または緩和されるかを確認する。
複数のグラフを並べて比較する演習を通して、どの表現が分布の特徴を把握しやすいか、またどの表現が誤解を招く可能性があるかを考察する。特に、対数グラフは指数的な変化を扱う際に有効である一方、分布の直感的な理解を難しくする場合がある点にも注意を向ける。
この演習を通して、分布を比較・解釈する際には、一つのグラフだけに頼るのではなく、複数の視点から確認することが重要であることを理解し、次回以降の関係性分析へとつなげる。
キーワード
① 分布の形 ② 対称分布 ③ 左右に偏った分布
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだ分布の形の違いについて、左右対称な分布、右に偏った分布、左に偏った分布がそれぞれどのような特徴を持つかを整理し、生成AIを用いて問題を作成し回答することを復習課題とする。特に、分布の形と平均値・中央値の位置関係に着目し、なぜ分布が偏ると代表値の解釈が変わるのかを、ヒストグラムや箱ひげ図を用いた説明としてまとめる。また、通常の目盛と対数目盛を用いたグラフを比較し、表現方法の違いが分布の見え方や解釈にどのような影響を与えるかを振り返り、可視化結果を多角的に確認する姿勢を身につけることを目標とする。
◆次コマの予習
次回の授業では、二つの数値データの関係を可視化する方法として散布図を扱い、そこからどのような関係や傾向が読み取れるかを学ぶ。そのため、配布テキストの該当箇所を事前に読み、散布図が一つの変数の分布を表すグラフとは異なり、二つの変数の組み合わせを点として表現するグラフであることを確認しておくことを予習課題とする。
あわせて、散布図において点の並び方によって、正の相関、負の相関、相関が見られない場合といった違いが生じることに着目し、それぞれがどのような状態を表しているかを考えておく。さらに、身近なデータの例を想定し、散布図からどのような解釈ができそうかを意識しながら、次回の学修に備える。
24
相関①:散布図の読み方
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第24回は、第23回までに学んだ一変量データの分布理解を踏まえ、二つの数値データの関係に注目する回である。これまでの授業では、ヒストグラムや箱ひげ図を用いて一つの変数の分布を読み取ってきたが、実際のデータ分析では、二つ以上の変数の関係を把握することが重要となる。ここでは、散布図を用いて二変量データを可視化し、点の並び方からどのような関係が読み取れるかを学ぶ。あわせて、正の相関・負の相関・相関が見られない場合といった基本的な相関の種類を整理し、具体的な事例を通して解釈の仕方を確認する。本回は、次回以降に扱う相関係数や回帰分析に向けた導入として位置づけられる。
◆コマ主題細目①
・第24回テキスト「相関①:散布図の読み方」 第1節「散布図の作成と解釈」
◆コマ主題細目②
・第24回テキスト「相関①:散布図の読み方」 第2節「相関の種類(正・負・無)」
◆コマ主題細目③
・第24回テキスト「相関①:散布図の読み方」 第3節「事例から解釈の仕方」
コマ主題細目
① 散布図の作成と解釈 ② 相関の種類(正・負・無) ③ 事例から解釈の仕方
細目レベル
① 散布図の作成の方法と解釈に仕方の理解まで。散布図は、二つの数値データの組み合わせを点として表現し、変数間の関係を視覚的に捉えるための基本的なグラフである。横軸と縦軸にそれぞれ異なる変数を配置し、各観測値を一点として描くことで、全体の傾向やばらつきが把握しやすくなる。
Pythonを用いて散布図を作成し、点がどのように分布しているかを確認する。点が一直線に近い形で並んでいる場合や、ばらばらに散らばっている場合など、点の配置によって読み取れる情報が異なる点に注意を向ける。散布図の解釈では、個々の点に注目するだけでなく、全体としてどのような傾向が見られるかを俯瞰することが重要であることを理解する。
② 相関の理解まで。散布図から読み取れる関係は、大きく正の相関、負の相関、相関が見られない場合に分類することができる。正の相関は、一方の値が大きくなるにつれて他方の値も大きくなる傾向が見られる場合を指す。負の相関は、一方の値が大きくなるにつれて他方の値が小さくなる傾向が見られる場合である。
一方、点が特定の方向に並ばず、ばらばらに分布している場合には、明確な相関が見られないと判断される。このような分類を具体的な散布図の例を通して確認し、相関の有無や方向を言葉で説明する練習を行う。相関の種類を区別することで、次に扱う相関係数による定量的な評価への理解を深める。
③ 関係性の理解まで。散布図から関係を読み取る際には、実際のデータや事例を踏まえて解釈することが重要である。例えば、身長と体重、広告費と売上高など、身近な事例を用いて、どのような相関が考えられるかを検討する。同時に、散布図に相関が見られたとしても、それが因果関係を意味するとは限らない点にも注意を向ける。第三の要因が影響している場合や、偶然によって関係が見えている場合があることを具体例で確認する。このような事例検討を通して、散布図は関係を「示唆する」ものであり、結論を断定するものではないことを理解し、慎重に解釈する姿勢を身につける。
キーワード
① 散布図 ② 相関 ③ 点の分布 ④ 傾向 ⑤ 相関と因果
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだ散布図の読み方について、二つの数値データの関係が点の並び方としてどのように表現されるかを整理し、生成AIを用いて問題を作成し解答することを復習課題とする。特に、正の相関、負の相関、相関が見られない場合の違いを、散布図の形状と言葉の両方で説明できるようにする。また、散布図に相関が見られたとしても、それが因果関係を意味するとは限らない点に注意を向け、事例を通して慎重に解釈する姿勢を身につけることを目標とする。
◆次コマの予習
次回の授業では、散布図から読み取った関係を数値として表す方法として「相関係数 r」を扱う。そのため、配布テキストの該当箇所を事前に読み、相関係数がどのような値をとり、どの範囲で関係の強さや方向を示す指標であるかを確認しておくことを予習課題とする。あわせて、Excelの CORREL 関数がどのような目的で用いられるかを確認し、散布図で視覚的に見た関係と、数値として算出された相関係数がどのように対応するのかを意識しておく。さらに、Pythonでは散布図に回帰線を重ねることで関係を視覚的に表現できることにも触れ、次回の実習内容を理解する準備を整える。
25
相関②:相関係数
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第25回は、第24回で学んだ散布図による視覚的な相関の理解を踏まえ、二つの変数の関係を数値として表す方法である相関係数を扱う回である。散布図では点の並び方から関係の方向や強さを感覚的に把握してきたが、相関係数を用いることで、その関係を定量的に評価できるようになる。本回では、相関係数 r の意味と値の範囲を整理し、Excelの CORREL 関数およびPythonによる計算方法を確認する。さらに、散布図に回帰線を重ねることで、視覚的な傾向と数値指標がどのように対応するかを理解する。本回は、次回以降に扱う回帰分析への重要な橋渡しとして位置づけられる。
◆コマ主題細目①
・第25回テキスト「相関②:相関係数」 第1節「相関係数rの意味」
◆コマ主題細目②
・第25回テキスト「相関②:相関係数」 第2節「Excel:CORREL関数」
◆コマ主題細目③
・第25回テキスト「相関②:相関係数」 第3節「Python:散布図+回帰線」
コマ主題細目
① 相関係数rの意味 ② Excel:CORREL関数 ③ Python:散布図+回帰線
細目レベル
① 相関係数rの意味の理解まで。相関係数rは、二つの変数の線形な関係の強さと方向を表す指標であり、値は−1から1の範囲をとる。rが1に近いほど強い正の相関、−1に近いほど強い負の相関を示し、0に近い場合は線形な関係が弱い、あるいは見られないことを意味する。散布図を用いて、点が一直線に近く並ぶ場合と、ばらばらに分布する場合を比較し、視覚的な傾向とrの値との対応関係を確認する。 また、相関係数は「関係の強さ」を示すものであって、「因果関係」を示すものではない点を改めて整理する。第三の変数の影響や偶然による相関の可能性にも触れ、数値を過度に信頼しない姿勢を身につける。
② Excelでは、CORREL関数を用いることで、二つの数値データの相関係数を簡単に求めることができる。授業では、実際のデータを用いてCORREL関数を入力し、相関係数を算出する操作を確認する。その際、データ範囲の指定が正しく行われているか、欠損値が含まれていないかなど、計算前の確認が重要である点に注意を向ける。Excelで算出した相関係数と散布図の形を対応づけることで、視覚的な傾向と数値による評価がどのように一致するかを理解する。
③ Pythonでは、pandasやmatplotlibを用いて相関係数を計算するとともに、散布図に回帰線を重ねて表示することができる。回帰線は、二つの変数の関係を直線として表現したものであり、データの傾向を視覚的に示す役割を持つ。授業では、Pythonで散布図を描き、その上に回帰線を追加して表示する操作を体験する。回帰線の傾きが正であれば正の相関、負であれば負の相関を示すことを確認し、相関係数との対応関係を理解する。回帰線はデータの傾向を示す補助的な線であり、すべての点を完全に説明するものではない点にも注意を向ける。これにより、次回以降の回帰分析の学習に向けた基礎的理解を固める。
キーワード
① 相関係数r ② 線形関係 ③ 回帰線 ④ 相関と因果
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだ相関係数rについて、その値の範囲(−1から1)と、関係の強さや方向をどのように表すかを整理することを復習課題とする。特に、散布図で視覚的に確認した傾向と、ExcelのCORREL関数やPythonで算出した相関係数の値がどのように対応しているかを振り返る。また、相関係数は二つの変数の「線形な関係の強さ」を示す指標であり、因果関係を直接示すものではない点を再確認する。数値が大きいからといって安易に結論を導かない姿勢を身につけることを目標とする。
◆次コマの予習
次回の授業では、相関関係と因果関係の違い、および擬相関の考え方を扱う。そのため、配布テキストの該当箇所を事前に読み、相関が見られる場合でも必ずしも一方が他方の原因とは限らないことを確認しておくことを予習課題とする。あわせて、第三の要因が二つの変数に同時に影響を与えることで見かけ上の相関が生じる「擬相関」の例を考え、相関係数の値だけで判断することの危険性に注意を向ける。相関の結果を解釈する際には、どのような点に気を付ける必要があるかを意識しながら、次回の学修に備える。
26
相関③:因果関係と擬相関
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第26回は、第24回および第25回で学んだ散布図と相関係数による関係の把握を踏まえ、相関関係と因果関係の違いについて理解を深める回である。これまで、二つの変数の間にどのような関係があるかを視覚的および数値的に確認してきたが、その関係がどのような意味を持つのかを慎重に解釈することが重要である。本回では、相関関係と因果関係の違いを整理し、見かけ上の相関である擬相関の例を通して、統計的な解釈の注意点を確認する。数値やグラフが示す結果をどのように受け止めるべきかを考えることで、統計的思考における批判的な視点を養う。本回は、次回以降の回帰分析や最終回の「主張の妥当性判断」に直結する重要な回として位置づけられる。
◆コマ主題細目①
・第26回テキスト「相関③:因果関係と擬相関」 第1節「相関関係と因果関係の違い」
◆コマ主題細目②
・第26回テキスト「相関③:因果関係と擬相関」 第2節「擬相関」
◆コマ主題細目③
・第26回テキスト「相関③:因果関係と擬相関」 第3節「相関の注意点」
コマ主題細目
① 相関関係と因果関係の違い ② 擬相関 ③ 相関の注意点
細目レベル
① 相関と因果の違いの理解まで。相関関係とは、二つの変数が一定の傾向をもって同時に変化している状態を指す。一方、因果関係とは、一方の変数が他方の変数の原因となり、直接的な影響を与えている関係を意味する。散布図や相関係数によって関係の強さや方向を把握できたとしても、それが直ちに因果関係を示すものではない点を、具体例を通して確認する。例えば、気温とアイスクリームの売上の間には正の相関が見られるが、気温が上がることが直接売上を増やすのか、それとも他の要因が関与しているのかを慎重に考える必要がある。このように、相関は「同時に変化している」ことを示すに過ぎず、因果関係の証明には追加の検討が必要であることを理解する。
② 擬相関の理解まで。擬相関とは、二つの変数の間に相関が見られるものの、その関係が直接的な因果関係によるものではなく、第三の要因の影響によって生じている場合を指す。具体的な事例を取り上げ、第三の変数が二つの変数に同時に影響を与えることで、見かけ上の相関が生じる可能性を確認する。例えば、季節という要因が複数の行動に影響を与えている場合、表面的には関連しているように見えることがある。擬相関の存在を理解することで、相関係数の値だけに依存せず、データの背景や条件を考慮する必要があることを認識する。
③ 相関の注意点の理解まで。相関係数は線形な関係を前提とした指標であり、非線形な関係がある場合にはその強さを十分に表せないことがある。また、外れ値が含まれている場合には、相関係数の値が大きく変化する可能性がある点にも注意が必要である。散布図と相関係数を併せて確認し、数値と視覚的情報の両方から解釈する姿勢を重視する。相関分析の結果を説明する際には、「相関がある」と断定するのではなく、「相関が見られる」という表現を用いるなど、慎重な言葉遣いが求められることも確認する。このような注意点を踏まえ、統計的な結果を適切に解釈する態度を身につける。
キーワード
① 相関関係 ② 因果関係 ③ 擬相関 ④ 非線形関係 ⑤ 相関係数の限界
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだ相関関係と因果関係の違いについて、両者がどのように区別されるかを整理することを復習課題とする。特に、相関が見られる場合でも、それが直接的な原因と結果の関係を意味するとは限らない点に着目する。また、第三の要因によって生じる擬相関の例を振り返り、相関係数の値だけで結論を導くことの危険性を確認する。さらに、外れ値や非線形な関係が相関の解釈に与える影響についても整理し、統計的結果を批判的に読み取る姿勢を身につけることを目標とする。
◆次コマの予習
次回の授業では、二つの変数の関係を一本の直線で表現する回帰分析を扱う。そのため、配布テキストの該当箇所を事前に読み、散布図に直線を引くことがどのような意味を持つのかを確認しておくことを予習課題とする。あわせて、相関係数が「関係の強さ」を示す指標であったのに対し、回帰分析では「関係を式として表す」点に違いがあることを意識する。また、回帰直線から何が読み取れるのか、そしてどのような限界があるのかについても考えながら、次回の学修に備える。
27
回帰直線:データの関係を1本の線で表す
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第27回は、第24回から第26回にかけて学んだ散布図および相関係数による関係の理解を踏まえ、二つの変数の関係を一本の直線として表現する回帰分析を扱う回である。相関係数が関係の強さを示す指標であったのに対し、回帰分析は関係を式として表現し、予測や説明に用いることができる点に特徴がある。本回では、散布図上に回帰直線を描き、データの傾向をどのように表現するかを学ぶ。さらに、回帰直線の傾きや切片の意味を整理し、そこから何が読み取れるのかを確認する。あわせて、回帰分析の限界や注意点についても考察し、回帰結果を過度に解釈しない姿勢を身につける。本回は、関係性をモデルとして捉える段階への重要なステップとして位置づけられる。
◆コマ主題細目①
・第27回テキスト「回帰直線:データの関係を1本の線で表す」 第1節「回帰直線の描き方」
◆コマ主題細目②
・第27回テキスト「回帰直線:データの関係を1本の線で表す」 第2節「回帰直線の読み方」
◆コマ主題細目③
・第27回テキスト「回帰直線:データの関係を1本の線で表す」 第3節「回帰の限界と注意」
コマ主題細目
① 回帰直線の描き方 ② 回帰直線の読み方 ③ 回帰の限界と注意
細目レベル
① 回帰直線の描き方の理解まで。散布図に描かれた多数の点の傾向を、一本の直線で近似的に表す方法が回帰分析である。点が完全に一直線上に並ぶことは少ないが、全体としての傾向を最もよく表す直線を引くことで、関係の方向や強さを視覚的に示すことができる。授業では、Pythonを用いて散布図に回帰直線を重ねて描画し、直線がデータの中心的な傾向をどのように示しているかを確認する。回帰直線は、個々の点を完全に通るものではなく、全体としての誤差を最小にするように引かれている点に注意を向ける。この操作を通して、回帰分析はデータのばらつきを前提としながら、関係を単純化して表現する手法であることを理解する。
② 回帰直線の読み方の理解まで。回帰直線は、一般に「傾き」と「切片」という二つの要素によって表される。傾きは、説明変数が1単位増加したときに目的変数がどの程度変化するかを示す指標であり、関係の方向と大きさを表す。切片は、説明変数が0のときの目的変数の値を示す。具体例を用いて、傾きが正である場合と負である場合の違いを確認し、傾きの大きさが変化の程度をどのように表しているかを理解する。また、回帰直線は予測のために利用できる一方、観測範囲を大きく外れた値に対する予測は慎重に扱う必要がある点にも触れ、直線の意味を適切に読み取る姿勢を養う。
③ 会期の限界と問題点の理解まで。回帰分析は関係を単純化して表す有用な方法であるが、その結果を過度に一般化することは危険である。回帰直線が示すのはあくまで線形な関係であり、非線形な関係がある場合には十分に表現できないことがある。また、回帰直線が示す関係も、相関と同様に因果関係を証明するものではない。外れ値の影響やデータの範囲の偏りによって、直線の傾きが大きく変化する場合がある点にも注意が必要である。このような限界を理解することで、回帰分析を「便利な道具」として適切に活用する姿勢を身につける。回帰結果を鵜呑みにせず、データの背景や前提条件を考慮して解釈することが重要である。
キーワード
① 回帰直線 ② 傾き ③ 切片 ④ 予測 ⑤ 最小二乗法
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだ回帰分析について、散布図に回帰直線を重ねることの意味を整理することを復習課題とする。特に、回帰直線の傾きが二つの変数の関係の方向と大きさをどのように表しているか、また切片がどのような意味を持つかを確認する。あわせて、回帰直線はあくまでデータの傾向を近似的に表すものであり、外れ値や非線形な関係の影響を受ける可能性がある点に注意を向ける。回帰分析の結果をそのまま結論として受け取るのではなく、前提や限界を踏まえて解釈する姿勢を身につけることを目標とする。
◆次コマの予習
次回の授業では、探索的データ分析(EDA)の考え方を取り上げ、代表値・ばらつき・分布・可視化といったこれまで学んできた要素を統合的に活用する方法を学ぶ。そのため、配布テキストの該当箇所を事前に読み、EDAとは何を目的とした分析の姿勢であるかを確認しておくことを予習課題とする。あわせて、同じデータであっても、代表値だけを見る場合、分布を見る場合、回帰直線を見る場合など、分析の視点によって解釈がどのように変わる可能性があるかを考えておく。これまで学んできた統計量や可視化手法をどのように組み合わせて使うかを意識しながら、次回の学修に備える。
28
探索的データ分析(EDA)と可視化の統合
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第28回は、これまで学んできた代表値、散らばり、分布、相関、回帰といった統計的手法を統合し、探索的データ分析(Exploratory Data Analysis:EDA)の考え方を理解する回である。本科目では個々の手法を段階的に学習してきたが、実際のデータ分析ではそれらを組み合わせて用いる必要がある。本回では、EDAの目的と姿勢を整理したうえで、代表値やばらつき、分布、可視化をどのように組み合わせてデータの特徴を把握するかを学ぶ。さらに、同じデータであっても、着目する視点や表現方法によって解釈が変わる具体例を通して、多角的にデータを見る重要性を理解する。本回は、次回以降のストーリーテリングおよび最終回の総括に直結する、統合的理解の回として位置づけられる。
◆コマ主題細目①
・第28回テキスト「探索的データ分析(EDA)と可視化の統合」 第1節「EDAとは」
◆コマ主題細目②
・第28回テキスト「探索的データ分析(EDA)と可視化の統合」 第2節「代表値・ばらつき・分布・可視化の組み合わせ」
◆コマ主題細目③
・第28回テキスト「探索的データ分析(EDA)と可視化の統合」 第3節「同じデータでも見方が変わる具体例」
コマ主題細目
① EDAとは ② 代表値・ばらつき・分布・可視化の組み合わせ ③ 同じデータでも見方が変わる具体例
細目レベル
① 探索的データ分析(EDA)の理解まで。EDAとは、データの特徴や傾向を理解するために、仮説を固定せずに多角的にデータを観察・整理する分析の姿勢を指す。厳密な検定やモデル化の前に、まずデータを「よく見る」ことを重視する点に特徴がある。EDAでは、数値だけでなく、グラフや要約統計量を組み合わせてデータを把握する。外れ値の有無、分布の形、変数間の関係などを総合的に確認することで、データの構造を理解することができる。この考え方は、これまで学んできた代表値や散布図、回帰直線といった個別の手法を統合する枠組みであり、分析の出発点として重要であることを理解する。
② データを適切に理解するためには、代表値だけを見るのではなく、ばらつきや分布の形、さらには可視化による視覚的な確認を組み合わせることが重要である。ここでは、この組み合わせの重要度の理解まで。例えば、平均値が同じであっても、標準偏差や箱ひげ図を確認すると分布の違いが明らかになる場合がある。散布図や回帰直線を加えることで、変数間の関係も含めて総合的に把握することが可能となる。このように、複数の指標やグラフを併用することで、単一の視点では見落とされる特徴を発見できる。EDAの実践では、「どの指標を使うか」「どのグラフを描くか」を目的に応じて選択することが求められることを理解する。
③ 同じデータであっても、代表値に注目する場合、分布に注目する場合、回帰直線に注目する場合など、着目する視点によって解釈が変わることがある。具体例を用いて、平均値だけを見た場合と、ヒストグラムや箱ひげ図を確認した場合とで、どのように印象が異なるかを比較する。さらに、対数グラフや指数化したグラフなど、表現方法の違いによってデータの見え方が変わることにも触れる。このような比較を通して、データ分析においては単一の結果に依存せず、多角的に検討する姿勢が重要であることを理解する。この視点は、次回のストーリーテリングや最終回の妥当性判断に直接つながる。
キーワード
① 探索的データ分析(EDA) ② 可視化の組み合わせ ③ 多角的視点 ④ 統計的思考
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだ探索的データ分析(EDA)の考え方について、これまで学習してきた代表値、ばらつき、分布、相関、回帰といった手法がどのように組み合わされるかを整理することを復習課題とし、生成AIを用いて自身で問題作成し説くまでとする。特に、単一の統計量やグラフだけに依存せず、複数の視点からデータを確認することで、解釈の妥当性が高まる点に着目する。同じデータであっても、注目する指標や可視化の方法によって印象や解釈が変わる可能性があることを振り返り、多角的にデータを見る姿勢を身につけることを目標とする。
◆次コマの予習
次回の授業では、データ可視化を用いて「何を伝えるか」という視点からストーリーテリングの考え方を学ぶ。そのため、配布テキストの該当箇所を事前に読み、同じデータから複数の解釈や主張が生まれ得ることを確認しておくことを予習課題とする。あわせて、グラフは単に事実を示すものとして用いる場合と、特定の主張を伝えるために構成される場合とで役割が異なることに着目し、データからどのように主張を導き出すかを考えながら次回の学修に備える。
29
データ可視化によるストーリーテリング①:表現技法
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第29回は、第28回で学んだ探索的データ分析(EDA)による多角的なデータ理解を踏まえ、可視化を用いてどのように情報を「伝えるか」に焦点を当てる回である。これまでの授業では、データを整理し、分析し、解釈する方法を学んできたが、実社会においては、その結果を他者に分かりやすく説明する力も重要である。本回では、データからどのように主張を導き出すかを整理し、事実のみを示すグラフと、主張を意識して構成されたグラフとの違いを確認する。さらに、可視化の表現方法によって、読み手に与える印象がどのように変わるかを考察する。本回は、最終回の「主張の妥当性判断」へ直結する重要な回として位置づけられる。
◆コマ主題細目①
・第29回テキスト「データ可視化によるストーリーテリング①:表現技法」 第1節「データから主張を作る」
◆コマ主題細目②
・第29回テキスト「データ可視化によるストーリーテリング①:表現技法」 第2節「事実だけを示すグラフ」
◆コマ主題細目③
・第29回テキスト「データ可視化によるストーリーテリング①:表現技法」 第3節「主張を伝えるグラフ」
コマ主題細目
① データから主張を作る ② 事実だけを示すグラフ ③ 主張を伝えるグラフ
細目レベル
① データから主張の理解まで。データは単なる数値の集合ではなく、適切に解釈することで意味を持つ情報となる。ストーリーテリングとは、データから導かれる傾向や特徴を整理し、伝えたい内容を明確に構成する行為である。授業では、同じデータを用いて複数の観点から読み取りを行い、どの点に着目するかによって主張が変わり得ることを確認する。例えば、平均値に注目する場合と分布の偏りに注目する場合とで、強調される内容が異なることを整理する。主張を作る際には、データに基づく根拠が明確であることが重要であり、恣意的な解釈を避ける姿勢が求められることを理解する。
② 事実だけを示すグラフの理解まで。このグラフとは、データの内容をできる限り客観的に提示し、読み手に判断を委ねる表現である。過度な装飾や強調を避け、軸や単位を明確に示すことで、誤解を招かない構成とすることが求められる。具体例を通して、必要最小限の情報で構成されたグラフがどのように見えるかを確認し、タイトルやラベルの重要性を整理する。事実を示すことと、読み手の解釈を誘導することとの違いを意識し、可視化の役割を再確認する。
③ 主張を伝えるグラフの理解まで。主張と直結するグラフとは、特定の視点やメッセージを明確にするために構成された可視化である。強調したい部分を色や注釈で示すことで、読み手の注意を特定のポイントに向けることができる。ただし、強調の仕方によっては、事実を誇張したり、誤解を招いたりする可能性があるため、適切な範囲で表現を工夫する必要がある。同じデータを用いて、事実のみを示すグラフと主張を意識したグラフを比較し、印象や伝わり方の違いを検討する。この演習を通して、可視化は情報伝達の手段であり、作成者の意図が反映されるものであることを理解する。
キーワード
① ストーリーテリング ② 強調 ③ グラフ表現 ④ データに基づく説明
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだデータ可視化によるストーリーテリングについて、データからどのように主張を導き出すかを整理することを復習課題とする。特に、事実のみを示すグラフと、特定の主張を意識して構成されたグラフとでは、どのように表現や印象が異なるかを振り返る。また、強調の仕方や表示方法によって、同じデータであっても読み手の受け取り方が変わる可能性があることを確認し、可視化が単なる図示ではなく、情報伝達の手段であることを理解することを目標とする。
◆次コマの予習
次回の授業では、可視化されたデータと主張の妥当性について検討し、良い可視化と悪い可視化の違いを整理する。そのため、配布テキストの該当箇所を事前に読み、どのような場合にグラフが誤解を招く可能性があるかを確認しておくことを予習課題とする。あわせて、統計や可視化を用いて説明を行う際に、どのような点を確認すべきかを考え、データと主張の関係が適切であるかどうかを判断する視点を意識しながら次回の学修に備える。
30
データ可視化によるストーリーテリング②:主張の妥当性
科目の中での位置付け
本科目は、数値やグラフとして提示される情報を正しく読み取り、その意味や限界を理解する力を養うことを目的とする。具体的には、統計学の基本的な考え方を「データの可視化」を軸に体系的に学ぶ。授業では、Microsoft ExcelおよびPythonを用いた実習を通して、データの整理、分布や傾向の把握、散布図や時系列グラフによる関係性の理解を段階的に学習する。数式の理解に偏ることなく、グラフから読み取れる情報や解釈の妥当性に重点を置くことで、統計を「計算する技術」ではなく「考えるための道具」として活用できる基礎力の育成を目指す。
第30回は、本科目の最終回として、これまで学んできた統計的手法および可視化の考え方を総括する回である。第29回では、データを用いて主張を構成し、伝えるための表現技法を扱った。本回では、その主張が統計的に妥当であるかどうかを検討する視点を養う。授業では、可視化されたグラフと主張との対応関係を確認し、良い可視化と悪い可視化の違いを整理する。さらに、統計と可視化を適切に活用するためのチェックリストを提示し、データを読み解く力と批判的に考える力を統合する。本回は、統計を「計算する技術」から「判断する力」へと昇華させる総まとめの回として位置づけられる。
◆コマ主題細目①
・第30回テキスト「データ可視化によるストーリーテリング②:主張の妥当性」 第1節「可視化と主張の妥当性」
◆コマ主題細目②
・第30回テキスト「データ可視化によるストーリーテリング②:主張の妥当性」 第2節「良い可視化・悪い可視化」
◆コマ主題細目③
・第30回テキスト「データ可視化によるストーリーテリング②:主張の妥当性」 第3節「統計と可視化を使うためのチェックリスト」
コマ主題細目
① 可視化と主張の妥当性 ② 良い可視化・悪い可視化 ③ 統計と可視化を使うためのチェックリスト
細目レベル
① 可視化されたグラフは、主張の根拠として提示されることが多い。しかし、グラフが示している内容と、そこから導かれている主張が適切に対応しているとは限らない。具体例を用いて、グラフから直接読み取れる事実と、そこから一歩踏み込んだ解釈との違いを確認する。相関があることと因果関係があることを混同していないか、データの範囲を超えた一般化をしていないかといった点に注意を向ける。主張の妥当性を検討するためには、データの内容、集計方法、可視化の設定などを総合的に確認する必要があることを理解する。
② 良い可視化とは、データの内容を正確かつ分かりやすく伝えるものであり、軸や単位、凡例が明確で、誤解を招かない構成になっている。一方、悪い可視化は、軸の切り取りや過度な強調、不適切なグラフの選択などによって、実際のデータ以上の印象を与えてしまう場合がある。具体的なグラフ例を比較し、どのような点が誤解を生みやすいのかを検討する。見た目の美しさと情報の正確さが必ずしも一致しないことを確認する。可視化は中立的なものではなく、作成者の意図が反映される可能性があることを理解し、読み手としても批判的に確認する姿勢を身につける。
③ 統計と可視化を適切に用いるためには、いくつかの確認項目を意識することが重要である。例えば、データの出所は明確か、代表値や散らばりは適切に示されているか、外れ値の影響は考慮されているか、相関と因果を混同していないか、といった点が挙げられる。これまで学んできた代表値、分布、相関、回帰、時系列分析などの内容を振り返りながら、どのような視点でグラフや数値を確認すべきかを整理する。このチェックリストは、本科目終了後もデータを扱う場面で活用できる実践的な指針となることを確認し、統計的思考の定着を図る。
キーワード
① 主張の妥当性 ② 可視化の批判的検討 ③ 印象操作 ④ データリテラシー
コマの展開方法
社会人講師
AL
ICT
PowerPoint・Keynote
教科書
コマ用オリジナル配布資料
コマ用プリント配布資料
その他
該当なし
小テスト
「小テスト」については、毎回の授業時間内に、LMS上において当該コマの小テスト(難易度表示付き)を実施する。
復習・予習課題
◆本コマの復習
本コマで学んだ「可視化と主張の妥当性」について、本科目全体を振り返りながら整理することを復習課題とする。特に、グラフが示している事実と、そこから導かれている主張とが適切に対応しているかを確認する視点をまとめる。これまで学習してきた代表値、散らばり、分布、相関、回帰、時系列分析の内容を踏まえ、可視化を用いて説明を行う際にどのような点をチェックすべきかを整理する。さらに、良い可視化と悪い可視化の違いを具体例とともに説明し、データを「読む力」と「疑う力」の両方が重要であることを自分の言葉でまとめる。本科目で身につけた統計的思考が、今後どのような場面で活用できるかについても考察する。
履修判定指標
履修指標
履修指標の水準
キーワード
配点
関連回
①統計の基礎理解
・統計の目的と限界を理解している。
・データと情報の違いを説明できる。
・質的データと量的データの違いを理解している。
・尺度(名義・順序・間隔・比例)の区別ができる。
※選択式で正誤判断できること。
5問
統計、データ、情報、尺度、質的データ、量的データ
10
1、2
②分布と代表値
・度数分布表とヒストグラムの構造を理解している。
・平均値・中央値・最頻値の意味と違いを説明できる。
・分布の形と代表値の関係を理解している。
※選択式で正誤判断できること。
8問
度数分布表、ヒストグラム、平均、中央値、最頻値、分布の偏り
16
3、4、5、9
③散らばりの理解
・範囲・分散・標準偏差の意味を理解している。
・標準偏差を日常例(テスト・身長など)で説明できる。
・四分位数とIQRの意味を理解している。
・箱ひげ図から分布を読み取れる。
※選択式で正誤判断できること。
6問
範囲、分散、標準偏差、四分位数、IQR、箱ひげ図
12
10、11、12
④可視化の基礎
・棒グラフ・円グラフ・折れ線グラフの使い分けができる。
・ヒストグラムと箱ひげ図の役割の違いを理解している。
・グラフの見やすさに関する基本事項を理解している。
※選択式で正誤判断できること。
6問
棒グラフ、円グラフ、折れ線グラフ、可視化、軸、凡例
12
6、7、8
⑤クロス集計と比率
・クロス集計表の構造を理解している。
・行比率と列比率の違いを説明できる。
・比率を用いた比較の意義を理解している。
※選択式で正誤判断できること。
2問
クロス集計、行比率、列比率、割合、ピボットテーブル
4
13、14
⑥時系列データの理解
・増減率・指数の意味を理解している。
・基準化の意義を説明できる。
・移動平均の役割を理解している。
・季節変動・循環変動・不規則変動の区別ができる。
※選択式で正誤判断できること。
6問
増減率、指数、基準年、移動平均、季節変動、対数グラフ
12
15、16、17
⑦Pythonによるデータ処理
・pandasを用いてCSVを読み込める。
・mean、median、modeを計算できる。
・matplotlibで基本的なグラフを作成できる。
※コード選択式問題で正答できること。
5問
Python、pandas、DataFrame、matplotlib、mean、hist
10
18、19、20、21、22
⑧相関・回帰
・散布図から相関の方向を判断できる。
・相関係数rの意味を理解している。
・回帰直線の傾きを解釈できる。
・相関と因果の違いを説明できる。
※選択式で正誤判断できること。
8問
散布図、相関係数、回帰直線、擬相関、因果関係
16
24、25、26、27
⑨EDAと統合的理解
・EDAの目的を説明できる。
・代表値・分布・回帰を組み合わせて考察できる。
※選択式で正誤判断できること。
2問
EDA、統合的分析、多角的視点
4
28
⑩ストーリーテリングと妥当性判断
・事実のみを示すグラフと主張を伝えるグラフの違いを理解している。
・可視化と主張の妥当性を判断できる。
・良い可視化と悪い可視化を区別できる。
※選択式で正誤判断できること。
2問
折れ線グラフ、棒グラフ、データ範囲、グラフタイトル
4
29、30
評価方法
期末テスト
評価基準
評語
学習目標をほぼ完全に達成している・・・・・・・・・・・・・
S (100~90点)
学習目標を相応に達成している・・・・・・・・・・・・・・・
A (89~80点)
学習目標を相応に達成しているが不十分な点がある・・・・・・
B (79~70点)
学習目標の最低限は満たしている・・・・・・・・・・・・・・
C (69~60点)
学習目標の最低限を満たしていない・・・・・・・・・・・・・
D (60点未満)
教科書
参考文献
・深澤弘美、渡辺美智子「改訂版 日本統計学会公式認定 統計検定4級対応 データの活用」、東京都書、2019年 ・田栗正章ら「改訂版 日本統計学会公式認定 統計検定3級対応 データの分析」、東京都書、2020年
実験・実習・教材費