データサイエンス実践B(2022年度 第2ターム)

第1講 記述統計の復習

手元にすべてのデータがあり、そのデータの特徴を簡単に表す(より少ない情報で比較する、あるいは人に伝える)ための統計学

代表的な統計量(全データが既知なので、正確に計算可能)

統計学がうまく行く理由(つまるところ、)

サイコロ実験

平均値のバラつきのサンプルサイズ依存性

中心極限定理

サイコロをsample_num回振って、その和を求める試行(=1試行)を、repeat回繰り返す
一様分布から正規分布へ

仮説・検定のココロ

今手元にある標本が、ある母数を持つ母集団から得られたもの(無作為抽出されたもの)であると考えることが妥当か否か?