Pythonで学ぶあたらしい統計学の教科書(馬場 真哉)|翔泳社の本
  1. ホーム >
  2. 書籍 >
  3. Pythonで学ぶあたらしい統計学の教科書

Pythonで学ぶあたらしい統計学の教科書


形式:
書籍
発売日:
ISBN:
9784798155067
定価:
3,300(本体3,000円+税10%)
仕様:
A5・456ページ
分類:
数学・統計
シリーズ:
AI & TECHNOLOGY

本書籍の他の形式を確認する

  • このエントリーをはてなブックマークに追加

基礎理論を飛ばさない!
推定・検定から統計モデル・機械学習へ!

本書は統計学の理論をゼロから学べる教科書です。
IoTやビッグデータの発展によりさまざまなデータが社会にあふれ、
全てのデータを確認するのは難しくなってきています。
多くのデータから価値があるデータを作成するには統計学の知識が必須です。

【本書のポイント】
本書は統計学をはじめて勉強するかたでも、
読み進めていけるように、以下の3点を重点的に解説しています。
・データをどのように分析するのか
・なぜそのように分析するのが良いことなのか
・Pythonを使ってどのように分析するのか

【統計学を勉強するためのツールについて】
この書籍では、学習していく際のツールに、プログラミング言語のPythonを使用します。
PythonはExcelやRより自由度が高く、機械学習に多く利用されているので幅広い層から注目集めています。
Pythonに馴染むことにより、機械学習を利用したデータ分析者になるための基礎的な技術も身に付けられます。

【本書の構成】
本書は全7部構成になっています。
それぞれの部で次のようなことを解説しています。
第1部では統計学の基本を解説しています。
第2部でPythonの基本やJupyter Notebookの使い方を説明します。
第3部でPythonを用いた統計分析の方法を学びます。
第4部からは統計モデルについて学んでいきます。
第5部では正規線形モデルを解説します。
第6部それを発展させた一般化線形モデルについて解説します。
第7部は、統計学から機械学習へのつながりを学びます。

統計学やPythonのことを何も知らない方にもオススメの一冊です。


本書について

本書は統計の基礎をPythonを使いながら学んでいく教科書です。
ゼロから統計を学んでいくので誰でも入門することができます。
サンプルはわかりやすさを重視し、釣りや魚の体長などの身近な例で説明しています。
統計を学んでビジネスにいかしたい方、データ分析者として活躍をしたい方などにオススメの1冊です。

第1部 統計学の基本
第1章 統計学
第2章 標本が得られるプロセス
第3章 標本が得られるプロセスの抽象化
第4章 記述統計の基礎
第5章 母集団分布の推定
第6章 確率質量関数と確率密度関数
第7章 統計量の計算
第8章 確率論の基本
第9章 確率変数と確率分布

第2部 PythonとJupyter Notebookの基本
第1章 環境構築
第2章 Jupyter Notebookの基本
第3章 Pythonによるプログラミングの基本
第4章 numpy・pandasの基本

第3部 Pythonによるデータ分析
第1章 Pythonによる記述統計:1変量データ編
第2章 Pythonによる記述統計:多変量データ編
第3章 matplotlib・seabornによるデータの可視化
第4章 母集団からの標本抽出シミュレーション
第5章 標本の統計量の性質
第6章 正規分布とその応用
第7章 推定
第8章 統計的仮説検定
第9章 平均値の差の検定
第10章 分割表の検定
第11章 検定の結果の解釈

第4部 統計モデルの基本
第1章 統計モデル
第2章 統計モデルの作り方
第3章 データの表現とモデルの名称
第4章 パラメタ推定:尤度の最大化
第5章 パラメタ推定:損失の最小化
第6章 予測精度の評価と変数選択

第5部 正規線形モデル
第1章 連続型の説明変数を1つ持つモデル(単回帰)
第2章 分散分析
第3章 複数の説明変数を持つモデル

第6部 一般化線形モデル
第1章 さまざまな確率分布
第2章 一般化線形モデルの基本
第3章 ロジスティック回帰
第4章 一般化線形モデルの評価
第5章 ポアソン回帰

第7部 統計学と機械学習
第1章 機械学習の基本
第3章 PythonによるRidge回帰・Lasso回帰
第4章 線形モデルとニューラルネットワーク
第5章 この本の次に学ぶこと

付属データはこちら

書籍への問い合わせ

正誤表、追加情報をご確認の上、こちらよりお問い合わせください

書影の利用許諾について

本書籍に関する利用許諾申請はこちらになります

  • 106ページ「%precision 3」の実行について

    numpyのバージョンが上がったことにより、表示設定が変更されました。
    「%precision 3」としたとき、出力がスカラー(単一の数値)ではない場合、表示される桁数が3桁になります。
    出力がスカラーのときは、3桁になりません。
    新しいバージョンのライブラリを使う際は注意してください。
    なお、表示桁数が変わるだけで、計算の結果には影響ありません。

    ※上記結果は、numpyのバージョン1.16.4で確認しました。

  • 107ページ「sp.sum(fish_data)」の実行について

    ライブラリのバージョンが上がったことにより、scipyの一部関数の使用が非推奨(今後は使用不可となる可能性が高い)となりました。
    そのため、例えば「sp.sum(fish_data)」と実行すると
    「DeprecationWarning: scipy.sum is deprecated and will be removed in SciPy 2.0.0, use numpy.sum instead sp.sum(fish_data)」
    などとワーニングが出力されることがあります。
    ワーニングが出た場合は「sp.○○」とあるコードを「np.○○」に書き換えて実行してください。
    108ページ以降も同様となります。新しいバージョンのライブラリを使う際は注意してください。

    ※上記結果は、numpyのバージョン1.16.4、scipyのバージョン1.4.1で確認しました。

ご購入いただいた書籍の種類を選択してください。

書籍の刷数を選択してください。

刷数は奥付(書籍の最終ページ)に記載されています。

現在表示されている正誤表の対象書籍

書籍の種類:

書籍の刷数:

本書に誤りまたは不十分な記述がありました。下記のとおり訂正し、お詫び申し上げます。

対象の書籍は正誤表がありません。

最終更新日:2020年05月27日
発生刷 ページ数 書籍改訂刷 電子書籍訂正 内容 登録日
1刷 v
余白に追加
2刷
本書のサンプルファイルについて   サンプルファイルのダウンロード先  本書で使用するサンプルファイルは、下記のサイトからダウンロードできます。適宜必要なファイルをご使用のパソコンのハードディスクにコピーしてお使いください。   ・サンプルプログラムのダウンロードサイト  URL:https://www.shoeisha.co.jp/book/detail/9784798155067   免責事項について サンプルファイルは、通常の運用において何ら問題ないことを編集部および著者は認識していますが、運用の結果、万一いかなる損害が発生したとしても、著者及び株式会社翔泳社はいかなる責任も負いません。すべて自己責任においてお使いください。

本書のサンプルファイルについての記述を追加。
2018.05.29
1刷 038
上から11行目
2刷
2.2 母集団単純ランダムサンプリングによって
2.2 母集団から単純ランダムサンプリングによって

※リフローEPUBの場合、第1部第6章「6-11 まとめ:統計学の基本」の箇条書きが該当箇所になります。
2018.04.19
1刷 057
下から3行目
2刷
これはP(A|B)=P(B)と同じ意味です。
これはP(A|B)=P(A)と同じ意味です。

※リフローEPUBの場合、第1部第8章「8-20 用語 独立」が該当箇所になります。
2018.05.02
1刷 124
式(3-8)
4刷

※リフローEPUBの場合、第3部、第2章が該当箇所になります。
2020.05.27
1刷 126
式(3-10)
4刷

※リフローEPUBの場合、第3部第2章「2-12 用語 相関行列」が該当箇所になります。
2020.05.27
1刷 132
「3-4 実装 seaborn+pyplotによる折れ線グラフ」 の上から1行目
4刷
次は、seabornをインポートしてからヒストグラムを描きます。
次は、seabornをインポートしてから折れ線グラフを描きます。

※リフローEPUBの場合、第3部第3章が該当箇所になります。
2020.05.27
1刷 175
上から12行目
3刷
対数の弱法則と対数の強法則
大数の弱法則と大数の強法則

※リフローEPUBの場合、第3部第5章「5-18 補足 大数の法則」が該当箇所になります。
2018.06.18
1刷 186
本文1行目
2刷
シミュレーションの結果はs_mean_arrayという変数に
シミュレーションの結果はt_value_arrayという変数に

※リフローEPUBの場合、第3部第6章「6-10 t値の標本分布」の番号付き箇条書きの下の段落が該当箇所になります。
2018.04.23
1刷 193
下から2行目
2刷
「(標本平均-母平均)+ 標準誤差」
「(標本平均-母平均)÷ 標準誤差」

※リフローEPUBの場合、第3部第7章「7-8 信頼区間の計算方法」の最初の段落が該当箇所になります。
2018.04.19
1刷 194
下から7行目コード中
2刷
se = sigma / sp.sqrt(len(fish)) se
sigma = sp.std(fish, ddof = 1) se = sigma / sp.sqrt(len(fish)) se

※リフローEPUBの場合、第3部第7章「7-9 実装 区間推定」の2つ目のコードが該当箇所になります。
2018.04.23
1刷 210
下から6行目
2刷
stats.normに指定する平均値を50とすることでシミュレーションをして50000回t値を計算します。
シミュレーションをして50000回t値を計算します。

「stats.normに指定する平均値を50とすることで」という文言を下から2行目へ移動。
※リフローEPUBの場合、第3部第8章「8-16 シミュレーションによるp値の計算」の1つ目のコードの下の段落が該当箇所になります。
2018.04.23
1刷 210
本文下から1行目
2刷
帰無仮説が正しいと仮定して、50000回、標本抽出~t値計算を繰り返します。
stats.normに指定する平均値を50とすることで帰無仮説が正しいと仮定して、50000回、標本抽出~t値計算を繰り返します。

※リフローEPUBの場合、第3部第8章「8-16 シミュレーションによるp値の計算」の2つ目のコードの下の段落が該当箇所になります。
2018.04.23
1刷 222
下から3~4行目
3刷
赤いボタン250人 青いボタン50人
青いボタン250人 赤いボタン50人

※リフローEPUBの場合、第3部第10章「10-3 期待度数を求める」の3つ目の段落が該当箇所になります。
2018.06.18
1刷 223
上から2~3行目
4刷
赤いボタンを押す人25人 青いボタンを押す人5人
赤いボタンを押す人5人 青いボタンを押す人25人

※リフローEPUBの場合、第3部第10章「10-3 期待度数を求める」の4つ目の段落が該当箇所になります。
2018.11.09
1刷 317
2つ目のコードの9行目
4刷
# 残差の大きさ
# 残差の分散の大きさ

※リフローEPUBの場合、第5部2章「2-19 回帰モデルにおける分散分析」の3つ目のコードが該当箇所になります。
2020.05.27

感想・レビュー

MATSUDA, Shougo さん

2019-04-27

良書。その一言に尽きる。Python実習の面でも統計学をしっかり学べる点でもこれは習得まで何度も部分読み返しして助けてもらうこととなりそうです。

roughfractus02 さん

2018-07-23

個別的なテーマよりも書物の流れに沿ったステップアップを重視している。統計学とPythonの基礎的な説明から、数式の解説を経て、統計学のPython実装に至るラインがすっきりして感じられる構成だ。データ集計、標本分布、scipyを使用した区間推定と仮説検定を扱い、線形モデルの概要を説明する第3部、第4部があることで、statsmodelsを使った一般線形モデルの構築が辿りやすい(Seabornを使ったグラフ描画がきれいだ)。最後の第7部に機械学習と統計学の関連性の概説がある。ベイズ統計に関しての言及はない。

monotony さん

2021-10-27

統計検定の学習のお供に、毎日少しづつ写経を進めてようやく一巡。後半はほぼ素読状態・・・。次はオリジナルのデータで色々試してみたいかな。