データ分析者のためのPythonデータビジュアライゼーション入門 コードと連動してわかる可視化手法(小久保 奈都弥)|翔泳社の本
  1. ホーム >
  2. 書籍 >
  3. データ分析者のためのPythonデータビジュアライゼーション入門 コードと連動してわかる可視化手法

データ分析者のためのPythonデータビジュアライゼーション入門 コードと連動してわかる可視化手法


形式:
書籍
発売日:
ISBN:
9784798163970
定価:
2,640(本体2,400円+税10%)
仕様:
B5変・224ページ
カテゴリ:
データサイエンス
キーワード:
#データ・データベース,#ネットワーク・サーバ・セキュリティ,#理工,#開発手法
シリーズ:
AI & TECHNOLOGY
紙の書籍

分析したデータを
わかりやすく
ビジュアライゼーションしよう!

【データビジュアライゼーションとは】
数値データ・位置のデータ・文章のデータ等を、
一目で分かりやすく見える形にする方法です。

【背景】
ビッグデータやAIという言葉が流行して以降、
様々な組織でデータを活用しようという動きがみられます。
データの活用のためには、私たち人間がデータの内容をよく理解する必要があり、
そのためにビジュアライゼーションはとても有効な手段です。
Pythonにはデータビジュアライゼーションに特化したライブラリがそろっており、
利用するデータ分析者も増えています。

一方で、
「どのような場合にどのライブラリで表現するとよいのか」
といった基本的な部分でつまづく方や、
「データの種類や特徴によってどのように表現するとより直観的に表現できるのか」
と悩んでいる方も多いのが実情です。

【書籍概要】
本書は、Pythonのライブラリを利用して、
分析したデータをビジュアライゼーションする手法を解説した書籍です。
ビジュアライゼーションする時に必要な考え方と、
基本的なビジュアライゼーション手法を解説。
地図上に表現する方法やワードクラウド、インフォグラフィック的な要素を
取り入れた手法も紹介します。

【対象読者】
・データ活用に興味のある方
・データ分析者
・データサイエンティスト

【本書で紹介する主な可視化手法】
縦棒・横棒グラフ
円グラフ
ヒストグラム
ボックスプロット
散布図
バブルチャート
ヒートマップ
ドーナツグラフ
レーダーチャート
地図情報
ワードクラウド
インフォグラフィック等

【著者プロフィール】
小久保 奈都弥(こくぼ・なつみ)
筑波大学第三学群社会工学類卒、
法政大学大学院イノベーションマネジメント研究科修了。
データ分析のコンサルティング会社で金融機関向けに
予測モデル構築業務やデータ分析業務に従事。
現在はコンサルティング会社に勤務するほか、
個人的にインフォメーションデザインや
データビジュアライゼーションの活動を行っている。
中小企業診断士
法政大学大学院特任講師

分析したデータをわかりやすく ビジュアライゼーションしよう!

分析したデータをわかりやすく ビジュアライゼーションしよう!

【データビジュアライゼーションとは】

数値データ・位置のデータ・文章のデータ等を、 一目で分かりやすく見える形にする方法です。


【背景】

ビッグデータやAIという言葉が流行して以降、 様々な組織でデータを活用しようという動きがみられます。 データの活用のためには、私たち人間がデータの内容をよく理解する必要があり、 そのためにビジュアライゼーションはとても有効な手段です。 Pythonにはデータビジュアライゼーションに特化したライブラリがそろっており、 利用するデータ分析者も増えています。 一方で、 「どのような場合にどのライブラリで表現するとよいのか」 といった基本的な部分でつまづく方や、 「データの種類や特徴によってどのように表現するとより直観的に表現できるのか」 と悩んでいる方も多いのが実情です。


【書籍概要】

本書は、Pythonのライブラリを利用して、 分析したデータをビジュアライゼーションする手法を解説した書籍です。 ビジュアライゼーションする時に必要な考え方と、 基本的なビジュアライゼーション手法を解説。 地図上に表現する方法やワードクラウド、インフォグラフィック的な要素を 取り入れた手法も紹介します。


【対象読者】

データ活用に興味のある方 ・データ分析者 /データサイエンティスト


【本書で紹介する主な可視化手法】

縦棒・横棒グラフ/円グラフ/ヒストグラム/ボックスプロット/散布図/バブルチャート/ヒートマップ/ドーナツグラフ/レーダーチャート/地図情報/ワードクラウド/インフォグラフィック等


※紙の書籍と電子書籍でレイアウトが異なります。

Chapter 1 データビジュアライゼーションとは
01|ビジュアライゼーションの定義
02|ビジュアライゼーションの歴史
03|身近なビジュアライゼーション
04|データビジュアライゼーションの機能と目的
05|意思決定におけるデータビジュアライゼーション
06|データビジュアライゼーションの意義
07|データビジュアライゼーションのステップ
08|静的なビジュアライゼーションと動的なビジュアライゼーション
09|Pythonでのデータ分析とビジュアライゼーション

Chapter 2 データビジュアライゼーションに必要な考え方
01|美しいビジュアライゼーションとは
02|データの種類とビジュアライゼーション表現
03|ビジュアライゼーションの構成要素
04|データの表現におけるゲシュタルトの法則
05|ビジュアライゼーションで注意すべきこと

Chapter 3 本書で使用する環境について
01|Anacondaのインストール
02|Jupyter Notebookの利用
03|ライブラリのインストール
04|本書で動作する環境のまとめ
05|仮想環境の構築(参考)

Chapter 4 Pythonでのデータ取り扱いの基本
01|データ処理で使用するライブラリ
02|ビジュアライゼーションで使用するライブラリ
03|Pythonで扱うデータ構造
04|基本的な操作
05|基本的な演算
06|データフレームを扱う

Chapter 5 様々なグラフ・チャートによるビジュアライゼーション
01|グラフやチャートで利用するライブラリ
02|ヒストグラム
03|ボックスプロット
04|散布図
05|バブルチャート
06|散布図行列
07|ジョイントプロット
08|質的変数のプロット
09|平行座標プロット
10|縦棒グラフ
11|横棒グラフ
12|円グラフ
13|ドーナツグラフ
14|折れ線グラフ
15|ヒートマップ
16|ウォーターフォールチャート
17|ツリーマップ
18|サンバーストチャート
19|レーダーチャート

Chapter 6 位置情報のビジュアライゼーション
01|位置情報のビジュアライゼーション
02|地図情報のビジュアライゼーションに用いるライブラリ
03|世界地図の色分けマップ
04|日本地図の色分けマップ
05|都道府県別の色分けマップ
06|地図のポイント情報を表示する
07|地図上に異なる大きさの円を描画する
08|地図上にヒートマップを描画する
09|マーカーのアイコンを変更する
10|2地点間を線で繋ぐ

Chapter 7 文字情報のビジュアライゼーション
01|ワードクラウドの描画
02|文字情報のビジュアライゼーションに用いるライブラリ
03|英語の文字情報のワードクラウド
04|日本語の文字情報のビジュアライゼーション
05|日本語のワードクラウド
06|ワードクラウドの形を変える
07|特定の文字の色を指定する

Chapter 8 インフォグラフィックのビジュアライゼーション
01|インフォグラフィックとは
02|ピクトグラム
03|画像を並べる際の表現方法
04|インフォグラフィックで用いるライブラリ
05|画像の大きさで数量を表現する
06|並べる個数で数量を表現する
07|割合を画像で表現する
08|縦棒グラフのように画像を並べる

Appendix データビジュアライゼーションにおけるカラーパレット
01|色の考え方
02|seabornのカラーパレット

付属データはこちら

会員特典はこちら

お問い合わせ

内容についてのお問い合わせは、正誤表、追加情報をご確認後に、お送りいただくようお願いいたします。

正誤表、追加情報に掲載されていない書籍内容へのお問い合わせや
その他書籍に関するお問い合わせは、書籍のお問い合わせフォームからお送りください。

利用許諾に関するお問い合わせ

本書の書影(表紙画像)をご利用になりたい場合は書影許諾申請フォームから申請をお願いいたします。
書影(表紙画像)以外のご利用については、こちらからお問い合わせください。

追加情報はありません。

ご購入いただいた書籍の種類を選択してください。

書籍の刷数を選択してください。

刷数は奥付(書籍の最終ページ)に記載されています。

現在表示されている正誤表の対象書籍

書籍の種類:

書籍の刷数:

本書に誤りまたは不十分な記述がありました。下記のとおり訂正し、お詫び申し上げます。

対象の書籍は正誤表がありません。

最終更新日:2022年06月07日
発生刷 ページ数 書籍改訂刷 電子書籍訂正 内容 登録日
1刷 092
「積み上げ縦棒グラフを描画する」の本文1~2行目
2刷
tip額の平均の集計を
tip額の合計集計を

※リフローEPUBの場合、Chapter 5の「10 縦棒グラフ」のリスト5.32のすぐ上の段落が該当箇所になります。
2020.10.01
1刷 097
リスト5.39の2行目と5行目、Outの図
2刷
2行目 name="tips" 5行目 name="total_bill" 全体(後半省略)
tips_mean = tips.groupby("day", as_index=False).mean()
fig = go.Figure(data=[go.Bar(name="tips",
                             x=tips_mean["day"],
                             y=tips_mean["total_bill"]),
                      go.Bar(name="total_bill",
(…略…)
Outの図
(画像クリックで拡大)
2行目 name="total_bill" 5行目 name="tips" 全体(後半省略)
tips_mean = tips.groupby("day", as_index=False).mean()
fig = go.Figure(data=[go.Bar(name="total_bill",
                             x=tips_mean["day"],
                             y=tips_mean["total_bill"]),
                      go.Bar(name="tips",
(…略…)
Outの図 ※右上の凡例が入れ替わります。
(画像クリックで拡大)
2022.06.07
1刷 104
リスト5.47の1行目
2刷
(…略:12行目までリスト5.45と同じ…)
(…略:12行目までリスト5.46と同じ…)
2021.03.01
1刷 105
リスト5.48 1行目
2刷
(…略:12行目までリスト5.45と同じ…)
(…略:12行目までリスト5.46と同じ…)
2021.03.01
1刷 113
リスト5.56のOutの図
2刷

(画像クリックで拡大)

(画像クリックで拡大)
2021.03.01
1刷 155
リスト6.14 上から7行目(7行目のmapの開始位置を5行目のboundsと同じにする)
2刷
# 図の描画
dx = 0.005
dy = 0.005
for index, row in df.iterrows():
     bounds = [[row["lat"] - dx, row["lon"] - dy],
                    [row["lat"] + dx, row["lon"] + dy]]
map.add_child(folium.raster_layers.ImageOverlay(MARKER_IMG, opacity=OPACITY,
(・・・略・・・)
# 図の描画
dx = 0.005
dy = 0.005
for index, row in df.iterrows():
     bounds = [[row["lat"] - dx, row["lon"] - dy],
                    [row["lat"] + dx, row["lon"] + dy]]
     map.add_child(folium.raster_layers.ImageOverlay(MARKER_IMG, opacity=OPACITY,
(・・・略・・・)

「map.add_child~」のインデントを「bounds =」の行と揃えます。

※リフローEPUBの場合、リスト6.14の末尾が該当箇所になります。
2020.08.24

感想・レビュー

エリナ松岡 さん

2021-10-01

最初に抽象論が少しあって、その後は色んなバリエーションのグラフをひたすら作るかんじです。グラフはきれいだし結構楽しくやれます。割とちょろいと思ってたら、中盤の棒グラフあたりから結構ややこしくなってきました。あまり設定について深い解説があるわけではないですが、むしろそれが良かったかもしれません。グラフに対する苦手意識を少し克服できたと思います。

P.N.平日友 さん

2020-12-05

この手の本は内容よりもダウンロードできるソースコードに価値があると確信した。サラッと読了後、業務で定例資料を作ったりするとき手元に置いて辞書用途で主に使っている。可視化はエクセルよりパイソンがメインになりつつある。速きしコードの可読性が優れているため。可視化入門はこれが初めてだけれど、この本で十分な気がしている。

さん

2021-09-19

主にmatplotlib/seabornの使い方の本。plotlyの知らないグラフ(parallel categories diagram )もあって面白かった。質的データの可視化もいくつか紹介されているので、一度写経して手元に置いておくのが良さそう。 いくつか、非推奨となっている書き方があったので利用時は注意。