現場で使える!NumPyデータ処理入門 機械学習・データサイエンスで役立つ高速処理手法 電子書籍(吉田 拓真 尾原 颯)|翔泳社の本
  1. ホーム >
  2. 電子書籍 >
  3. 現場で使える!NumPyデータ処理入門 機械学習・データサイエンスで役立つ高速処理手法

現場で使える!NumPyデータ処理入門 機械学習・データサイエンスで役立つ高速処理手法



形式:
電子書籍
発売日:
ISBN:
9784798155920
価格:
4,180(本体3,800円+税10%)
カテゴリ:
人工知能・機械学習
キーワード:
#プログラミング,#開発手法,#データ・データベース,#ビジネスIT
シリーズ:
AI & TECHNOLOGY
電子書籍
本書籍には新版があります
現場で使える!NumPyデータ処理入門 第2版 機械学習・データサイエンスで役立つ高速処理手法

機械学習・データサイエンスで役立つ高速処理手法

【本書の概要】
ビッグデータを扱う機械学習の現場では、Pythonの高機能で利用しやすい数学・科学系ライブラリが急速に広まってきています。
本書は、機械学習・データサイエンスの現場でよく利用されているNumPyの基本から始まり、
現場で使える実践的な高速データ処理手法について解説します。
特に、現場でよく扱う配列の処理に力点を置いています。
最終章では機械学習における実践的なデータ処理手法について解説します。

【NumPy(ナンパイ)とは】
NumPyは、機械学習・データサイエンスの現場で扱うことの多い多次元配列(行列やベクトル)を
処理する高水準の数学関数が充実しているライブラリです。
Python単体では遅い処理であっても、C言語なみに高速化できるケースもあり、
機械学習・データサイエンスの分野におけるデータ処理に欠かせないライブラリとなっています。

【対象読者】
機械学習エンジニア、データサイエンティスト

【著者紹介】
吉田拓真(よしだ・たくま)
データサイエンス関連のサービスを提供する株式会社Spot 代表取締役社長。
Webメディア『DeepAge』編集長。

尾原 颯(おはら・そう)
東京大学工学部機械工学科所属。
大学ではハードウェア寄りの勉強が多め。
趣味はアカペラとテニス。基本的に運動が好き。最近、ランニングを始める。

※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。
※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。
※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。
※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。

(翔泳社)

目次の登録はありません。

付属データはこちら

会員特典はこちら

お問い合わせ

内容についてのお問い合わせは、正誤表、追加情報をご確認後に、お送りいただくようお願いいたします。

正誤表、追加情報に掲載されていない書籍内容へのお問い合わせや
その他書籍に関するお問い合わせは、書籍のお問い合わせフォームからお送りください。

利用許諾に関するお問い合わせ

本書の書影(表紙画像)をご利用になりたい場合は書影許諾申請フォームから申請をお願いいたします。
書影(表紙画像)以外のご利用については、こちらからお問い合わせください。

追加情報はありません。
この商品の「よくある質問」はありません。

現在表示されている正誤表の対象書籍

書籍の種類:電子書籍

書籍の刷数:全刷


※重版をした際に、内容が修正されている場合があります。「刷数の確認方法(例)」の図を参考に、お手元の書籍の刷数をご確認ください。下の「書籍の刷数」の欄で刷数を選択すると、お持ちの書籍の刷数に合わせて、正誤情報を絞り込むことができます。

書籍によっては表記が異なる場合がございます


本書に誤りまたは不十分な記述がありました。下記のとおり訂正し、お詫び申し上げます。

対象の書籍は正誤表がありません。

 書籍の刷数で正誤情報を絞り込みたい場合は選択してください。

 書籍の種類:

最終更新日:2020年09月08日
ページ数 内容 書籍修正刷 電子書籍訂正 発生刷 登録日
0-ix
上から2行目
本書の対象読者と必要な事前知識について
本書の対象読者と必要な事前知識

※リフローEPUBの場合、「CONTENTS(目次)」の冒頭、2行目が該当箇所になります。
2刷 1刷 2018.11.19
019
上から5行目と20行目(空行含む)
b = [a] # リストに変換 ・・・(略)・・・ Not using NumPy 0.094761 sec
b = list(a) # リストに変換 ・・・(略)・・・ Not using NumPy 5.502100 sec

※リフローEPUBの場合、「1.1.4 NumPyチュートリアル」の5つ目の小見出し「●NumPyの高速演算」の1つ目のコード内、上から5行目(空行含む)、および最下行が該当箇所になります。
2刷 1刷 2019.04.17
025
参照先の項番号修正
1.2.5項「Memory Layout」
1.2.3項「Memory Layout」

※リフローEPUBの場合、「1.2.2 属性(attributes)」の最後から2つ目のコードの上にある段落(「次は.stridesです。」で始まる段落)が該当箇所になります。
2刷 1刷 2018.11.06
027,028
図1.1と図1.2の内容が逆、本文の修正
P.27 ----------------- ローメジャーでは低い次元から(axisの番号が小さい順)格納していき、カラムメジャーでは高い次元(axisの番号が大きい順)から格納していきます。 (・・略・・)  2次元でいくとローメジャー(order='C')では列方向から順に要素が格納されていきます。
P.28 -----------------  一方でカラムメジャー(order='F')では行方向から順に要素が格納されていきます( 図1.2 )。
 列方向は2次元においてはaxis=1、行方向はaxis=0となり、軸の番号は変わりはするものの同じ大小関係が成り立ちます。
P.27 ----------------- ローメジャーでは高い次元から(axisの番号大きい順)格納していき、カラムメジャーでは低い次元(axisの番号小さい順)から格納していきます。 (・・略・・)  2次元でいくとローメジャー(order='C')では方向から順に要素が格納されていきます。
P.28 -----------------  一方でカラムメジャー(order='F')では方向から順に要素が格納されていきます( 図1.2 )。
 列方向は2次元においてはaxis=0、行方向はaxis=1となり、軸の番号は変わりはするものの同じ大小関係が成り立ちます。

※リフローEPUBの場合、「1.2.3 Memory Layout」の1つ目のコードの下にある2つ目の段落、および数式の下の段落、さらに、図1.1と図1.2が該当箇所になります。
2刷 1刷 2018.11.29
071,275
ATTENTION
, dype=int64)
, dtype=int64)

※リフローEPUBの場合、CHAPTER 2、CHAPTER 3の章トビラにある「ATTENTION」の2行目が該当箇所になります。
2刷 1刷 2018.11.19
124
表2.19上の本文と表2.19のキャプション
・表2.19上の本文 numpy.ndarray.transposeには表2.19 の引数が用意されています。 ・表2.19のキャプション 表2.19 numpy.transposeの引数
・表2.19上の本文 np.sort には表2.19 の引数が用意されています。 ・表2.19のキャプション 表2.19 np.sortの引数
1刷 2020.09.04
161
表2.27(引数名:dtype、概要の内容)
(省略可能)初期値float。 生成する配列の要素のデータ型を指定する。デフォ ルトはfloat64となっている
(省略可能)初期値None。 生成する配列の要素のデータ型を指定する。デフォ ルトはaのデータ型を継承する
1刷 2020.09.08
168
表2.30 (引数名:stop、型の内容)
ntまたはfloat
intまたはfloat
1刷 2020.09.08
209
上から5行目
保存できる配列の次元は1次元まで
保存できる配列の次元は2次元まで

※リフローEPUBの場合、「2.19.3 np.loadtxtとnp.savetxtの特徴」の箇条書き、2つ目の項目が該当箇所になります。
2刷 1刷 2019.05.17
210
上から6~7行目
0を最初の行として、どの行を読み取るのかを指定する。デフォルトではすべての行を読み取る
0を最初の列として、どの列を読み取るのかを指定する。デフォルトではすべての列を読み取る

※リフローEPUBの場合、表2.36における「usecols」の「概要」欄が該当箇所になります。
2刷 1刷 2019.05.17
217
上から4行目、sample8→sample7
In [24]: np.savetxt('sample8.txt', a, fmt='%.3e',
In [24]: np.savetxt('sample7.txt', a, fmt='%.3e',

※リフローEPUBの場合、「2.19.5 np.savetxt」の8つ目の小見出し「●コメントアウトする文字列の変更」の青いコード枠内、1行目が該当箇所になります。
2刷 1刷 2019.05.17
241
脚注番号
*2
*3

※リフローEPUBの場合、「2.23.3 引数orderについて」の1つ目の小見出し「●2次元の配列を1次元化する」の本文1行目が該当箇所になります。
2刷 1刷 2018.11.19
254
下から6行目
n=1の時
n=2の時

※リフローEPUBの場合、「2.26.1 np.diff」の3つ目の小見出し「●引数nについて」における差分法の公式の下にある2つ目の段落(「配列xの差分を配列yに記録するとします。」で始まる段落)の2行目が該当箇所になります。
2刷 1刷 2019.05.17
255
6行目 MEMO内
例えば…はx2+2x+1と展開できます。ここでの係数は1、2、1となります。…できます
例えば…はx2-2x+1と展開できます。ここでの係数は1、-2、1となります。…できます。

※リフローEPUBの場合、「2.26.1 np.diff」の3つ目の小見出し「●引数nについて」における1つ目のMEMOが該当箇所になります。
2刷 1刷 2019.05.17
472
図4.24 左下のb2をb1に修正
b2
(画像クリックで拡大)
b1
2刷 1刷 2020.05.29
473
下から3行目
76万回行列演算
79万回行列演算

※リフローEPUBの場合、「4.6.3 誤差逆伝播法」の小見出し「●計算時間が短縮される理由」の2つ目の段落が該当箇所になります。
2刷 1刷 2020.05.29
479
MEMOの4行目
左上から0、1、2、3、4
左上から1、2、3、4

※リフローEPUBの場合、「.7.1 NumPyで実装する(MNIST)」のMEMO内、1つ目の段落が該当箇所になります。
2刷 1刷 2020.05.29
481
リスト4.6の上から14行目(空行含む)
# (N, 1000)
# (N, 100)

※リフローEPUBの場合、リスト4.6の13行目(空行含む)が該当箇所になります。
2刷 1刷 2020.05.29
484
コメントの修正
# 5回ごとにどれぐらい学習できているかを確かめる
# 100回ごとにどれぐらい学習できているかを確かめる

※リフローEPUBの場合、「4.7.3 学習を進める」の最初のコード枠内、8つ目のコメント行が該当箇所になります。
2刷 1刷 2020.05.29
494
下から12行目
after %f time steps
after %d time steps

※リフローEPUBの場合、リスト4.9における「#行動の選択」以下5行目(空行含む)のコードが該当箇所になります。
2刷 1刷 2020.05.29
502
コメント部分
epsilon = 0.5 * (0.99** episode) # もし0.2より一様乱数のほうが大きければ… if epsilon <= np.random.uniform(0, 1): (…略…) # 逆に言うと20%の確率でランダムな行動をとる next_action = np.random.choice([0, 1])
epsilon = 0.5 * (0.99** episode) if epsilon <= np.random.uniform(0, 1): (…略…) # そうでなければ20%の確率でランダムな行動をとる next_action = np.random.choice([0, 1])

※リフローEPUBの場合、リスト4.13の中ほど、「defget_action」で始まるブロックが該当箇所になります。
2刷 1刷 2020.05.29

感想・レビュー

tamioar さん

2019-11-14

これで入門編か。