Pythonで動かして学ぶ!Kaggleデータ分析入門 電子書籍|翔泳社の本
  1. ホーム >
  2. 電子書籍 >
  3. Pythonで動かして学ぶ!Kaggleデータ分析入門

Pythonで動かして学ぶ!Kaggleデータ分析入門


形式:
電子書籍
発売日:
ISBN:
9784798165639
価格:
2,860(本体2,600円+税10%)
カテゴリ:
データサイエンス
キーワード:
#データ・データベース,#ネットワーク・サーバ・セキュリティ,#理工,#開発手法
シリーズ:
AI & TECHNOLOGY
電子書籍

世界最大のデータ分析コンペサイト
Kaggle(カグル)に挑戦して
データ分析の基礎知識を身に付けよう!

【本書の概要】
本書はこれからデータ分析をはじめたいと思っている方や、
Kaggleに興味のあるデータ分析の初心者に向けて、
Pythonの実際のコードとともに丁寧に解説した書籍です。
データ分析で必要な一般的な知識とともに、
Kaggleへチャレンジするフローや、
Kaggleの初心者向けコンペへの取り組み方を紹介します。
データ分析や機械学習の一端に触れ、
実際に課題を解決するプロセスを体感できます。

【本書の対象読者】
・データサイエンティストを目指す学生
・データ分析に興味はあるが、あまり経験や知見がないデータ分析の初学者の方

【本書のポイント】
Kaggleの初心者向けチュートリアル「Titanicコンペ」「House Pricesコンペ」について、
分析の準備から結果の考察、そして精度を上げるプロセスを
ステップバイステップでコードとともに、わかりやすく解説しています。

【本書より扱うコンペの特徴:本書より抜粋】
・Titanicコンペの特徴
乗客ごとに性別や年齢、乗船チケットクラスなどのデータが、
生存したか死亡したかのフラグとともに与えられています。
生死に影響する属性の傾向をデータから分析して、
生死がわからない(予測用に隠されている)乗客について、
生死結果を予測することが目的です。

・House Pricesコンペの特徴
与えられるデータは、住宅ごとの築年数、設備、広さ、エリア、ガレージに入る車の数など、
79個の説明変数および、目的変数としての物件価格を含みます。
1460戸の学習データが与えられ、そのデータをもとにモデルを作成し、
1459戸の家の価格を予測します。

【著者プロフィール】
篠田 裕之(しのだ・ひろゆき)
広告会社で、ビッグデータを活用したメディアソリューション開発を行う。
データ分析やデータビジュアライゼーションに関するセミナー登壇、執筆多数。

※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。
※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。
※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。
※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。

(翔泳社)

世界最大のデータ分析コンペサイト Kaggle(カグル)に挑戦して データ分析の基礎知識を身に付けよう!

世界最大のデータ分析コンペサイト Kaggle(カグル)に挑戦して データ分析の基礎知識を身に付けよう!

【本書の概要】

本書はこれからデータ分析をはじめたいと思っている方や、Kaggleに興味のあるデータ分析の初心者に向けて、Pythonの実際のコードとともに丁寧に解説した書籍です。 データ分析で必要な一般的な知識とともに、Kaggleへチャレンジするフローや、Kaggleの初心者向けコンペへの取り組み方を紹介します。データ分析や機械学習の一端に触れ、実際に課題を解決するプロセスを体感できます。

【本書の対象読者】

  • データサイエンティストを目指す学生
  • データ分析に興味はあるが、あまり経験や知見がないデータ分析の初学者の方

【本書のポイント】

Kaggleの初心者向けチュートリアル「Titanicコンペ」「House Pricesコンペ」について、分析の準備から結果の考察、そして精度を上げるプロセスをステップバイステップでコードとともに、わかりやすく解説しています。


【本書より扱うコンペの特徴:本書より抜粋】

・Titanicコンペの特徴

乗客ごとに性別や年齢、乗船チケットクラスなどのデータが、生存したか死亡したかのフラグとともに与えられています。生死に影響する属性の傾向をデータから分析して、生死がわからない(予測用に隠されている)乗客について、生死結果を予測することが目的です。

・House Pricesコンペの特徴

与えられるデータは、住宅ごとの築年数、設備、広さ、エリア、ガレージに入る車の数など、79個の説明変数および、目的変数としての物件売値を含みます。1460戸の学習データが与えられ、そのデータをもとにモデルを作成し、1459戸の家の売値を予測します。


【著者プロフィール】

篠田 裕之(しのだ・ひろゆき)

広告会社で、ビッグデータを活用したメディアソリューション開発を行う。データ分析やデータビジュアライゼーションに関するセミナー登壇、執筆多数。


※紙の書籍と電子書籍でレイアウトが異なります。

目次の登録はありません。

付属データはこちら

会員特典はこちら

お問い合わせ

内容についてのお問い合わせは、正誤表、追加情報をご確認後に、お送りいただくようお願いいたします。

正誤表、追加情報に掲載されていない書籍内容へのお問い合わせや
その他書籍に関するお問い合わせは、書籍のお問い合わせフォームからお送りください。

利用許諾に関するお問い合わせ

本書の書影(表紙画像)をご利用になりたい場合は書影許諾申請フォームから申請をお願いいたします。
書影(表紙画像)以外のご利用については、こちらからお問い合わせください。

  • P.101 リスト3.24について

    本書のP.93にも記載していますが、
    最新のmatplotlibのバージョンの場合、リスト3.24でエラーが表示される場合があります。
    その場合、[["Age"]]を["Age"]に修正の上、実行してください。

    ------------------
    plt.hist((train_df[train_df['Survived']==0]['Age'].values,
    train_df[train_df['Survived']==1]['Age'].values),
    histtype='barstacked', bins=8, label=('Death', 'Survive'))
    ------------------

ご購入いただいた書籍の種類を選択してください。

書籍の刷数を選択してください。

刷数は奥付(書籍の最終ページ)に記載されています。

現在表示されている正誤表の対象書籍

書籍の種類:

書籍の刷数:

本書に誤りまたは不十分な記述がありました。下記のとおり訂正し、お詫び申し上げます。

対象の書籍は正誤表がありません。

最終更新日:2024年01月05日
発生刷 ページ数 書籍改訂刷 電子書籍訂正 内容 登録日
1刷 098,099
本文、リスト3.22 In
・本文 survived_rateという変数 ・リスト3.22のキャプション 新たにsurvived_rateという変数 ・リスト3.22 In "survived_rate"
・本文 death_rateという変数 ・リスト3.22のキャプション 新たにdeath_rateという変数 ・リスト3.22 In "death_rate"
2024.01.05
1刷 099
リスト3.22 Out
survived_rate
death_rate
2024.01.05
1刷 137
リスト3.63 下から2行目
"andom_seed":1234
"random_seed":1234
2021.10.01
1刷 143
下から3行目
「Input」ファルダに出力されます
「Output」ファルダに出力されます
2020.10.14
1刷 269
下から7行目以降
・クラスタ0は昔の古い家だが最近リフォームしており全体的なクオリティは平均よりやや高い住宅群 ・クラスタ1は最近建てられた家だが狭く全体的なクオリティも低い低価格な住宅群 ・クラスタ2は平均的な住宅群 ・クラスタ3は昔の古い住宅だが、キッチン以外は全体的にクオリティが高い上に広く、高価格な住宅群
・クラスタ0は新しい家で全体的なクオリティは平均よりやや高い住宅群 ・クラスタ1は古い家で狭く全体的なクオリティも低い低価格な住宅群 ・クラスタ2は平均的な住宅群 ・クラスタ3は新しい住宅で、キッチン以外は全体的にクオリティが高い上に広く、高価格な住宅群
2022.02.15

感想・レビュー

P.N.平日友 さん

2020-12-07

kaggleってどんなものか気になりざっと読了。環境構築の章があるので初めてでも土俵にあがれる。ただパイソンの知識がある程度必要。どんなふうに分析するのか概要がわかりコンペに参加するイメージがわいた。いろんな人のコードや知見を見ることができるのはなんと励みになることなのだろうか。早速タイタニック号の分析から始めて見ようと思う。

toji さん

2021-04-22

環境設定の方法から、課題提出までの過程を丁寧に書いてくれているので、そろそろ挑戦してみようと考えているものにとってはありがたい。また、課題にはないが、実業務で求められる分析(タイタニックの乗客の傾向分析など)も盛り込まれていて参考になった。