Python2年生 スクレイピングのしくみ 体験してわかる!会話でまなべる! 電子書籍(森 巧尚)|翔泳社の本
  1. ホーム >
  2. 電子書籍 >
  3. Python2年生 スクレイピングのしくみ 体験してわかる!会話でまなべる!

Python2年生 スクレイピングのしくみ 体験してわかる!会話でまなべる!


形式:
電子書籍
発売日:
ISBN:
9784798164083
価格:
本体2,200円+税

本書籍の他の形式を確認する

  • このエントリーをはてなブックマークに追加

Pythonでスクレイピングを体験してみよう!

【スクレイピングとは】
機械学習やデータ分析になくてはならない「データ」。
このようなデータは、インターネット上に膨大にありますが、Pythonを使えば効率よくデータ収集できます。
こうした手法を「スクレイピング」といいます。
サイト自体もオープンデータ化が進んでおり、データを集めやすい環境が整ってきています。

【Python2年生について】
「Python2年生」シリーズは、「Python1年生」を読み終えた方を対象とした入門書です。
ある程度、技術的なことを盛り込み、本書で扱う技術について身に着けてもらいます。

【ターゲット】
・ネット上からデータ収集を行う初心者
・データ分析の手前の初心者

【本書の売り】
ヤギ博士&フタバちゃんと一緒に、インターネットからのファイルのダウンロード方法、
HTML解析の方法、いろいろなデータの読み書き、
APIの使い方といったデータ収集と便利なライブラリを利用した簡単な可視化手法を解説する書籍です。
また最終的にデータ収集を自動化する方法も簡単に解説します。

第1章 Pythonでデータをダウンロード
 LESSON 01 スクレイピングってなに?
 LESSON 02 Pythonをインストールしてみよう
 LESSON 03 requestsでアクセスしてみよう

第2章 HTMLを解析しよう
 LESSON 04 HTMLを解析してみよう
 LESSON 05 ニュースの最新記事一覧を取得してみよう
 LESSON 06 リンク一覧をファイルに書き出そう
 LESSON 07 画像を一括ダウンロードしよう

第3章 表データを読み書きしよう
 LESSON 08 pandasを使ってみよう
 LESSON 09 さまざまなデータの加工
 LESSON 10 グラフで表示してみよう
 LESSON 11 Excelファイルを読み書きしてみよう

第4章 オープンデータを分析してみよう
 LESSON 12 オープンデータってなに?
 LESSON 13 郵便局:郵便番号データ
 LESSON 14 e-Stat:政府統計の相互窓口
 LESSON 15 キッズすたっと:探そう統計データ
 LESSON 16 自治体のデータ:データシティ鯖江

第5章 Web APIでデータを収集しよう
 LESSON 17 Web APIってなに?
 LESSON 18 OpenWeatherMapってなに?
 LESSON 19 現在の天気を調べよう
 LESSON 20 現在から5日間(3時間ごと)の天気を調べよう

付属データはこちら

会員特典はこちら

書籍への問い合わせ

正誤表、追加情報をご確認の上、こちらよりお問い合わせください

書影の利用許諾について

本書籍に関する利用許諾申請はこちらになります

  • よくあるご質問

    ------------------------------
    Q:P.26 「2020年10月05日にリリースされたPython 3.9をインストールしたが外部ライブラリをインストールできない」
    A:Python 3.9が出たばかりで、多くの外部ライブラリがPython 3.9に対応していないことが原因です。
     この場合、バージョンをPython 3.8にしてください。

    【Windowsの場合】
    Python 3.9をアンインストールして、3.8をインストールしてください。
    具体的には、以下の通りです。

    □手順1
    「スタート」メニューをクリックして、「設定」(歯車のアイコンをクリックします。
    「アプリ」をクリックして、「アプリと機能」から「Python 3.9」をクリックし、「アンインストール」ボタンをクリックして、アンインストールしてください。

    □手順2
    以下のPython.orgサイトにアクセスして、Python 3.8.6の「Windows x86-64 executable installer」をダウンロードして実行してください。Python 3.8.6がインストールされます。

    ・Python 3.8.6のダウンロードサイト
    https://www.python.org/downloads/windows/

    □手順3
    ライブラリのインストールは、以下のコマンドでインストールできます。

    ------------
    pip install <ライブラリ名>
    ------------

    もしくは以下のコマンドでもインストール可能です。

    ------------
    py -m pip install <ライブラリ名>
    ------------

    【macOSの場合】
    macOSの場合は、Pythonのアンインストールが少し手間がかかります。
    そこでPython 3.8とPython 3.9の2つをインストールした状態でPython 3.8を使う方法を紹介します。

    □手順1
    以下のPython.orgサイトにアクセスして、Python 3.8.6の「macOS 64-bit installer」ダウンロードして実行してください。Python 3.8.6がインストールされます。

    ・Python 3.8.6のダウンロードサイト
    https://www.python.org/downloads/mac-osx/

    □手順2
    Pythonを起動させる時は、Python 3.8のフォルダの中のIDLEを起動させます。

    □手順3
    ライブラリのインストールは、以下のコマンドで実行します。Python 3.8を指定してインストールできます。

    ------------
    python3.8 -m pip install <ライブラリ名>
    ------------


    ------------------------------
    Q:P.92 「CSVファイルが文字化けする」
    A:書き出されたCSVファイルはUTF-8形式なので、Excelでそのまま開くと日本語が文字化けします。
    文字化けしないようにするには、Excelで新規ファイルを作り、CSVファイルを取り込みます。Excel 2019やExcel for Office 365の場合、Excelの「データ」タブをクリックして、リボンから「データの取得と変換」グループの「テキストファイルまたはCSVから」をクリックします。
    「データの取り込み」画面で取り込むCSVファイルを指定して、「インポート」をクリックします。
    取り込み方法を指定する画面が開くので、「元のファイル」で「65001:Unicode(UTF-8)」を選択して、「読み込み」をクリックしてください。

ご購入いただいた書籍の種類を選択してください。

書籍の刷数を選択してください。

刷数は奥付(書籍の最終ページ)に記載されています。

現在表示されている正誤表の対象書籍

書籍の種類:

書籍の刷数:

本書に誤りまたは不十分な記述がありました。下記のとおり訂正し、お詫び申し上げます。

対象の書籍は正誤表がありません。

最終更新日:2020年09月08日
発生刷 ページ数 書籍改訂刷 電子書籍訂正 内容 登録日
1刷 094
上から4行目と7行目
・Windowsの場合 pip install japanize_matplotlib ・macOSの場合 pip3 install japanize_matplotlib
・Windowsの場合 pip install japanize-matplotlib ・macOSの場合 pip3 install japanize-matplotlib
2020.09.08
1刷 101
chap3/chap3-17.pyの下から4行目のコメント
3刷
# 棒グラフを作って画像ファイル出力する
# 棒グラフを作って表示する
2020.04.02
1刷 102
chap3/chap3-18.pyの下から5行目のコメント
3刷
# 棒グラフを作って画像ファイル出力する
# 棒グラフを作って表示する
2020.04.02
1刷 125
一番上の図
2刷
2019.10.11