■■第12章【12_3】内、「抜き出す部分の目星をつける」以降の内容について
本書刊行後、Python Bootcamp のホームページ( https://www.pycon.jp/support/bootcamp.html )の内容が変更され、2023年12月時点で本書の記載内容にも影響が出ていることを確認しています。
主な変更点は以下の3点です。
◆変更点1. tableタグのclassからcolwidths-givenがなくなった
=========================================================
変更前
変更後
=========================================================
このため、p. 216以降(図「開発者ツールで該当HTMLを探っている」以降)の本文中や実行結果の該当部分は、次のように読み替えて進めてください。
colwidths-given docutils align-default
↓
docutils align-default
参考までに、開発者ツールでtableタグ以外の HTML に該当する部分を探している様子(0:12 ~ 0:30 でポインタで該当箇所を行き来しています)のキャプチャの動画を以下のリンクにアップロードしたので、ご確認ください。
https://i.imgur.com/zyYwj2R.mp4
◆変更点2. p. 216 に記載しているHTML(図「開発者ツールで該当HTMLを探っている」の後に記載しているHTML)の内容が変更されている
該当のHTMLは、2023年12月時点では次のような内容になっています(書籍における最初の中略部分も載せています)。
=========================================================
=========================================================
◆変更点3. Python Bootcampの「開催実績」に本書刊行後の内容が追加されている
「44 Python Boot Camp in 山口」以降の内容は、本書刊行後の開催実績です。
今後の開催状況によっては、さらに追加されるものと思われます。
上記の変更内容は、【12_3】内の「実行結果」に多少影響しますが、紹介しているプログラム自体は問題なく動作します。
必要な要素を絞り込んでいく過程にも特に影響しません。
2023年12月時点で、プログラムの実行結果が書籍記載の内容と明確に違うのは、下記となります。
◆p. 219の最初のプログラム(「抜き出す部分の目星をつける」内、2つ目のプログラム)
インタラクティブシェル
tables = soup.find_all("table", class_="docutils")
len(tables)
↓
実行結果
>>> tables = soup.find_all("table", class_="docutils")
>>> len(tables)
4
※本書では「2」です。
この違いも、時間の経過とともにPython Boot Campのホームページ側に変更が入ったことによるものです。
適宜読み替えて、学習を進めてみてください。