Pythonで動かして学ぶ 自然言語処理入門 電子書籍|翔泳社の本
  1. ホーム >
  2. 電子書籍 >
  3. Pythonで動かして学ぶ 自然言語処理入門

Pythonで動かして学ぶ 自然言語処理入門



形式:
電子書籍
発売日:
ISBN:
9784798160962
価格:
本体3,200円+税

本書籍の他の形式を確認する

  • このエントリーをはてなブックマークに追加

本書は、Pythonでプログラミングをした経験のある読者が、
各種オープンソースソフトウェア(OSS)やライブラリを利用して、
自然言語処理を行うWebアプリケーションを作って動かし、 自然言語処理を体験するための書籍です。

またその中で、自然言語処理に関連するさまざまな概念や手法、
簡単な理論についても学ぶことができ、本格的な学習の
前段階としても最適です。

本書の構成としては大きく2つの部に分かれており、
それぞれ以下のような内容を解説しています。

第1部:データの準備
●テキストデータの収集
●データベースへの格納
●検索エンジンへの登録

第2部:データの解析
●文法構造を調べる
●意味づけ
●知識データとの連係

全13章を順に追いながらWebアプリケーションを作っていくことで、
自然言語処理に関連するさまざまなテーマを学ぶことができます。

※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。
※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。
※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。
※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。

(翔泳社)

目次の登録はありません。

付属データはこちら

書籍への問い合わせ

正誤表、追加情報をご確認の上、こちらよりお問い合わせください

書影の利用許諾について

本書籍に関する利用許諾申請はこちらになります

追加情報はありません。

ご購入いただいた書籍の種類を選択してください。

書籍の刷数を選択してください。

刷数は奥付(書籍の最終ページ)に記載されています。

現在表示されている正誤表の対象書籍

書籍の種類:

書籍の刷数:

本書に誤りまたは不十分な記述がありました。下記のとおり訂正し、お詫び申し上げます。

対象の書籍は正誤表がありません。

最終更新日:2019年02月12日
発生刷 ページ数 書籍改訂刷 電子書籍訂正 内容 登録日
1刷 027
リスト2.3 最下行
2刷
print('[block]':, block.text)
print('[block]:', block.text)
2019.01.28
1刷 029
リスト2.4
2刷
import re import unicodedata text = ' CLEANS ing によりテキストデータを変換すると トラブルが少なくなります。' print("Before:", text) text = unicodedata.normalize('NFKC', text) text = re.sub(r'\s+', '', text) print("After:", text)
import re import unicodedata text = ' CLEANS ing によりテキストデータを変換すると トラブルが少なくなります。' print("Before:", text) translation_table = str.maketrans(dict(zip('()!', '()!'))) text = unicodedata.normalize('NFKC', text).translate(translation_table)←❶ text = re.sub(r'\s+', '', text) print("After:", text)
2019.01.28
1刷 029
リスト2.5
2刷
import re import unicodedata from bs4 import BeautifulSoup def cleanse(text): text = unicodedata.normalize('NFKC', text) text = re.sub(r'\s+', ' ', text) (以下略)
import re import unicodedata from bs4 import BeautifulSoup translation_table = str.maketrans(dict(zip('()!', '()!'))) def cleanse(text): text = unicodedata.normalize('NFKC', text).translate(translation_table) text = re.sub(r'\s+', ' ', text) (以下略)
2019.01.28
1刷 029
「2.5 データ収集のプログラム」直前の段落
2刷
これにより、例えば半角カタカナは全角カタカナへ、全角英字は半角英字へ、全角空白記号は半角空白記号へ正規化されます。
これにより、例えば半角カタカナは全角カタカナへ、全角英字は半角英字へ、多くの全角記号は半角記号へ、全角空白記号は半角空白記号へ正規化されます。ただし、CaboChaの入力は全角記号を前提としているため、丸括弧と「!」を全角記号に戻しておきます。
2019.01.29
1刷 262
ソースコード
2刷
2019.02.12
1刷 263
ソースコード
2刷
2019.02.12
1刷 263
本文7行目
2刷
「英語」「版」「()」の行のラベルを
「英語」「版」「)」「(」の行のラベルを
2019.01.31