Natural Language Processing in Action

Understanding, Analyzing, and Generating Text with Python

出版社 Manning Publications
発売日 2019/04/14
ページ数 544
ISBN-13 9781617294631
お届け日 通常 05月27日~06月03日

通常価格 ¥5,500

税込 配送料は購入手続き時に計算されます。

出版社より

Summary

Natural Language Processing in Action is your guide to creating machines that understand human language using the power of Python with its ecosystem of packages dedicated to NLP and AI.

Purchase of the print book includes a free eBook in PDF, Kindle, and ePub formats from Manning Publications.

About the Technology

Recent advances in deep learning empower applications to understand text and speech with extreme accuracy. The result? Chatbots that can imitate real people, meaningful resume-to-job matches, superb predictive search, and automatically generated document summaries–all at a low cost. New techniques, along with accessible tools like Keras and TensorFlow, make professional-quality NLP easier than ever before.

About the Book

Natural Language Processing in Action is your guide to building machines that can read and interpret human language. In it, you’ll use readily available Python packages to capture the meaning in text and react accordingly. The book expands traditional NLP approaches to include neural networks, modern deep learning algorithms, and generative techniques as you tackle real-world problems like extracting dates and names, composing text, and answering free-form questions.

What’s inside

  • Some sentences in this book were written by NLP! Can you guess which ones?
  • Working with Keras, TensorFlow, gensim, and scikit-learn
  • Rule-based and data-based NLP
  • Scalable pipelines

About the Reader

This book requires a basic understanding of deep learning and intermediate Python skills.

About the Author

Hobson Lane, Cole Howard, and Hannes Max Hapke are experienced NLP engineers who use these techniques in production.

Table of Contents

PART 1 - WORDY MACHINES

  1. Packets of thought (NLP overview)
  2. Build your vocabulary (word tokenization)
  3. Math with words (TF-IDF vectors)
  4. Finding meaning in word counts (semantic analysis)

PART 2 - DEEPER LEARNING (NEURAL NETWORKS)

  1. Baby steps with neural networks (perceptrons and backpropagation)
  2. Reasoning with word vectors (Word2vec)
  3. Getting words in order with convolutional neural networks (CNNs)
  4. Loopy (recurrent) neural networks (RNNs)
  5. Improving retention with long short-term memory networks
  6. Sequence-to-sequence models and attention

PART 3 - GETTING REAL (REAL-WORLD NLP CHALLENGES)

  1. Information extraction (named entity extraction and question answering)
  2. Getting chatty (dialog engines)
  3. Scaling up (optimization, parallelization, and batch processing)

DeepL粗訳

サマリー

Natural Language Processing in Action は、NLPとAIに特化したパッケージのエコシステムであるPythonのパワーを使って、人間の言語を理解する機械を作るためのガイドです。

印刷版の書籍を購入された方には、マニング出版社からPDF、Kindle、ePub形式の電子書籍が無料で提供されます。

技術について

最近のディープラーニングの進歩により、テキストや音声を非常に正確に理解できるようになりました。その結果 本物の人間を模倣できるチャットボット、意味のある履歴書と職務経歴書のマッチング、優れた予測検索、自動生成された文書要約など、すべてが低コストで実現できます。新しい技術と、KerasやTensorFlowのような利用しやすいツールにより、プロ品質のNLPをこれまで以上に簡単に実現しています。

この本について

Natural Language Processing in Action は、人間の言語を読んで解釈できる機械を構築するためのガイドです。この本では、すぐに利用できるPythonパッケージを使って、テキストの意味を捉え、それに応じて反応させることができます。この本では、従来の NLP のアプローチにニューラルネットワーク、最新のディープラーニングアルゴリズム、生成技術を加え、日付や名前の抽出、テキストの構成、自由形式の質問への回答などの実世界の問題に取り組むことができます。

中身は?

  • この本に書かれている文章の中には、NLPで書かれたものもあります! どの文章か当てられますか?
  • Keras, TensorFlow, gensim, そして scikit-learn を使った作業
  • ルールベースとデータベースのNLP
  • スケーラブルなパイプライン

読者について

本書では、ディープラーニングの基本的な理解とPythonの中級者向けのスキルが必要となります。

著者について

ホブソン・レーンコール・ハワードハネス・マックス・ハプケ は、これらの技術を本番で使用している経験豊富なNLPエンジニアです。

目次

PART 1 - WORDY MACHINES

  1. 思考のパケット(NLPの概要
  2. 語彙力をつける(単語のトークン化
  3. 単語を使った数学(TF-IDF ベクトル
  4. 単語数から意味を見つける(意味分析)

PART 2 - より深い学習(神経ネットワーク

  1. ニューラルネットワークを用いたベビーステップ(パーセプトロンとバックプロパゲーション
  2. 単語ベクトルを使った推論 (Word2vec)
  3. 畳み込みニューラルネットワーク(CNN)を用いて言葉を整列させる
  4. ルーピー(リカレント)ニューラルネットワーク(RNN
  5. 長期短期記憶ネットワークによる定着性の向上
  6. シーケンス間のモデルとアテンション

パート3 - GETTING REAL (REAL-WORLD NLP CHALLENGES)

  1. 情報抽出(名前付き実体抽出と質問回答
  2. おしゃべりになる (ダイアログエンジン)
  3. スケールアップ(最適化、並列化、バッチ処理