Python Web Scraping - macnux’s blog

このチュートリアルでは、PythonのWebスクレイピングと、Beautifulsoup、Selenium、PhantomJSのような他の魔法のツールなど、複数のPythonスクレイピングライブラリを使用してWebページをスクラップする方法について説明します。

静的Webページ、動的ページ（Ajax読み込みコンテンツ）、iframe、特定のHTML要素を取得する方法、Cookieを処理する方法などを学びます。

1 Python Web Scrapingとは何ですか？
2 Web Scrapingのメリット
3 Beautifulsoupをインストールする
4あなたの最初のWeb Scraper
4.1 HTTP例外の処理
4.2 URL例外の処理
5クラス属性を使用してHTMLタグをスクラップする
6 findAllを使用してHTMLタグを削り取る
Beautifulsoupを使ってn番目の子供を見つける
8 Regexを使ってタグを探す
9 JavaScriptのスクラップ
9.1 SeleniumでのChromeDriverの使用
10 Selenium Web Scraping
10.1 Selenium page_source
11 Seleniumを使ってiframeコンテンツを取得する
12 Beautifulsoupを使ってiframeコンテンツを取得する
13（Selenium + PhantomJS）を使用したAjaxコールの処理
14 PhantomJSを使用してAjaxコールの完了を待ちます
15クッキーの取り扱い
16 WebスクレイピングVS Webクロール

likegeeks.com

あなたがそれを好きだと思います。

ご多幸を祈る