Scrapyで統計情報を記録する
Stats Collection
Scrapy provides a convenient facility for collecting stats in the form of key/values, where values are often counters. The facility is called the Stats Collector, and can be accessed through the stats attribute of the Crawler API, as illustrated by the examples in the Common Stats Collector uses section below.
統計情報は常に有効なので、Crawler APIの属性値を介してstats
にアクセスすることができる。
Spiderの中で統計情報を使う
公式チュートリアルのQuotesSpiderをカスタマイズして、統計情報を設定する。
SpiderはCrawlerを属性値として持つのでself.crawler.stats
でStats Collectionにアクセスできる。
操作はStats Collector APIで行う。
1 | import scrapy |
実行終了時に標準の統計情報の結果と共にSpiderの中で設定したcrawled_pages
とcrawled_items
が表示されている。
1 | 2020-05-18 XX:XX:XX [scrapy.core.engine] INFO: Closing spider (finished) |