| ISBN/价格: | 978-7-121-39406-5:CNY79.00 |
|---|---|
| 作品语种: | chi |
| 出版国别: | CN 110000 |
| 题名责任者项: | Python 3网络爬虫宝典/.韦世东著 |
| 出版发行项: | 北京:,电子工业出版社:,2020 |
| 载体形态项: | x, 262页:;+图:;+24cm |
| 提要文摘: | Python3是当前市面上极受欢迎的人工智能和网络爬虫语言。本书介绍了爬虫方面更深入的知识。书中首先回顾了爬虫的基础知识; 然后详细介绍爬虫常用工具与库的相关知识; 接着学习Redis, 为后面的学习打下基础; 然后讨论了Redis在分布式爬虫中的作用以及分布式爬虫的原理、分类与实现方法; 再进一步学习增量爬取的原理与实现方法; 然后通过学习网页文本抽取方法和智能抽取方法实现了大规模、多网站的数据爬取; 在部署方面通过了解、剖析成熟稳定的爬虫部署平台Scrapyd, 并根据实际业务需求重新构建了一套兼容性更强的爬虫部署平台; 最后学习了Python中常用的几个任务调度库与框架, 通过了解Celery逻辑与结构, 我们掌握了调度相关的知识, 并根据实际业务需求构建了一套支持动态任务增删的任务调度平台。 |
| 题名主题: | 软件工具 程序设计 |
| 中图分类: | TP311.561 |
| 个人名称等同: | 韦世东 著 |
| 记录来源: | CN GuangHua 20210301 |