| ISBN/价格: | 978-7-115-66984-1:CNY69.80 |
|---|---|
| 作品语种: | chi |
| 出版国别: | CN 110000 |
| 题名责任者项: | 大数据采集与清洗/.阮宗利编著 |
| 出版发行项: | 北京:,人民邮电出版社:,2025 |
| 载体形态项: | 286页:;+图:;+26cm |
| 丛编项: | 面向新工科数据科学与大数据技术从书 |
| 一般附注: | 人邮教育 |
| 提要文摘: | 本书共9章,分别是概述、网络爬虫基础、网页数据抓取、缓存下载页面、并发/并行爬取、用Selenium抓取动态内容、Scrapy爬虫框架及其应用、大数据平台系统日志采集、pandas数据清洗。本书总体上由数据采集(第2-8章)和数据清洗(第9章)两部分内容构成,以Python作为编程语言。数据采集部分以Web数据采集为主,也涉及Hadoop大数据平台的数据采集,内容由浅入深,循序渐进,理论与实践相结合,帮助读者理解和掌握数据采集的相关技术;数据清洗部分主要介绍pandas库的使用,帮助读者掌握数据清洗的方法。 |
| 并列题名: | Big data collection and cleaning eng |
| 题名主题: | 数据采集 |
| 中图分类: | TP274 |
| 个人名称等同: | 阮宗利 编著 |
| 记录来源: | CN RENTIAN 20251208 |