| ISBN/价格: | 978-7-115-54156-7:CNY109.00 |
|---|---|
| 作品语种: | chi eng |
| 出版国别: | CN 110000 |
| 题名责任者项: | 精通Spark数据科学/.(美) 安德鲁·摩根 ... [等] 著/.Andrew Morgan ...[等] 著/.柯晟劼, 刘少俊译 |
| 出版发行项: | 北京:,人民邮电出版社:,2020 |
| 载体形态项: | 430页:;+图:;+24cm |
| 提要文摘: | ApacheSpark是专为大规模数据处理而设计的快速通用的计算引擎。这是一本专门介绍Spark的图书, 旨在教会读者利用Spark构建实用的数据科学解决方案。本书内容包括14章, 由浅入深地介绍了数据科学生态系统、数据获取、输入格式与模式、探索性数据分析、利用Spark进行地理分析、采集基于链接的外部数据、构建社区、构建推荐系统、新闻词典和实时标记系统、故事除重和变迁、情感分析中的异常检测、趋势演算、数据保护和可扩展算法。本书适合数据科学家以及对数据科学、机器学习感兴趣的读者阅读, 需要读者具备数据科学相关的基础知识, 并通过阅读本书进一步提升Spark运用能力, 从而创建出高效且实用的数据科学解决方案。 |
| 题名主题: | 数据处理软件 |
| 中图分类: | TP274 |
| 个人名称等同: | 摩根 著 |
| 个人名称等同: | 阿门德 著 |
| 个人名称等同: | 乔治 著 |
| 个人名称次要: | 柯晟劼 译 |
| 个人名称次要: | 刘少俊 译 |
| 记录来源: | CN GuangHua 20210301 |