ISBN/价格: | 978-7-300-29059-1:CNY49.00 |
---|---|
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | 数据科学并行计算/.白琰冰编著 |
出版发行项: | 北京:,中国人民大学出版社:,2021 |
载体形态项: | 275页:;+图:;+26cm |
丛编项: | 数据科学与大数据技术丛书 |
提要文摘: | 本书的特色在于: 注重对大数据科学方法核心应用的讲解, 突出以并行计算思维解决大数据场景问题的案例教学。基于典型大数据场景案例数据集, 循序渐进地引导读者利用Parallel、Sparklyr、Dask和PySpark等主流并行计算工具实现数据的清洗、转换、描述和建模分析。帮助读者系统全面地构建数据科学的基本知识体系, 领会数据并行计算方法的精髓, 掌握不同编程语言和并行计算工具针对不同规模数据集的优缺点, 能够利用并行计算工具解决实际的数据分析问题。 |
并列题名: | Parallel computing in data science eng |
题名主题: | 数据处理 研究 |
中图分类: | TP274 |
个人名称等同: | 白琰冰 编著 |
记录来源: | CN SDL 20220305 |