题名:
Python和PySpark数据分析   [ 专著] python he pyspark shu ju fen xi / (加)乔纳森·里乌著 , 殷海英译
ISBN:
978-7-302-64536-8 价格: CNY118.00
语种:
chi
载体形态:
402页 图 24cm
出版发行:
出版地: 北京 出版社: 清华大学出版社 出版日期: 2023
内容提要:
Spark数据处理引擎是一个惊人的分析工厂:输入原始数据,输出洞察。PySpark用基于Python的API封装了Spark的核心引擎。它有助于简化Spark陡峭的学习曲线,并使这个强大的工具可供任何在Python数据生态系统中工作的人使用。《Python和PySpark数据分析》帮助你使用PySpark解决数据科学的日常挑战。你将学习如何跨多台机器扩展处理能力,同时从任何来源(无论是Hadoop集群、云数据存储还是本地数据文件)获取数据。一旦掌握了基础知识,就可以通过构建机器学习管道,并配合Python、pandas和PySpark代码,探索PySpark的全面多功能特性。 
主题词:
软件工具   程序设计
主题词:
数据处理  
中图分类法:
TP311.56 版次: 5
中图分类法:
TP274 版次: 5
主要责任者:
里乌 li wu 著
次要责任者:
殷海英 yin hai ying 译