
会员
PySpark大数据分析与应用
戴刚 张良均主编更新时间:2025-01-07 16:59:24
最新章节:参考文献开会员,本书免费读 >
本书以Python作为开发语言,系统介绍PySpark开发环境搭建流程及基于PySpark进行大数据分析的相关知识。本书条理清晰、重点突出,理论叙述循序渐进、由浅入深。本书共7章,第1?5章包括PySpark大数据分析概述、PySpark安装配置、基于PySpark的DataFrame操作、基于PySpark的流式数据处理、基于PySpark的机器学习库,内容介绍注重理论与实践相结合,通过典型示例强化PySpark在大数据分析中的实际应用;第6、7章通过基于PySpark的网络招聘信息的职业类型划分和基于PySpark的信用贷款风险分析两个完整的案例实战,结合前5章的PySpark编程知识,实现完整的大数据分析过程。本书大部分章包含实训和课后习题,读者通过练习和操作实践,能够巩固所学的内容。本书可作为高校数据科学或大数据相关专业的教材,也可作为机器学习爱好者的自学用书。
品牌:人邮图书
上架时间:2024-04-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行
PySpark大数据分析与应用最新章节
查看全部- 参考文献
- 小结
- 7.5 部署和提交PySpark应用程序
- 7.4 模型构建与评估
- 7.3 数据预处理
- 7.2 数据探索
- 7.1 需求与架构分析
- 第7章 案例分析:基于PySpark的信用贷款风险分析
- 小结
- 6.5 制作词云图
戴刚 张良均主编
主页
同类热门书
最新上架
- 会员
码上行动:利用Python与ChatGPT高效搞定Excel数据分析
本书内容分3个部分共12章。第1-4章主要介绍什么是数据分析,以及Python的编程环境和基础语法知识。第5-9章主要介绍数据处理和分析的各种方法。第10-12章介绍了如何结合Python与Excel在实际工作中进行数据处理与分析操作。计算机8.5万字 - 会员
云数据中心基础
本教材共介绍7个项目,项目1为云数据中心认知,主要介绍了什么是数据中心、云数据中心的特点、体系结构、云数据中心和传统数据中心的区别、绿色数据的概念以及发展趋势。项目2介绍了云数据中心的规划与设计,主要包括云数据中心的设计建设的指标、基础设施的规划以及云数据中心的优化策略。项目3介绍了云数据中心的硬件选型,主要包括服务器设备、网络设备以及存储设备的介绍和选型。项目4到项目6则重点介绍了虚拟化技术、云计算机12.1万字 - 会员
云计算服务保障体系
云计算是一种商业计算模型,它将计算任务分布在大量计算机构成的资源池上,使用户能够按需获取计算能力、存储空间和信息服务。与以往的计算模式不同,云计算环境下,信息安全和服务保障问题更严重、更突出。本书从云计算的安全技术和服务质量评价两个方面论述云计算服务保障的体系架构,安全技术方面主要阐述了基于可信计算的实时度量、基于角色的数据隔离访问、云节点信任链的动态维护模型与验证机制和多级安全访问控制模型;服务计算机9.5万字 - 会员
大数据SQL优化:原理与实践
这是一本站在一线开发人员的视角,从SQL的本质出发,采用理论与实践相结合、案例与分析相结合、作者经验与一线需求相结合的方式,深度解读大数据SQL优化核心技术和解决方案的工具书。本书主要面向大数据初中级技术人员,期望帮大家深度理解大数据SQL优化原理,掌握SQL优化的落地实践方法,从而真正“玩转”大数据SQL优化技术,根据实际问题和需求设计出有针对性的提升SQL性能的解决方案。计算机14万字 - 会员
数据要素五论:信息、权属、价值、安全、交易
本书从与数据要素关系最密切的信息、权属、价值、安全、交易等五个维度出发,汇聚不同学科背景的既有文献,整合现有观点,对数据要素的多维特性进行探讨,以丰富人们对数据要素的认知,凝聚共识,澄清数字时代的发展与治理迷思,为未来的相关创新提供起点。计算机14.5万字 - 会员
分布式数据库基础与应用
本书是一本介绍分布式数据库基础内容与应用的大数据专业类图书,力求培养读者对分布式数据库的应用技能。本书共11章,采用原理+代码实例+综合案例的编写形式,清晰明了地介绍分布式数据库的原理、基础应用、进阶应用及主流工具的使用方法、应用场景,以理实结合为编写要求,让读者能够轻松学习和掌握分布式数据库的内容。本书可以作为高等院校计算机、网络技术等相关专业的教材,也可以作为数据库相关工作的从业人员的参考用书计算机14万字 - 会员
Python数据分析与挖掘实战
本书以Python数据分析与挖掘的常用技术与真实案例相结合的方式,深入浅出地介绍Python数据分析与挖掘的重要内容。本书共11章,分为基础篇(第1~5章)和实战篇(第6~11章),基础篇包括数据挖掘基础、Python数据挖掘编程基础、数据探索、数据预处理、数据挖掘算法基础等基础知识;实战篇包括6个案例,分别为信用卡高风险客户识别、餐饮企业菜品关联分析、金融服务机构资金流量预测、O2O优惠券使用预计算机13.6万字 - 会员
算法设计与分析
为了便于读者进行系统学习、分类整理知识点及遇到问题时能够快速找到求解的方法,本书按照算法策略进行划分,每一章都引入了若干个经典问题。通过问题的分析、计算模型的建立、算法的设计与描述、算法的分析来深入解读每一种算法策略所能解决的问题范畴及方法。全书共分9章,内容包括:算法设计基础、算法效率分析基础、迭代法、蛮力法、分治策略、回溯与分支界限、贪心算法、动态规划、随机算法。本书非常注重教材的可读性和实用计算机9.4万字 - 会员
Python数据分析、挖掘与可视化从入门到精通
本书分为4篇,第1篇是基础入门篇,主要介绍数据分析与挖掘的基本概念及Python语言的数据分析基础;第2篇是数据分析篇,主要介绍常用的数据分析方法;第3篇是数据挖掘篇,主要介绍常用的数据挖掘方法;第4篇是实战应用篇,介绍两个完整的数据分析与挖掘案例。计算机10.9万字