数据产品

——  PRODUCTS CENTER  ——

《基于Python的大数据分析基础及实战》
更新时间:2023/04/01
《基于Python的大数据分析基础及实战》
内容简介

《基于Python的大数据分析基础及实战》是一本介绍如何用Python 3.6进行数据处理和分析的学习指南。其主要内容包括:Python语言基础、数据处理、数据分析、数据可视化,以及利用Python对数据库的操作、自建Python应用库的共享发布等。

《基于Python的大数据分析基础及实战》分3个部分:第1部分为基础知识,第2部分为实战案例,第3部分为拓展与延伸。本书内容丰富,讲解通俗易懂,非常适合本科生、研究生,以及对Python语言感兴趣或者想要使用Python语言进行数据分析的广大读者。

作者简介:余本国,博士,硕士研究生导师。于中北大学理学系任教,主讲线性代数、微积分、Python语言、大数据分析基础等课程。2012年到加拿大York University做访问学者。出版有《Python数据分析基础》等著作。


目  录

第1部分  基  础  篇

第1章

Python语言基础    /2

1.0  引子    /2

1.1  工欲善其事,必先利其器(安装Python)    /3

1.2  学跑得先学走(语法基础)    /9

1.3  程序结构    /11

1.3.1  Hello World !    /11

1.3.2  运算符介绍    /12

1.3.3  顺序结构    /14

1.3.4  判断结构    /17

1.3.5  循环结构    /18

1.3.6  异常    /20

1.4  函数    /24

1.4.1  基本函数结构    /24

1.4.2  参数结构    /25

1.4.3  回调函数    /28

1.4.4  函数的递归与嵌套    /28

1.4.5  闭包    /31

1.4.6  匿名函数lambda    /32

1.4.7  关键字yield    /32

1.5  数据结构    /35

1.5.1  列表(list)    /35

1.5.2  元组(tuple)    /38

1.5.3  集合(set)    /39

1.5.4  字典(dict)    /40

1.5.5  集合的操作    /41

1.5.6  学以致用    /45

1.6  3个函数(map、filter、reduce)    /47

1.6.1  遍历函数(map)    /47

1.6.2  筛选函数(filter)    /48

1.6.3  累计函数(reduce)    /48

1.7  面向对象编程基础    /50

1.7.1  类    /50

1.7.2  类和实例    /51

1.7.3  数据封装    /52

1.7.4  私有变量与私有方法    /53

本章小结    /54

第2章

数据处理    /60

2.1  Anaconda简介    /60

2.2  Numpy简介    /66

2.3  关于Pandas    /68

2.3.1  什么是Pandas    /68

2.3.2  Pandas中的数据结构    /68

2.4  数据准备    /68

2.4.1  数据类型    /68

2.4.2  数据结构    /69

2.4.3  数据导入    /79

2.4.4  数据导出    /86

2.5  数据处理    /88

2.5.1  数据清洗    /89

2.5.2  数据抽取    /97

2.5.3  插入记录    /114

2.5.4  修改记录    /117

2.5.5  交换行或列    /120

2.5.6  排名索引    /122

2.5.7  数据合并    /131

2.5.8  数据计算    /137

2.5.9  数据分组    /141

2.5.10  日期处理    /143

带你飞(数据处理案例)    /148

本章小结    /160

第3章

数据分析    /165

3.1  基本统计分析    /165

3.2  分组分析    /169

3.3  分布分析    /171

3.4  交叉分析    /173

3.5  结构分析    /174

3.6  相关分析    /176

小试牛刀(相关分析案例:电商数据分析)    /178

本章小结    /180

第4章

数据可视化    /181

4.1  使用Python对数据进行可视化处理    /181

4.1.1  准备工作    /181

4.1.2  Matplotlib绘图示例    /186

4.1.3  Seabon中的图例    /198

4.1.4  pandas的一些可视化功能    /212

4.1.5  文本数据可视化    /217

4.1.6  networkx网络图    /218

4.1.7  folium绘制地图    /220

4.2  Python图像处理基础    /221

4.2.1  PIL图库    /221

4.2.2  OpenCV图库    /224

本章小结    /226

第5章

字符串处理与网络爬虫    /228

5.1  字符串处理    /228

5.1.1  字符串处理函数    /228

5.1.2  正则表达式    /230

5.1.3  编码处理    /237

5.2  网络爬虫    /240

5.2.1  获取网页源码    /240

5.2.2  从源码中提取信息    /241

5.2.3  数据存储    /246

5.2.4  网络爬虫从这里开始    /248

本章小结    /260

 

 

第2部分  实战案例篇

第6章

词云    /262

6.1  安装文件包    /263

6.2  jieba功能用法    /264

6.2.1  cut用法    /264

6.2.2  词频与分词字典    /265

6.3  文本词云图    /269

6.4  背景轮廓词云图的制作    /271

6.4.1  数据准备    /271

6.4.2  分词    /272

6.4.3  构建词云    /273

本章小结    /278

第7章

航空客户分类    /279

7.1  问题的提出    /279

7.2  聚类分析相关概念    /280

7.3  模型的建立    /281

7.4  Python实现代码    /281

7.5  分类结果展示与分析    /284

本章小结    /287

第8章

《红楼梦》文本分析    /288

8.1  准备工作    /289

8.2  分词    /291

8.2.1  读取数据    /291

8.2.2  数据预处理    /293

8.2.3  对红楼梦进行分词    /301

8.2.4  制作词云    /303

8.3  文本聚类分析    /312

8.3.1  构建分词TF-IDF矩阵    /312

8.3.2  使用TF-IDF矩阵对章节进行聚类    /314

8.4  LDA主题模型    /322

8.5  人物社交网络分析    /328

本章小结    /334

 

 

第3部分  拓展与延伸

第9章

Python字符串格式化    /336

9.1  使用%符号进行格式化    /336

9.2  使用format()方法进行格式化    /339

9.3  使用f方法进行格式化    /341

本章小结    /342

第10章

在Python中操作MySQL数据库    /343

10.1  对MySQL的连接与访问    /344

10.2  对MySQL的增、删、改、查操作    /345

10.2.1  查询操作    /345

10.2.2  插入操作    /346

10.2.3  更新操作    /347

10.2.4  删除操作    /347

10.3  创建数据库表    /348

本章小结    /349

第11章

fractal(分形)库的发布    /350

11.1  用Python绘制分形    /351

11.1.1  分形简介    /351

11.1.2  先睹为快    /351

11.1.3  绘制方法简介    /352

11.2  第三方库发布到PyPi    /364

本章小结    /369

参考文献    /370



上一页:已经为第一条
上一页:已经为第一条

相关推荐

在线咨询

在线留言