Python基础
1、成为Python高手之前必备基础知识
2、Python标准数据类型(String、Number、Tuple、List、Dict、Set)及常用操作
3、控制流语句(条件分支、for循环、while语句、try-except-else-finally语句)
4、变量的作用域(内建变量、全局变量、局部变量、闭包外局部变量)
5、函数的参数(关键字参数、位置参数、形参和实参、默认参数、可变参数)
6、自定义函数--函数式编程
7、异常和错误
8、文件操作
9、时间模块
Python数据清洗
1、Numpy中的数据类型--ndarray数组的创建
2、Numpy数组基础(索引、切片、变形、分裂)
3、Numpy数组运算:通用函数
4、Numpy数组变形、拼接
5、Numpy数组计算:广播、聚合、比较和掩码、数组排序
6、Pandas对象简介(Series、Dataframe、Index)
7、Pandas数据加载与存储
8、Pandas数值运算方法:通用函数、聚合函数、遍历
9、Panda层次化索引
10、Pandas数据处理:数据类型转换、缺失值处理、字符串转换
11、Pandas数据表的合并与连接
12、Pandas数据的累计与分组
13、高性能Pandas:query()、eval()实现高性能运算
14、Pandas数据规整化:清理、转换、合并、重塑
15、Pandas时间序列&金融数据处理
16、数据清洗实战案例:泰坦尼克幸存者数据清洗
17、数据清洗实战案例:USDA食品数据清洗
Python爬虫
1、网络爬虫基础知识
2、网络请求及响应-requests库
3、HTML文档解析-BeautifulSoup库
4、常见反爬虫机制及应对
5、网络爬虫 VS 网络数据抓取
6、实战1:批量下载头像
7、实战2:抓取豆瓣书籍简介
8、实战3:模拟浏览器selenium抓取电商商品信息及评论
python数据可视化
1、绘图思想的基本原理
2、Python数据可视化包-Matplotlib介绍
3、使用Matplotlib进行基本的图形绘制
4、使用Python数据处理包Pandas做可视化
5、Python数据可视化包-Seaborn介绍与图形绘制
6、Python数据可视化包-Pyecharts介绍与图形绘制
7、使用Python进行地图绘制-Pyecharts
机器学习算法
1、机器学习入门介绍:机器学习基本思想、常用算法分类、算法库等
2、Scikit-Learn入门介绍:特征矩阵、标签数组、评估器及常用函数
3、Scikit-Learn特征工程:分类特征、文本特征、图像特征、特征衍生、缺失值填充、特征管道
4、KNN-最近邻分类器、KD-Tree和KNN回归
5、梯度下降算法:梯度下降、随机梯度下降和微批梯度下降
6、贝叶斯分类器:朴素贝叶斯、贝叶斯网络
7、回归分析:线性回归、岭回归、LASSO和弹性网
8、广义线性回归:Logistic回归和泊松回归
9、树模型:C4.5、C5.0和CART树
10、SVM支持向量机分类和支持向量机回归
11、集成算法之Bagging类算法:Bagging、随机森林等
12、集成算法之Boosting类算法:Boosting、GBDT梯度提升树、XgBoost等
13、神经网络算法:反向传播神经网路、卷积神经网络、LSTM等
14、聚类分析:K-means快速聚类、DBSCAN密度聚类、层次聚类等
15、关联规则:Apriori、FP-Growth、PrefixSpan等
16、无监督学习:LDA、LSI
17、数据降维方法:PCA主成分分析和SVD奇异值分解
18、Scikit-Learn常用功能介绍与使用:网格搜索、Pipline
19、大型综合案例:利用Pipline选择模型构建机器学习流,并利用网格搜索完成模型调优