数据分析师成长路径-第二阶段

百态老人

已于 2022-11-01 13:58:51 修改

阅读量314

点赞数

文章标签：机器学习决策树数据挖掘

于 2022-11-01 13:53:08 首次发布

本文链接：https://blog.csdn.net/weixin_41429382/article/details/127632359

版权

第二阶段建模分析师	第1部分实用型大数据挖掘算法
	第一章玩转大数据：深入浅出大数据挖掘技术(Apriori算法、Tanagra工具、决策树)priori 算法、 Tanagra 工具、决策树)	1.1 数据挖掘概述与数据
		1.2 可视化与多维数据分析
		1.3 分类器与决策树
		1.4 其他分类器
		1.5 分类器应用
		1.6 关联分析
		1.7 购物车数据分析
		1.8 聚类算法
		1.9 层次聚类实现


	第2部分 SPSS Modeler数据挖掘项目实战
		1.1 DM项目生命周期与建设过
		1.2 CRISP-DM详解
		1.3 DM项目实际建设与管理过程
		1.4 DM项目团队组成与能力素养

	第二章感性认识SPSS Modeler	2.1 SPSS MODELER软件介绍
		2.8 SPSS MODELER节点
		2.9 MODELER数据流解读

	第三章必备的统计学基础	3.1 简单的统计学概念
		3.9 常用的统计分布
		3.10 统计学其它补充

	第四章数据准备与预处理	4.1 数据质量与样本管理
		4.2 MODELER变量管理
		4.7 数据质量与样本管理
		4.8 数据变量管理
		4.18 MODELER分析管理

	第五章常用模型的数学思想与思考	5.1 数据挖掘知识类型
		5.4 建模过程管理
		5.5 (上)回归分析思想与建模解释
		5.15 (下)回归分析建模解释(续)
		5.16 决策树思想与建模解释
		5.21 回归与决策树增补
		5.22 神经网络思想与建模解释
		5.33 聚类思想与建模解释
		5.34 关联分析思想与节点解释

	第3部分 Python 新手开发
	第一章 Python入门导入	1.1、Python背景以及特点
		1.2、语法要素及面向对象特性
		1.3、Python开发环境搭建，常用Python IDE

	第二章顺序程序设计	2.1、用计算机解决问题的方法
		2.2、程序设计方法
		2.3、程序设计的一般过程
		2.4、顺序程序设计问题
		2.5、顺序程序设计基础知识1
		2.6、代码块的缩进
		2.7、顺序程序设计基础知识的应用

	第三章使用序列	3.1、问题1 数据排序问题（不使用列表）
		3.2、问题2 数据排序问题（使用列表）
		3.3、问题3 查字典问题（使用字典）
		3.4、序列基础知识
		3.5、列表
		3.6、元组
		3.7、字典
		3.8、序列基础知识的应用

第四章选择结构程序设计	4.1、选择结构基本问题
	4.2、选择结构基础知识及应用
	4.3、选择结构

第五章循环结构程序设计	5.1、循环结构程序设计问题
	5.2、循环结构概述
	5.3、while语句解决不确定循环次数的问题
	5.4、while语句解决确定循环次数的问题
	5.5、while语句用于无限循环
	5.6、while语句应用举例
	5.7、for语句用于序列类型1
	5.8、for语句用于计数循环
	5.9、break语句
	5.10、continue语句

第六章字符串	6.1、字符串问题
第六章字符串	6.2、字符串基础知识

第七章函数的设计和使用	7.1、问题的引入
	7.2、黑箱模型
	7.3、函数基础知识
	7.4、变量的作用域
	7.5、参数的类型
	7.6、函数基础知识的应用

第八章文件的使用	8.1 与文件有关的问题
	8.2 文件基础知识
	8.6 文件基础知识的应用
	8.7 常用文件操作函数
	8.8 文件的复制
	8.9 文件的比较

第九章面向对象程序设计	9.1、面向对象程序设计问题
	9.2、类和对象
	9.3、实例属性和类属性
	9.4、类的方法
	9.5、运算符的重载
	9.6、继承

第4部分实战基于Python的网络爬虫技术
第一章 Python语言开发要点详解	1.1、模块的概念.主模块和非主模块的区别.pycharm中定义代码模版
	1.2、安装pip 多个虚拟python环境
	1.3、语法.变量.内置类型.运算符
	1.4、if.for.while.else
	1.5、数据结构.列表.元组.字典.集合
	1.6、函数.类.异常

第二章 Python数据类型	2.1、列表和列表解析
	2.2、filter和map
	2.3、生成器表达式
	2.4、元组
	2.5、字符串
	2.6、字符串之中文处理
	2.7、字典
	2.8、集合

第三章函数和函数式编程	3.1、函数参数和变长参数列表
	3.2、函数返回值.变量作用域.和函数__doc__属性
	3.3、函数的嵌套定义和闭包和装饰器介绍
	3.4、装饰器例子（日志装饰器和身份认证装饰器）
	3.5、迭代器和生成器1
	3.6、生成器例子

第四章面向对象编程	4.1、认识经典类和新式类
	4.2、公有属性和私有属性属性
	4.3、访问属性.属性装饰器.描述符
	4.4、描述符
	4.5、方法.实例方法.静态方法.类方法
	4.6、特殊方法.运算符重载
	4.7、继承.多重继承.super

第五章网页爬虫(单线程,保存到文本文件)	5.1、爬虫介绍
	5.2、工具包介绍
	5.3、request使用演示
	5.4、xpath介绍
	5.5、xpath使用演示
	5.6、新闻爬虫
	5.7、分页栏爬虫
	5.8、豆瓣爬虫

第六章 mysql数据库回顾	6.1、概述.sql数据库和nosql数据库的区别
	6.2、环境准备.驱动包介绍
	6.3、mysqlconnector的使用
	6.4、mysqldb使用
	6.5、sqlalchemy介绍.ORM的优点介绍
	6.6、sqlalchemy开发流程

第七章 mongodb数据库回顾	7.1、mongodb介绍
	7.2、安装.命令行.mongovue演示
	7.3、python中插入记录
	7.4、python中查询记录
	7.5、python中更新记录
	7.6、python中删除记录
	7.7、聚合操作

第八章多线程和多进程	8.1、概述
	8.2、多线程编程
	8.3、多进程编程

第九章 scrapy实战	9.1、scrapy介绍和安装
	9.2、scrapy项目框架
	9.3、scrapy框架和案例需求分析

第十章 django实战	10.1、django架构介绍
	10.2、阶段1.安装.创建项目.创建应用.初始配置
	10.3、阶段1.配置URL映射.视图函数
	10.4、阶段2.定义ORM并注册到后台管理模块
	10.5、阶段3.模版的继承.表单的使用.数据的展示
	10.6、阶段4.多应用URL配置.数据的DML操作
	10.7、部署知识介绍

第5部分 R语言数据挖掘和分析
第一章 R语法详解	1.1、数据结构概述
	1.2、向量
	1.3、因子
	1.4、矩阵
	1.5、数据框
	1.6、列表和函数
	1.7、向量化计算和apply

第二章建立数据分析的统计思维和可视化探索	2.1、数据整理概述
	2.2、数据导入导出和缺失值处理
	2.3、缺失值处理2（发现缺失值）
	2.4、缺失值处理3（处理缺失值）
	2.5、数据转换
	2.7、数据规约和随机

第三章建立数据分析的统计思维和可视化探索	3.1、数据分布
	3.2、集中趋势
	3.3、离散趋势和相关
	3.4、R中的描述统计
	3.5、分组统计
	3.6、单变量可视化
	3.7、双变量可视化
	3.8、分组统计可视化

第四章用回归预测未来	4.1、线性回归的思想
	4.2、回归结果的检查
	4.3、决定系数预测和多元线性回归
	4.4、一元线性回归演示
	4.6、残差分析演示
	4.7、多元线性回归演示

第五章聚类方法	5.1、概述和距离
	5.2、数据变换
	5.3、层次聚类法
	5.4、kmeans聚类

第六章数据降维——主成分分析和因子分析	6.1、概述
	6.2、相关性会导致无法求解或者不稳定
	6.3、逐步回归
	6.4、主成分分析
	6.5、因子分析

第七章关联规则	7.1、关联规则介绍
第七章关联规则	7.2、关联规则演示

第八章决策树	8.1、决策树介绍
	8.2、几种分类算法介绍
	8.3、评价模型准确性
	8.4、C4.5 和混淆矩阵 ROC图
	8.5、CART演示

第6部分实战机器学习(基于Python)
第一章 k最近邻算法	1.1、机器学习课程介绍
	1.2、K最近邻算法的思想
	1.3、机器学习中常用的距离指标解析
	1.4、实战k最近邻算法

第二章朴素贝叶斯分类算法	2.1、概率论的基本知识(基本概念、加法公式、乘法公式)
	2.2、通过例子深入掌握概率的基本公式
	2.3、全概率公式和贝叶斯定理
	2.4、实战贝叶斯分类算法，智能手环推荐

第三章聚类算法	3.1、聚类算法概述
	3.2、Kmeans聚类
	3.3、Kmeans实战，图片按照色彩聚类

第四章决策树算法	4.1、决策树介绍
	4.2、决策树的构造过程和各种算法
	4.3、决策树中关键指标详解
	4.4、实战决策树

第五章线性回归和梯度下降算法	5.1、线性回归的相关概念（相关、独立和协方差）
	5.2、线性回归和最小二乘法
	5.3、梯度下降算法
	5.4、梯度的推导过程
	5.5、岭回归、lasso回归和弹性网

第六章逻辑回归和极大似然估计	6.1、广义线性回归和逻辑回归
	6.2、极大似然估计的思想
	6.3、逻辑回归中的梯度推导
	6.4、逻辑回归代码实战

第七章支持向量机	7.1、支持向量机原理介绍
	7.2、线性可分的支持向量机
	7.3、近似线性可分、非线性可分、核函数
	7.4、坐标上升法、SMO算法、实战支持向量机

第八章 EM算法和GMM	8.1、EM算法思想
	8.2、EM算法的推导
	8.3、实战EM算法，GMM

第九章随机森林和Adaboost	9.1、随机森林
	9.2、Adaboost思想精髓
	9.3、Adaboost算法流程介绍
	9.4、实战Adaboost算法

第十章机器学习思想精华和实战经验分享	10.1、机器学习解决问题思想框架
	10.2、理解方差和偏差、损失函数和过拟合
	10.3、L1、L2正则化和常见的5种损失函数
	10.4、如何选择模型和选择参数，交叉验证和ROC曲线
	10.5、自适应学习率和二分法精确搜索
	10.6、自适应学习率和基于阿米霍准则的模糊搜索

第 7部分机器学习
第一章机器学习的任务和方法	1.1、机器学习的任务和方法

第二章 Python语言基础	2.1、Python基础2-数据库访问
	2.2、Python基础2-文件访问
	2.3、Python基础2-第三方库
	2.4、Python基础2-网络编程
	2.5、Python语言基础

第三章分类算法介绍	3.1、分类算法

第四章 k-临近算法	4.1、k-临近算法

第五章决策树	5.1、决策树

第六章基于概率论的分类方法：朴素贝叶斯	6.1、基于概率论的分类方法：朴素贝叶斯

第七章 Logistic回归	7.1、Logistic回归

第八章支持向量机	8.1、支持向量机

第九章利用AdaBoost元算法提高分类性能	9.1、利用AdaBoost元算法提高分类性能

第十章利用回归预测数值型数据	10.1、利用回归预测数值型数据

第十一章树回归	11.1、树回归

第十二章无监督学习	12.1、无监督学习

第十三章利用K-均值聚类算法对未标注数据分组	13.1、利用K-均值聚类算法对未标注数据分组

第十四章使用Apriori算法进行关联分析	14.1、使用Apriori算法进行关联分析

第十五章使用FP-growth算法来高效发现频分项集	15.1、使用FP-growth算法来高效发现频分项集

第十六章利用PCA来简化数据	16.1、利用PCA来简化数据

第十七章利用SVD简化数据	17.1、利用SVD简化数据

第十八章大数据与MapReduce	18.1、大数据与MapReduce