数据预处理系列
- 数据预处理 第1篇:探索数据
- 数据预处理 第2篇:数据预处理(缺失值)
- 数据预处理 第3篇:数据预处理(使用插补法处理缺失值)
- 数据预处理 第4篇:数据预处理(sklearn 插补缺失值)
- 数据预处理 第5篇:异常值分析
- 数据预处理 第6篇:数据预处理(标准化、归一化、分类数据编码和离散化)
评估模型的指标
- 评估回归模型的指标:MSE、RMSE、MAE、R2、偏差和方差
- 评估分类模型的指标:召回率、精确率、F1值
- 评估分类模型的指标:ROC/AUC
回归模型系列
- 回归模型 第1篇:线性模型概述
分类模型系列
- 分类模型 第1篇:分类模型概述
聚类模型系列:
时间序列分析系列:
推荐模型系列:
R 数据挖掘系列(未完结):
- 数据挖掘 第一篇:聚类分析(划分)
- 数据挖掘 第二篇:基于距离评估数据的相似性和相异性
- 数据挖掘 第三篇:聚类的评估(簇数确定和轮廓系数)和可视化
- 数据挖掘 第四篇:OLS回归分析
- 数据挖掘 第五篇:分类(kNN)
Azure Databricks 系列:
- Databricks 第1篇:初识Databricks,创建工作区、集群和Notebook
- Databricks 第2篇:pyspark.sql 简介
- Databricks 第3篇:pyspark.sql 通过JDBC连接数据库
- Databricks 第4篇:pyspark.sql 分组统计和窗口
- Databricks 第5篇:Databricks文件系统(DBFS)
- Databricks 第6篇:Spark SQL 维护数据库和表
- Databricks 第7篇:管理Secret
- Databricks 第8篇:把Azure Data Lake Storage Gen2 (ADLS Gen 2)挂载到DBFS
- Databricks 第9篇:
SQL Server 审计系列:
参考文档: