Machine Learning with Python Cookbook 学习笔记系列目录

Machine Learning with Python Cookbook 学习笔记 目录

前言

目录

第一部分——基础知识

第1章 Vectors, Matrices, and Arrays:(97条消息) Machine Learning with Python Cookbook 学习笔记 第1章_五舍橘橘的博客-CSDN博客

主要讲述了:

  • numpy的基本知识
  • 对于数据结构的一些基本操作
  • 线性代数操作
第2章 Loading Data:(97条消息) Machine Learning with Python Cookbook 学习笔记 第2章_五舍橘橘的博客-CSDN博客

主要分为两部分:

  • 从多个数据源获得数据(pandas库的基本知识)
  • 通过工具生成数据(scikit-learn库的数据集部分)
第3章 Data Wrangling(数据整理):(97条消息) Machine Learning with Python Cookbook 学习笔记 第3章_五舍橘橘的博客-CSDN博客

主要讲述了:

  • pandas的DataFrame

第二部分——数据预处理

第4章 Handling Numerical Data:(97条消息) Machine Learning with Python Cookbook 学习笔记 第4章_五舍橘橘的博客-CSDN博客

主要讲述了如何处理数字类数据,包括:

  • 数据标准化归一化等预处理方法
  • 填充缺失值、扫描异常值、离散化等操作
第5章 Handling Categorical Data:(97条消息) Machine Learning with Python Cookbook 学习笔记 第5章_五舍橘橘的博客-CSDN博客

主要讲述了如何预处理分类数据,包含:

  • 编码(encode)
  • 填充(impute)
  • 处理不平衡的分类
第6章 Handling Text:(97条消息) Machine Learning with Python Cookbook 学习笔记 第6章_五舍橘橘的博客-CSDN博客

主要讲述了如何预处理文本数据,包含了:

  • 不同类型文本的清理
  • ntlk自然语言处理库
  • Porter算法
  • 单词加权
第7章 Handling Dates and Times:(97条消息) Machine Learning with Python Cookbook 学习笔记 第7章_五舍橘橘的博客-CSDN博客

主要讲述了如何处理时间和日期数据,包含:

  • 不同格式日期的相互转换
  • 日期编码
  • 填充丢失日期、滞后等日期操作
第8章 Handling Images(97条消息) Machine Learning with Python Cookbook 学习笔记 第8章_五舍橘橘的博客-CSDN博客

主要讲述了如何处理图像数据,包含:

  • opencv库的基本操作
  • 平滑图片、锐化图片、增强图片(直方图均衡化算法)
  • 去除背景(Grabcut算法)
  • 边缘检测(Canny算法)

第三部分——数据降维

第9章 Dimensionality Reduction Using Feature Extraction: (97条消息) Machine Learning with Python Cookbook 学习笔记 第9章_五舍橘橘的博客-CSDN博客

主要讲述了使用特征提取(Feature Extraction)进行特征降维。主要包括:

  • PCA(主成分分析)以及它的变种(Kernal PCA 非线性情况)
  • LDA(线性判断降维算法)
  • NMF(非负矩阵分解)
  • TSVD(截断奇异值分解)(针对稀疏矩阵)
第10章 Dimensionality Reduction Using Feature Selection:(97条消息) Machine Learning with Python Cookbook 学习笔记 第10章_五舍橘橘的博客-CSDN博客

主要讲述了使用特征选择(Feature Selection)进行特征降维。主要包括:

  • 设置阈值方差(移除方差较小的特征)
  • 去除高度线性相关特征
  • 移除无关变量(卡方统计量)
  • Recursively Eliminating Features(RFE)

第四部分 模型评估与选择

第11章 Model Evaluation: (97条消息) Machine Learning with Python Cookbook 学习笔记 第11章_五舍橘橘的博客-CSDN博客

主要讲述了不同的模型评估算法,来查看模型训练好坏的结果:

  • 交叉验证模型(Model Evaluation)
  • 生成启发式模型(scikit-learn中 DummyXXXX模型)
  • ROC曲线(评估分类器)
  • 多分类器分类指标(macro,micro,weighted)
  • 混淆矩阵
  • MSE(评估线性模型)
  • 轮廓系数(评估诸如聚类等无监督模型)
  • learning curve(观测值数量对模型的影响)
第12章 Model Selection(97条消息) Machine Learning with Python Cookbook 学习笔记 第12章_五舍橘橘的博客-CSDN博客

主要讲述了如何选择不同超参数,不同算法构成的模型:

  • GridSearchCV:穷举法交叉检验
  • RandomizedSearchCV:随机分布化交叉检验
  • 多算法模型选择
  • 预处理和模型选择
  • 加速模型选择
  • 嵌套交叉检验

施工中……


第五部分 学习算法

第13章 Linear Regression
第14章 Trees and Forests(决策树与随机森林)
第15章 K-Nearest Neighbors(KNN算法)
第16章 Logistic Regression(Sigmoid函数和逻辑回归)
第17章 Support Vector Machines(支持向量机)
第18章 Naive Bayes(朴素贝叶斯)
第19章 Clustering(聚类)
第20章 Neural Networks(神经网络)

第六部分 模型保存和导入

第21章 Saving and Loading Trained Models
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值