![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习实战笔记
文章平均质量分 51
max_bay
这个作者很懒,什么都没留下…
展开
-
机器学习实战笔记(一):k-近邻算法(Python3 实现)
完整代码地址:https://github.com/cqulun123/Machine-Learning-in-Action0 k-近邻算法概述 简单地说, k-近邻算法采用测量不同特征值之间的距离方法进行分类。优点:精度高、对异常值不敏感、无数据输入假定。缺点:计算复杂度高、空间复杂度高。适用数据范围:数值型和标称型。工作原理 存在一个样本数据集合,也称作训练样本集,...原创 2018-05-06 20:26:37 · 468 阅读 · 0 评论 -
机器学习实战笔记(十六):大数据与MapReduce
最近在看《机器学习实战》一书,关于大数据与MapReduce这一章的内容,在网上看了一些不错的博客,在此记录下。[1] 机器学习实战】第15章 大数据与MapReduce[2] 机器学习笔记(Chapter 15 - MapReduce框架)...原创 2018-06-06 21:08:23 · 758 阅读 · 1 评论 -
机器学习实战笔记(十五):利用SVD简化数据
最近在看《机器学习实战》一书,关于利用SVD简化数据这一章的内容,在网上看了一些不错的博客,在此记录下。[1] SVD简化数据[2] 【机器学习实战】第14章 利用 SVD 简化数据[3] [完]机器学习实战 第十四章 利用SVD简化数据[4] SVD简化数据[5] 奇异值分解SVD与PCA[6] 奇异值分解(SVD)原理详解[7] 机器学习笔记]奇异值分解SVD简介及其在推荐系统中的...原创 2018-06-06 21:00:42 · 281 阅读 · 0 评论 -
机器学习实战笔记(十四):利用PCA来简化数据
最近在看《机器学习实战》一书,关于利用PCA来简化数据这一章的内容,在网上看了一些不错的博客,在此记录下。[1] 机器学习实战之PCA[2] 机器学习第十三章:利用PCA来简化数据[3] 主成分分析(Principal components analysis)-最大方差解释[4] 机器学习实战之PCA[5] [机器学习]-PCA数据降维:从代码到原理的深入解析[6] 通俗理解PCA降维作用...原创 2018-06-06 20:47:55 · 453 阅读 · 0 评论 -
机器学习实战笔记(十三):使用 FP-growth 算法来高效发现频繁项集
最近在看《机器学习实战》一书,关于 K-均值聚类算法这一章的内容,在网上看了一些不错的博客,在此记录下。[1] 机器学习实战笔记-使用FP-growth算法来高效发现频繁项集[2] 机器学习之使用FP-growth算法来高效发现频繁项集[3] 使用Apriori算法和FP-growth算法进行关联分析(Python版)...原创 2018-06-04 23:35:32 · 284 阅读 · 0 评论 -
机器学习实战笔记(十二):使用 Apriori 算法进行关联分析
最近在看《机器学习实战》一书,关于 K-均值聚类算法这一章的内容,在网上看了一些不错的博客,在此记录下。[1] 第 11 章 使用 Apriori 算法进行关联分析[2] Apriori算法进行关联分析(1)[3] 使用Apriori算法进行关联分析--代码学习[4] 使用Apriori算法和FP-growth算法进行关联分析...原创 2018-06-04 23:20:12 · 324 阅读 · 0 评论 -
机器学习实战笔记(十一):利用 K-均值聚类算法对未标注数据分组
最近在看《机器学习实战》一书,关于 K-均值聚类算法这一章的内容,再网上看了一些不错的博客,在此记录下。[1] 机器学习实战之K-Means算法[2] 算法杂货铺——k均值聚类(K-means)[3] 深入理解K-Means聚类算法[4] K-means聚类算法的三种改进(K-means++,ISODATA,Kernel K-means)介绍与对比[5] 机器学习(二)——K-均值聚...原创 2018-06-04 22:36:44 · 302 阅读 · 0 评论 -
机器学习实战笔记(十): 树回归
最近在看《机器学习实战》一书,关于树回归这一章的内容,再网上看了一些不错的博客,在此记录下。[1] 机器学习实战之树回归[2] 【机器学习实战-python3】树回归[3] 【机器学习实战 第九章】树回归 CART算法的原理与实现[4] [完]机器学习实战 第九章 树回归[5] 从决策树到随机森林:树型算法的原理与实现...原创 2018-06-04 21:55:12 · 467 阅读 · 0 评论 -
机器学习实战笔记(九):预测数值型数据:回归
最近在看《机器学习实战》一书,关于预测数值型数据:回归这一章的内容,再网上看了一些不错的博客,在此记录下。[1] 机器学习实战之回归[2] Python3《机器学习实战》学习笔记(十一):线性回归基础篇之预测鲍鱼年龄[3] 第8章 预测数值型数据:回归[4] 机器学习实战 第八章 预测数值型数据:回归(Regression)...原创 2018-06-03 23:28:54 · 426 阅读 · 0 评论 -
机器学习实战笔记(八):利用 AdaBoost 元算法提高分类性能
最近在看《机器学习实战》一书,关于利用 AdaBoost 元算法提高分类性能这一章的内容,再网上看了一些不错的博客,在此记录下。[1] Python3《机器学习实战》学习笔记(十):提升分类器性能利器-AdaBoost[2] 机器学习实战之AdaBoost算法[3] 分类算法中的非均衡问题[4] [机器学习]-Adaboost提升算法从原理到实践[5] 面试:机器学习--Adaboo...原创 2018-06-03 21:02:51 · 273 阅读 · 0 评论 -
机器学习实战笔记(七):支持向量机(SVM)(Python3 实现)
关于支持向量机的文章挺多。这里记录下自己感觉不错的博文,供大家在阅读《机器学习实战》一书时,作为参考。 [1] Python3《机器学习实战》学习笔记(八):支持向量机原理篇之手撕线性SVM[2] Python3《机器学习实战》学习笔记(九):支持向量机实战篇之再撕非线性SVM[3] 机器学习实战之SVM[4] 支持向量机系列[5] 支持向量机通俗导论(理解SVM的三层境界)[6]...原创 2018-06-03 15:54:38 · 2050 阅读 · 0 评论 -
机器学习实战笔记(六):Logistic回归(Python3 实现)
1 Logistic回归介绍 假设现在有一些数据点,我们用一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合过程就称作回归。利用Logistic回归进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。这里的“回归”一词源于最佳拟合,表示要找到最佳拟合参数集。训练分类器时的做法就是寻找最佳拟合参数,使用的是最优化算法。 1.1 Logistic回归的一般过程...原创 2018-06-03 00:04:27 · 10031 阅读 · 5 评论 -
机器学习实战笔记(五):基于概率论的分类方法: 朴素贝叶斯(Python3 实现)
1 基于贝叶斯决策理论的分类方法1.1 朴素贝叶斯优点:在数据较少的情况下仍然有效,可以处理多类别问题。缺点:对于输入数据的准备方式较为敏感。适用数据类型:标称型数据。2 使用朴素贝叶斯进行文档分类 2.1 朴素贝叶斯的一般过程(1) 收集数据:可以使用任何方法。本章使用RSS源。(2) 准备数据:需要数值型或者布尔型数据。(3) 分析数据:有大量特征时,绘制特征作用不大,此时使用直方图效果更好。...原创 2018-06-02 17:51:24 · 647 阅读 · 0 评论 -
机器学习实战笔记(三):使用k-近邻算法的手写识别系统(Python3 实现)
完整代码及数据地址:https://github.com/cqulun123/Machine-Learning-in-Action0 使用k-近邻算法的手写识别系统的步骤 (1) 收集数据:提供文本文件。(2) 准备数据:编写函数classify0(),将图像格式转换为分类器使用的list格式。(3) 分析数据:在Python命令提示符中检查数据,确保它符合要求。(4) 训练算法:此步骤不适用于k...原创 2018-05-06 23:16:39 · 673 阅读 · 0 评论 -
机器学习实战笔记(二):使用 k-近邻算法改进约会网站的配对效果(Python3 实现)
完整代码及数据地址:https://github.com/cqulun123/Machine-Learning-in-Action0 问题背景介绍 我的朋友海伦一直使用在线约会网站寻找适合自己的约会对象。尽管约会网站会推荐不同的人选,但她并不是喜欢每一个人。经过一番总结,她发现曾交往过三种类型的人: 不喜欢的人 魅力一般的人 极具魅力的人 尽管发现了上述规律,但海伦...原创 2018-05-06 22:17:04 · 1327 阅读 · 0 评论 -
机器学习实战笔记(四):决策树(Python3 实现)
1 决策树的构造 1.1决策树的特点优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据。缺点:可能会产生过度匹配问题。适用数据类型:数值型和标称型。 在构造决策树时,我们需要解决的第一个问题就是,当前数据集上哪个特征在划分数据分类时起决定性作用。为了找到决定性的特征,划分出最好的结果,我们必须评估每个特征。完成测试之后,原始数据集就被划分为几个数据子集。这些...原创 2018-05-31 23:42:04 · 471 阅读 · 0 评论