机器学习
文章平均质量分 72
方玲是个小可爱
这个作者很懒,什么都没留下…
展开
-
《机器学习实战》个人学习记录笔记(四)———决策树
第三章 决策树PS:个人笔记 根据《机器学习实战》这本书,Jack-Cui的博客,以及深度眸的视频进行学习1 决策树原理决策树(decision tree)是一种基本的分类与回归方法。决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是if-then规则的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。2 优缺点及适用数据范围优点:①计算复杂度不高,输出结果...原创 2018-04-15 19:32:57 · 572 阅读 · 0 评论 -
《机器学习实战》个人学习记录笔记(十二)———Logistic回归SKlearn病马案例
第五章 Logistic回归PS:个人笔记 根据《机器学习实战》这本书,Jack-Cui的博客,以及深度眸的视频进行学习1 数据缺失⭐解决办法:使用可用特征的均值来填补缺失值;使用特殊值来填补缺失值,如-1;忽略有缺失值的样本;使用相似样本的均值添补缺失值;使用另外的机器学习算法预测缺失值。⭐预处理数据:如果测试集中一条数据的特征值已经确实,那么我们选择实数0来替换所有缺失值,因为本文使用Logi...原创 2018-04-18 21:50:36 · 609 阅读 · 0 评论 -
《机器学习实战》个人学习记录笔记(十一)———Logistic回归改进与例子
第五章 Logistic回归PS:个人笔记 根据《机器学习实战》这本书,Jack-Cui的博客,以及深度眸的视频进行学习1 改进的随机梯度上升算法from matplotlib.font_manager import FontPropertiesimport matplotlib.pyplot as pltimport numpy as npimport randomdef loadDa...原创 2018-04-18 18:49:01 · 276 阅读 · 0 评论 -
《机器学习实战》个人学习记录笔记(十)———Logistic回归
第五章 Logistic回归PS:个人笔记 根据《机器学习实战》这本书,Jack-Cui的博客,以及深度眸的视频进行学习1 优缺点及适用数据范围优点:①计算代价不高(算起来比较简单,log做了简化)②易于理解和实现缺点:①容易欠拟合(拟合效果不是特别好,有些异常数据)②分类精度可能不高适用数据类型:数值型和标称型数据2 Logisitc回归与Sigmoid函数回归:假设现在有一些数据点,我们利用一...原创 2018-04-18 16:30:57 · 201 阅读 · 0 评论 -
《机器学习实战》个人学习记录笔记(九)———朴素贝叶斯之新浪新闻分类(Sklearn)
第四章 朴素贝叶斯PS:个人笔记 根据《机器学习实战》这本书,Jack-Cui的博客,以及深度眸的视频进行学习1 中文语句切分import osimport jiebadef TextProcessing(folder_path): folder_list = os.listdir(folder_path) #查看folder_path...原创 2018-04-16 19:44:55 · 909 阅读 · 0 评论 -
《机器学习实战》个人学习记录笔记(八)———朴素贝叶斯实战篇之垃圾邮件分类
第四章 朴素贝叶斯PS:个人笔记 根据《机器学习实战》这本书,Jack-Cui的博客,以及深度眸的视频进行学习1 两个改进①拉普拉斯平滑(Laplace Smoothing)又被称为加1平滑,是比较常用的平滑方法,它就是为了解决0概率问题。②下溢出:这是由于太多很小的数相乘造成的。为了解决这个问题,对乘积结果取自然对数。通过求对数可以避免下溢出或者浮点数舍入导致的错误。同时,采用自然对数进行处理不...原创 2018-04-16 18:48:05 · 768 阅读 · 0 评论 -
《机器学习实战》个人学习记录笔记(七)———朴素贝叶斯
第四章 朴素贝叶斯PS:个人笔记 根据《机器学习实战》这本书,Jack-Cui的博客,以及深度眸的视频进行学习1 贝叶斯原理与朴素贝叶斯贝叶斯决策理论的核心思想,即选择具有最高概率的决策。2 优缺点和适用数据类型优点:①可以处理小样本情况(样本少,基于频率可以算)②可以处理多分类问题()缺点:对于输入数据比较敏感(样本少,则对要求会高,样本间是要求独立的)数据类型:标称型数据3 贝叶斯推断对条件概...原创 2018-04-16 12:27:46 · 328 阅读 · 0 评论 -
《机器学习实战》个人学习记录笔记(六)———Sklearn决策树预测隐形眼镜类型
第三章 决策树PS:个人笔记 根据《机器学习实战》这本书,Jack-Cui的博客,以及深度眸的视频进行学习1 使用Sklearn构建决策树使用的是DecisionTreeClassifier和export_graphviz,前者用于决策树构建,后者用于决策树可视化。2 DecisionTreeClassifier构建决策树criterion:特征选择标准,可选参数,默认是gini,可以设置为ent...原创 2018-04-15 23:55:32 · 960 阅读 · 0 评论 -
《机器学习实战》个人学习记录笔记(五)———决策树构建与分类
第三章 决策树PS:个人笔记 根据《机器学习实战》这本书,Jack-Cui的博客,以及深度眸的视频进行学习1 决策树构建ID3算法的核心是在决策树各个结点上对应信息增益准则选择特征,递归地构建决策树。具体方法是:从根结点(root node)开始,对结点计算所有可能的特征的信息增益,选择信息增益最大的特征作为结点的特征,由该特征的不同取值建立子节点;再对子结点递归地调用以上方法,构建决策树;直到所...原创 2018-04-15 21:18:29 · 272 阅读 · 0 评论 -
《机器学习实战》个人学习记录笔记(三)———k-近邻算法实战之sklearn手写数字识别
第二章 k-近邻算法PS:个人笔记 根据《机器学习实战》这本书,Jack-Cui的博客,以及深度眸的视频进行学习1. Sklearn实现k-近邻算法sklearn.neighbors.KNeighborsClassifier就可以是实现上小结,我们实现的k-近邻算法。KNeighborsClassifier函数一共有8个参数。KNneighborsClassifier参数说明:⭐⭐n_neighb...原创 2018-04-15 18:15:05 · 575 阅读 · 0 评论 -
《机器学习实战》个人学习记录笔记(二)———k-近邻算法实战之约会网站配对效果判定
第二章 k-近邻算法PS:个人笔记 根据《机器学习实战》这本书,Jack-Cui的博客,以及深度眸的视频进行学习k-近邻算法的一般流程①收集数据:可以使用爬虫进行数据的收集,也可以使用第三方提供的免费或收费的数据。一般来讲,数据放在txt文本文件中,按照一定的格式进行存储,便于解析及处理。②准备数据:使用Python解析、预处理数据。③分析数据:可以使用很多方法对数据进行分析,例如使用Matplo...原创 2018-04-15 15:00:41 · 432 阅读 · 0 评论 -
《机器学习实战》个人学习记录笔记(一)———K-近邻算法
第二章 k-近邻算法PS:个人笔记 根据《机器学习实战》这本书,Jack-Cui的博客,以及深度眸的视频进行学习1 KNN原理 它的工作原理是:存在一个样本数据集合,也称作为训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一个数据与所属分类的对应关系。输入没有标签的新数据后,将新的数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本最相似数据(最近邻)的分类标签。...原创 2018-04-15 14:00:58 · 210 阅读 · 0 评论 -
《机器学习实战》个人学习记录笔记(十三)———SVM支持向量机理论部分(心态爆炸,卡在SVM好几天了!)
第六章 SVMPS:个人笔记 根据《机器学习实战》这本书,Jack-Cui的博客,以及深度眸的视频进行学习原创 2018-04-21 13:56:36 · 290 阅读 · 0 评论