机器学习
syntacticsugars
这个作者很懒,什么都没留下…
展开
-
机器学习笔记--分类 决策树--人体运动状态信息评级
1.数据集 参考https://blog.csdn.net/qq_39011567/article/details/102732543对数据集的介绍 2.决策树算法分析 参考https://blog.csdn.net/qq_20106375/article/details/94158472对决策树算法的介绍 3.实验过程 1、使用算法:DecisionTreeClassifier分类算法...原创 2019-10-28 17:29:14 · 583 阅读 · 0 评论 -
机器学习笔记--回归 线性回归&多项式回归--房屋面积与房价的关系
1.数据集 两列数据,分别是房屋面积和房屋价格 2.回归 回归的分类:一般分为线性回归(Linear Regression), 多项式回归(Ploynomial Regression), 岭回归(Ridge Regression),Lasso回归和弹性回归网络(ElasticNet Regression).具体介绍参考https://blog.csdn.net/u013181595/ar...原创 2019-10-28 17:51:19 · 1337 阅读 · 0 评论 -
机器学习笔记--分类 朴素贝叶斯--人体运动状态信息评级
1.数据集 1.1data 每个sample有41个feature,41个feature对应的信息分别如下所示 共计6个文件,A.feature、B.feature、C.feature、D.feature、E.feature、F.feature 1.2target 共计6个文件,A.label、B.label、C.label、D.label、E.label、F.l...原创 2019-10-24 21:25:59 · 918 阅读 · 4 评论 -
机器学习笔记--分类KNN--基于鸢尾花数据集
1.数据集 参考https://blog.csdn.net/qq_39011567/article/details/102657280对鸢尾花数据集的介绍 2.KNN算法分析 1)计算测试数据与各个训练数据之间的距离; 2)按照距离的递增关系进行排序; 3)选取距离最小的K个点; 4)确定前K个点所在类别的出现频率; 5)返回前K个点中出现频率最高的类别作为测试数...原创 2019-10-24 21:25:09 · 320 阅读 · 0 评论 -
机器学习笔记--降维 PCA--基于鸢尾花数据集
1.数据集 使用skleaen.datasets自带的鸢尾花数据集进行PCA降维 首先,导入IRIS鸢尾花数据集: from sklearn.datasets import load_iris 其次,对鸢尾花数据集进行探索: iris = load_iris() X = iris.data y = iris.target iris.data是一个四维的数据集,iris.target...原创 2019-10-21 11:15:44 · 2111 阅读 · 0 评论 -
机器学习笔记--聚类算法 k-means--31省市消费水平聚类
参考文章:https://blog.csdn.net/rankiy/article/details/99843363 1.数据集 数据介绍: 现有1999年全国31个省份城镇居民家庭平均每月全年消费性支出 的八个主要变量数据,这八个变量分别是 食品、衣着、家庭设备用品、服务、医疗保健、交通、通讯、娱乐教育文化服务、居住以及杂项商品和服务。 利用已有数据,对31个省份进行聚类。 北京,2959...原创 2019-10-19 11:32:53 · 5680 阅读 · 1 评论 -
机器学习笔记--classification_report&精确度/召回率/F1值
精确度/召回率/F1值,即precision/recall/f1-score https://blog.csdn.net/akadiao/article/details/78788864 给以下一组数据进行解释: 真实值:1 2 3 1 2 1 2 1 1 3 4 3 预测值:1 1 2 3 2 1 2 4 2 3 4 2 1的精准度等于:2/3(真实值和预测值相匹配的案例数/预测...原创 2019-09-08 17:23:32 · 474 阅读 · 0 评论