机器学习
Sarah Huang
这个作者很懒,什么都没留下…
展开
-
【机器学习实战】无监督学习
10 利用K-均值聚类算法对未标注数据分组10.1 K-均值聚类算法算法特点优点:容易实现和理解缺点:可能收敛到局部最小,且在大规模数据集上收敛较慢适用数据:数值型数据一般流程:收集数据准备数据:需要数值型数据计算举例,标称型数据需要映射为二值型数据。分析数据训练算法:无监督学习不需要训练测试算法:可使用量化误差指标如误差平方和来评价结果使用算法:通常情况下,簇...原创 2020-03-27 17:45:57 · 654 阅读 · 0 评论 -
【机器学习实战】监督式学习-分类
分类2. K-近邻算法(KNN)2.1 KNN概述把需要分类的数据与已分类数据(训练集)进行比较,在前k个最近的样本中,选取分类最多的类别作为该数据的类别。属于无监督学习优点:精度高、对异常值不敏感、无数据输入假定缺点:计算复杂度高、空间复杂度高、无法得到任何数据的基础结构信息适用数据范围:数值型和标称型。2.2 举例1:改进约会网站配对效果准备数据:从文本文件中解析数据分...原创 2020-03-19 11:19:50 · 840 阅读 · 0 评论 -
【机器学习实战】监督式学习-回归
8. 预测数值型数据:回归8.1 用线性回归找到最佳拟合直线线性回归优点:结果易于理解,计算不复杂对非线性数据拟合不好适用数据类型:数值型和标称型数据回归的一般方法收集数据准备数据:需要数值型数据,标称型数据会被转化成二值型数据分析数据:在回归前把数据展示在二维图上有助于加深对数据的理解,在求得回归系数后,再把拟合线也绘制在图上。训练算法:找到回归系数测试算法:使用R2...原创 2020-03-26 16:17:32 · 550 阅读 · 0 评论