![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
Sarah Huang
这个作者很懒,什么都没留下…
展开
-
【机器学习实战】无监督学习
10 利用K-均值聚类算法对未标注数据分组 10.1 K-均值聚类算法 算法特点 优点:容易实现和理解 缺点:可能收敛到局部最小,且在大规模数据集上收敛较慢 适用数据:数值型数据 一般流程: 收集数据 准备数据:需要数值型数据计算举例,标称型数据需要映射为二值型数据。 分析数据 训练算法:无监督学习不需要训练 测试算法:可使用量化误差指标如误差平方和来评价结果 使用算法:通常情况下,簇...原创 2020-03-27 17:45:57 · 614 阅读 · 0 评论 -
【机器学习实战】监督式学习-回归
8. 预测数值型数据:回归 8.1 用线性回归找到最佳拟合直线 线性回归 优点:结果易于理解,计算不复杂 对非线性数据拟合不好 适用数据类型:数值型和标称型数据 回归的一般方法 收集数据 准备数据:需要数值型数据,标称型数据会被转化成二值型数据 分析数据:在回归前把数据展示在二维图上有助于加深对数据的理解,在求得回归系数后,再把拟合线也绘制在图上。 训练算法:找到回归系数 测试算法:使用R2...原创 2020-03-26 16:17:32 · 509 阅读 · 0 评论 -
【机器学习实战】监督式学习-分类
分类 2. K-近邻算法(KNN) 2.1 KNN概述 把需要分类的数据与已分类数据(训练集)进行比较,在前k个最近的样本中,选取分类最多的类别作为该数据的类别。属于无监督学习 优点:精度高、对异常值不敏感、无数据输入假定 缺点:计算复杂度高、空间复杂度高、无法得到任何数据的基础结构信息 适用数据范围:数值型和标称型。 2.2 举例1:改进约会网站配对效果 准备数据:从文本文件中解析数据 分...原创 2020-03-19 11:19:50 · 812 阅读 · 0 评论 -
【python】生成器和yield
python生成器和yield 再一次遇到yield表达,复习了一下生成器,顺手记录一下。 iterable:可迭代对象,只要内部实现了__iter__或__getitem__方法的对象就是可迭代的,如list, dict, tuple, set, str等; iterator:迭代器,内部实现了__iter__和next()方法的对象;iterable不一定是iterator,但可以进行转化。...原创 2020-03-04 13:51:56 · 111 阅读 · 0 评论