机器学习实战
天地一扁舟
这个作者很懒,什么都没留下…
展开
-
机器学习实战---读书笔记: 第2章 k-近邻算法
内容来源于书《机器学习实战》# *-* coding: utf-8 *-*from numpy import *import operatorfrom operator import itemgetterfrom os import *import codecs'''> ---读书笔记 : 第2章 k-近邻算法关键:1 K近邻算法流程:1)计算当前点到训练集中每个点的转载 2017-03-21 12:24:14 · 406 阅读 · 0 评论 -
机器学习实战---读书笔记:第12章 使用FP-growth算法来高效发现频繁项集
#!/usr/bin/env python# encoding: utf-8import os'''<<机器学习实战>> 读书笔记 第12章 使用FP-growth算法来高效发现频繁项集关键:1 FP-growth含义: 比Apriori算法要快,基于Apriori构建,但完成相同任务时采用了不同技术。 这里任务是指将数据集存储在一个特定的...转载 2019-02-12 19:09:23 · 285 阅读 · 0 评论 -
机器学习实战---读书笔记: 第11章 使用Apriori算法进行关联分析---2---从频繁项集中挖掘关联规则
#!/usr/bin/env python# encoding: utf-8'''<<机器学习实战>> 读书笔记 第11章 使用Apriori算法进行关联分析---从频繁项集中挖掘关联规则关键:1 关联规则某个元素或者某个元素集合可能会推导出另一个元素举例: 如果有一个频繁项集{豆奶,莴苣},那么就可能有一条关联规则: 豆奶 --> 莴苣, ...转载 2019-02-11 17:03:47 · 1329 阅读 · 0 评论 -
机器学习实战---读书笔记: 第11章 使用Apriori算法进行关联分析
#!/usr/bin/env python# encoding: utf-8'''<<机器学习实战>> 读书笔记 第11章 使用Apriori算法进行关联分析关键:1 关联分析含义:从大规模数据集中寻找物品之间的隐含关系主要问题: 暴力搜索物品的不同组合很困难2 Apriori算法优点: 容易编码实现缺点: 在大数据集上可能较慢适用数据类型: ...转载 2019-02-11 12:26:30 · 448 阅读 · 0 评论 -
机器学习实战---读书笔记:第14章 利用SVD简化数据
#!/usr/bin/env python# encoding: utf-8from numpy import *'''<<机器学习实战>> --读书笔记 第14章 利用SVD简化数据关键:1 奇异值分解SVD, Singular Value Decomposition含义: 是提取信息的方法应用: 隐性予以索引,推荐引擎,图像压缩优点:简化数据...转载 2019-02-14 22:50:40 · 163 阅读 · 0 评论 -
机器学习实战---读书笔记: 第10章 二分k均值聚类---2
#!/usr/bin/env python# encoding: utf-8'''读书笔记之--<<机器学习实战>>--第10章 二分K-均值算法关键:1 k-均值聚类中的k是事先定义的,如何知道k是否正确。包含簇分配结果的矩阵中保存着每个点的误差,即点到簇质心的距离平方值。利用误差来评价聚类质量。2 度量聚类结果指标:SSE(Sum of Squ...转载 2019-02-01 16:33:24 · 246 阅读 · 0 评论 -
机器学习实战---读书笔记: 第10章 利用K均值聚类算法对未标注数据分组---1
#!/usr/bin/env python# encoding: utf-8import osfrom matplotlib import pyplot as pltfrom numpy import *'''读书笔记之--<<机器学习实战>>--第10章_利用K均值聚类算法对未标注数据分组关键:1 聚类:含义:无监督学习,将相思对象归到同一个簇...转载 2018-12-16 20:57:26 · 370 阅读 · 0 评论 -
机器学习实战---读书笔记: 第5章 基Logistic回归
内容来源于书《机器学习实战》# *-* coding: utf-8 *-*'''>---读书笔记: 第5章 Logistic回归回归:用直线对点进行拟合的过程利用回归分类主要思想:根据现有数据对分类边界线建立回归公式,进行分类回归:最佳拟合,需要找到最佳拟合参数集训练分类器:寻找最佳拟合参数,使用最优化算法Logistic回归过程:准备数据:需要距离运算,要求数据类型为数值转载 2017-03-22 00:01:17 · 436 阅读 · 0 评论 -
机器学习实战---读书笔记: 第4章 基于概率论的分类而方法:朴素贝叶斯
内容来源于书《机器学习实战》# *-* coding: utf-8 *-* '''>---读书笔记: 第4章 基于概率论的分类而方法:朴素贝叶斯关键:1 基于贝叶斯决策理论的分类方法优点:可处理多分类问题,数据较少仍有效缺点:对输入数据的准备方式敏感适用:标称型数据(目标变量只在有限集合中选取,例如真假)。 例如,文档分类贝叶斯决策理论的核心思想:选择高概率对应类别贝叶斯转载 2017-03-21 22:24:08 · 459 阅读 · 0 评论 -
机器学习实战---读书笔记: 第3章 决策树
内容来源于书《机器学习实战》# *-* coding: utf-8 *-* '''> ---读书笔记: 第3章 决策树关键:1 决策树基础知识:决策树任务:理解数据中蕴含的知识,提取规则。应用:专家系统优点:复杂度不高,中间值缺失不敏感缺点:容易产生过拟合适用:数值型和标称型决策树构造过程:找到当前能够最大区分数据的特征,将数据划分;如果划分后的每一类数据都属于同一类转载 2017-03-21 17:24:02 · 399 阅读 · 0 评论 -
机器学习实战---读书笔记:第13章 利用PCA来简化数据
#!/usr/bin/env python# encoding: utf-8import matplotlib.pyplot as pltfrom numpy import *'''机器学习实战---读书笔记:第13章 利用PCA来简化数据关键:1 降维技术降维作用: 使数据集更容易使用,降低算法开销,去除噪声主要关注未标注数据上的降维技术。降维方法:1) 主成分分...转载 2019-02-13 11:32:02 · 557 阅读 · 0 评论