python
cx_mors
这个作者很懒,什么都没留下…
展开
-
机器学习实战读书笔记(一):K近邻算法
from numpy import * import operator def createDataSet(): # 创建数据集 group = array([[1.0,1.1],[1.0,1.1],[0,0],[0,0.1]]) labels = ['A','A','B','B'] return group,labels def classify0(inX,da...原创 2018-11-13 14:40:05 · 201 阅读 · 0 评论 -
机器学习实战读书笔记(二):决策树
决策树多用于处理分类问题,也经常使用的数据挖掘算法 k-近邻算法最大的缺点是无法给出数据内在含义 决策树的主要优势是数据形式很容易理解 决策树的一个最重要任务是为了数据所蕴含的知识信息,因此决策树可以使用不熟悉的数据集合 并从中提取出一系列规则,创建规则的过程就是机器学习的过程 决策树优点:计算复杂度不高,输出结果易于理解,对中间值缺少不敏感,可以处理不相关特征数据 决策树缺点:可能会产生过度匹...原创 2018-11-13 14:51:01 · 231 阅读 · 0 评论 -
机器学习实战读书笔记(三):Logistic回归
logistic回归是个最优化算法 用一条直线对这些直线进行拟合(该线称为:最佳拟合直线)该拟合过程称为回归,即找到最佳拟合参数 主要思想:根据现有数据对分类边界线建立回归公式,一次进行分类 优点:计算代价不高,易于理解和实现 缺点:容易欠拟合,分类精度可能不高 适合数据类型:数据型和标称型数据 Sigmoid函数作为 σ(z) = 1/(1+e^-z) 阶跃函数 为实现logistic回归分类...原创 2018-11-13 15:02:01 · 183 阅读 · 0 评论 -
机器学习实战读书笔记(四):朴素贝叶斯算法
朴素贝叶斯 优点: 在数据较少的情况下仍然有效 可以处理多类别问题 缺点:对输入的数据的准备方式较为敏感 适用数据类型:标称型数据 p1(x,y)>p2(x,y) 那么类别是1 p2(x,y)>p1(x,y) 那么类别是2 贝叶斯决策的核心是选择具有最高概率的决策 朴素贝叶斯分类器通常有两种方式 : 伯努利模型 和 多项式模型 这里采用伯努利实现方式 该实现不考虑词在文档中出现的次数...原创 2018-11-13 15:07:41 · 194 阅读 · 0 评论 -
python爬取字幕组的图片
首先通过对字幕组网页源码进行分析 图片<img src="http://tu.jstucdn.com/ftp/2018/1113/1e9afeab694d5fb5061fcb618c28b138.jpg"> src=“balabala.jpg” reg = r'src="(.+?\.jpg)"' reg_img = re.compile(reg) 引入正则...原创 2018-11-13 15:52:21 · 387 阅读 · 0 评论