机器学习实战
Alchemist.L
工业过程数据建模
展开
-
《机器学习实战》学习总结1——K-近邻算法
新手入门学习机器学习,根据ApacheCN的视频学习代码,视频可以在bilibili在线播放。 有需要资料的可以在GitHub下载:https://github.com/RedstoneWill/MachineLearning 本文最主要的是分析代码的功能与实现,相应的原理大家拿看就好了。 import numpy as np import operator from os import list...原创 2018-11-06 20:25:25 · 221 阅读 · 0 评论 -
《机器学习实战》学习总结2——决策树构造
决策树 一种依托于策略抉择而建立起来的树。 从数据产生决策树的机器学习技术叫做决策树学习。 数据形式:决策过程只有:是/否 适用数据类型:数值型和标称型 标称型:其实就是离散型数据,变量的结果只在有限目标集中取值。 信息增益 信息熵: 表示信息的混乱程度,也就是说:信息越有序,信息熵越低。 信息增益: 划分数据集的最大原则是:将无序的数据变得更加有序。 from math import log i...原创 2018-11-07 18:41:16 · 197 阅读 · 0 评论 -
《机器学习实战》学习总结3——朴素贝叶斯
朴素贝叶斯 p(xy)=p(x|y)p(y)=p(y|x)p(x) so:p(x|y)=p(y|x)p(x)/p(y) 优点:在数据较少的情况下仍然有效,可以处理多类别问题。 缺点:对于输入数据的准备方式比较敏感。 适用数据类型:标称型数据(有限)。 注释:“朴素”,这里指整个形式化过程只做最原始、最简单的假设。 本文中大量注释来源于Machelearning学习的Submission整理得到,方...转载 2018-11-07 21:03:53 · 237 阅读 · 0 评论 -
《机器学习实战》学习总结4——Logistic回归
什么是回归? 用一条线对数据进行拟合,这个过程叫做回归。 logistic回归与sigmoid函数 sigmoid范围是0~1,对线的结果进行计算 引入梯度上升 Logistic回归的一般过程 (1)收集数据:采用任意方法收集数据。 (2)准备数据:由于需要进行距离计算,因此要求数据类型为数值型。(有限)另外,结构化数据格式则最佳。 (3)分析数据: 采用任意方法对数据进行分析。 (4)训练算法:...原创 2018-11-08 21:26:58 · 208 阅读 · 0 评论