机器学习
文章平均质量分 84
jiuniangyuanzikk
记录技术的点滴
展开
-
ML-决策树
决策树是一种进行类别递归分类的分类算法, 具体的原理就是构造一棵决策树,对所有相同的类别分别作为左右子节点(当然也可以是多树杈的树) 决策树的核心在于如何找到最优的特征值来对于数据集合进行分类。最好的方法就是用香浓定理了香浓定理:H 就代表了训练集合所有特征的熵,得到了熵之后,我们就可以获取最大信息增益的方法来选择最佳的划分特征值。python代码:d原创 2017-07-01 15:39:48 · 338 阅读 · 0 评论 -
ML-Regression
Linearing Regression: 算法: python实现:# coding=utf-8from numpy import *import matplotlib.pyplot as pltfilename = 'D:\machinelearninginaction\Ch08\ex0.txt'numLen = len(open(filena原创 2017-06-25 20:15:12 · 385 阅读 · 0 评论 -
ML-KNN
KNN-k 近邻算法KNN属于分类算法,原理比较简单,简单概括就是对测试数据和所哟样本点进行距离的测算,最后选取K个最近的点的集合, 在其中选取类别出现最多的点的分类作为测试数据的分类。 以图说明,这里存在矩阵 trainMat = array([[1.,1.1],[1.,1.],[0.,0.],[0.,0.1]])作图: 当我们的原创 2017-07-01 10:51:32 · 1673 阅读 · 0 评论 -
ML--Apriori关联分析
Apriori算法通常用于发现样本间的某种关系,比如超市购物中心,通常会根据用户的数据,发现买牛奶的人通常也会买西瓜这样的关系, 来安排把牛奶和西瓜捆绑在一起进行销售。Apriori的核心思想:1.发现样本中的频繁集2.从频繁集中挖掘关联规则频繁集: 就是样本中出现的次数多的集合(这个多是相对的,算法需要定义一个度来表示什么才是真正的频繁) x(i)/n看下图:原创 2017-07-11 14:57:41 · 349 阅读 · 0 评论 -
ML-K-均值聚类算法
算法核心思想很简单,看下图: 1.算法k取值为2, 代表我们对这个样本进行2类划分,当然多类的划分算法类似2.随机的获取两个点(用圆圈圈出的)即簇质心点,注意这两个点一定要在样本边界范围内,稍后的代码会给出实现3.获取了这两个点后,通过计算所有的点到这两个点的距离,让每个点选择自己距离最近的质心点,这样这些属于同一个质心点的样本点都归为一簇4.在获取的两个簇的样本原创 2017-07-05 14:03:51 · 541 阅读 · 0 评论 -
ML-朴素贝叶斯
在做分类算法的时候,很多算法都不错,但是有时可能需要获取到分类结果的概率,这时候就可以用上贝叶斯了贝叶斯决策理论:如果有两类数据,p1(x,y)的概率属于第一类, p2(x,y)的概率属于第二类,那么如果测试数据(x,y)p1(x,y) > p2(x,y) 就属于第一类p2(x,y) > p1(x,y) 就属于第二类这就是贝叶斯决策理论的核心思想了。可以这样理解贝叶斯决策:原创 2017-07-01 16:00:54 · 240 阅读 · 0 评论 -
Python实现 线性回归(梯度下降)
import numpy as npimport pandas as pdfrom numpy import *from pandas import *import matplotlib.pyplot as pltx = np.array([[1,2],[2,1],[3,2.5],[4,3], [5,4],[6,5],[7,2.7],[8,4.5],原创 2017-11-13 18:09:21 · 4891 阅读 · 1 评论 -
tensorflow实践系列 -- 线性规划 (batch and stochastic)
import numpy as npimport tensorflow as tfimport matplotlib.pyplot as pltsess = tf.Session()#batch gradient descentx_vals = np.random.normal(1,0.1,100).reshape([100,1])y_vals = np.repeat(10.0,10原创 2017-11-30 13:36:50 · 1108 阅读 · 0 评论 -
keras -- 实现cifar10分类
import kerasfrom keras.datasets import mnist,cifar10from keras.models import Sequentialfrom keras.layers import Dense, Dropout, Flatten, MaxPooling3Dfrom keras.layers import Conv2D, MaxPooling2Df原创 2017-12-13 11:05:18 · 1123 阅读 · 0 评论