- 博客(4)
- 收藏
- 关注
原创 ADABOOSt
导入需要进行训练的数据集。这个数据集一共有5个样本,每个样本都有两个。他们的类别都写在标签矩阵之中。由于这次分类使用的分类函数是符号函数, 只能输出-1和1两个结果,因此,和sigmoid函数的分类结果不同。 def loadSimDat(): dataMat = matrix([[1, 2.1], [2.0, 1.1],
2017-05-11 22:15:50 278
原创 logistic回归
假设一个二维坐标平面上,有许多的点,这些点有两个特征,一个是x1,另一个是x2。将这两个特征表示在坐标轴上,横坐标表示特征x1,纵坐标表示特征x2。平面上所有的点,都可以根据它的这两个特征的取值大小,来唯一地在坐标平面上画出来。 假设这个坐标平面上的所有点可以被一条直线划分为两类,一类叫做0,一类叫做1. 分类函数叫做sigmoid函数。将平面上这些点的两个特征相应的值作为sm函数的输
2017-05-10 22:04:17 295
原创 朴素贝叶斯
本文介绍使用朴素贝叶斯进行文本分类。下面分析各段代码所实现的功能 def loadDataSet(): 2 postingList=[['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'], 3 ['maybe', 'not', 'take', 'him', 'to', 'dog',
2017-05-09 22:05:27 203
原创 决策树
程序清单一、计算给定数据集的香农熵 import operator import copy from math import log def calcShannonEnt(dataSet): numEntries = len(dataSet)#求取数据集的行数 labelCounts = {} for
2017-05-08 20:07:37 916 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人