- 博客(14)
- 资源 (2)
- 收藏
- 关注
转载 Apriori算法学习笔记
#coding=utf-8from numpy import *def loadDataSet(): return [[1,3,4],[2,3,5],[1,2,3,5],[2,5]]'''创建候选项集列表'''def createC1(dataSet): C1=[] for transaction in dataSet: for item i
2017-06-28 15:48:12 551 2
转载 kMeans算法学习笔记(一)
#coding=utf-8from numpy import *#数据集的读取def loadDataSet(fileName): dataMat=[] fr=open(fileName) for line in fr.readlines(): currentLine=line.strip().split('\t') fltLine=
2017-06-28 09:56:32 530
转载 回归算法学习笔记(二)局部加权线性回归
#coding=utf-8from numpy import *def loadDataSet(fileName): numFeat=len(open(fileName).readline().split('\t'))-1 dataMat=[];labelMat=[] fr=open(fileName) for line in fr.readlines():
2017-06-27 10:14:27 483
转载 回归算法学习笔记(一)用线性回归线找到最佳拟合直线
#coding=utf-8from numpy import *def loadDataSet(fileName): numFeat=len(open(fileName).readline().split('\t'))-1 dataMat=[];labelMat=[] fr=open(fileName) for line in fr.readlines():
2017-06-26 20:50:58 3334
转载 adaBoost算法学习笔记
本文参考自《机器学习实战》其中adaboostTrainDS()函数的返回值要修改为aggClassEst.T,不然ROC曲线会画不出来#coding=utf-8from numpy import *'''单层决策树算法'''def loadSimpData(): dataMat=matrix([[1.0,2.1],[2.0,1.1],[1.3,1.0],[1.0
2017-06-26 15:53:20 727
转载 logistic回归算法学习笔记-从疝气症预测病马死亡率
#coding=utf-8from numpy import *#数据集的获取def loadDataSet(): dataMat=[];labelMat=[] fr = open('testSet.txt') for line in fr.readlines(): lineArr=line.strip().split() dataMa
2017-06-25 11:19:03 495
转载 朴素贝叶斯算法学习笔记(三)显示地域相关的用词
#coding=utf-8import feedparserimport bayesimport bayes_emailfrom numpy import *#计算出现频率最高三十个单词def calMostFreq(vocabList,fullText) : import operator freqDict={} for token in vocabList
2017-06-24 21:11:04 240
转载 朴素贝叶斯算法学习笔记(二)使用算法进行交叉验证
import bayesfrom numpy import *def bagOfWords2VecMN(vocabList,inputSet): returnVec=0*len(vocabList) for word in inputSet: if word in vocabList: returnVec[vocabList.inde
2017-06-24 19:33:02 1707
转载 朴素贝叶斯算法学习笔记(一)
#coding=utf-8from numpy import *'''准备数据:从文本中构建词向量'''#数据集的读取def loadDataSet(): postingList=[['my','dog','has','flea','problems','help','please'],\ ['maybe','not','take','him'
2017-06-24 18:52:00 274
转载 决策树算法学习笔记(三)-预测隐形眼镜类型
#coding=utf-8import matplotlib.pyplot as plt#定义文本框和箭头格式decisionNode=dict(boxstyle="sawtooth",fc="0.8")leafNode = dict(boxstyle="round4",fc="0.8")arrow_args=dict(arrowstyle=")def getNumLeafs(my
2017-06-24 10:07:28 691
转载 决策树算法学习笔记(二)
# -*- coding: UTF-8 -*-from math import logfrom numpy import *import matplotlib.pyplot as pltdef calcShannonEnt(dataSet): numEntries=len(dataSet)#统计数据集的数量 labelCounts={}#创建一个数据字典 for
2017-06-23 20:49:59 268
转载 决策树算法学习笔记(一)
香农熵的计算# -*- coding: UTF-8 -*-from math import logdef calcShannonEnt(dataSet): numEntries=len(dataSet)#统计数据集的数量 labelCounts={}#创建一个数据字典 for featVec in dataSet: currentLabel
2017-06-22 19:32:11 273
转载 KNN算法学习笔记二
def file2matrix(filename): fr=open(filename)#打开文件 arrayOfLines=fr.readlines()#读取每一行 numberOfLines=len(arrayOfLines)#统计行数 returnMat=zeros((numberOfLines,3))#转换成矩阵 classLabelVe
2017-06-22 15:06:36 294
转载 KNN算法学习笔记(一)
from numpy import *import operatordef createDataSet(): group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]]) labels=['A','A','B','B'] return group,labelsgroup,labels=createDataSet()de
2017-06-22 11:08:48 663
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人