Python
文章平均质量分 57
Ftmy
Learning and thinking
展开
-
Python爬虫
urllib爬取数据:import urllib #urllib爬虫模块import re #正则模块import time #def get = GetHtml(url): page = urlib.urlopen(url) html = page.read() return htmldef getImg(html):# imglist ...原创 2018-12-22 15:05:32 · 134 阅读 · 0 评论 -
Pyhon数据分析-Numpy基本操作
import numpy as npA = numpy.array([ [],[],[],…]) #numpy数组=矩阵A[:,1] #取第二列#创建数组<矩阵> 数组(即矩阵)的维度被称为axes,维数称为 ranknp.arange(num).reshape(m,n) #一维数组转变为(m,n)矩阵np.linspace #随机数字矩阵num...原创 2018-12-22 15:08:06 · 187 阅读 · 0 评论 -
python-常用机器学习算法-KNN
#knn算法核心def knnclassify0(inX, dataSet, labels, k): #inX待分类向量 dataSet样本数据 labels标签类别 k值(前k个最近邻居) dataSetSize = dataSet.shape[0] diffMat = tile(inX, (dataSetSize,1)) - dataSet sqDiffMa...原创 2018-12-22 16:11:48 · 176 阅读 · 0 评论 -
Python-常用机器学习算法-贝叶斯算法
# 输入trainMatrix是样本数据向量化之后的结果,trainCategory是样本数据的类别标签(0,1,0,0,1,0,1,1.....)def trainNB0(trainMatrix,trainCategory): numTrainDocs = len(trainMatrix) numWords = len(trainMatrix[0]) # 求A类别的总概率...原创 2018-12-22 16:12:47 · 251 阅读 · 0 评论 -
Python-常用机器学习算法-决策树
def chooseBestFeatureToSplit(dataSet): numFeatures = len(dataSet[0]) - 1 #the last column is used for the labels baseEntropy = calcShannonEnt(dataSet) bestInfoGain = 0.0; bestFeat...原创 2018-12-22 16:45:21 · 231 阅读 · 0 评论 -
Python-常用机器学习算法-K-means
'''创建k个点作为初始的质心点(随机选择)当任意一个点的簇分配结果发生改变时 对数据集中的每一个数据点 对每一个质心 计算质心与数据点的距离 将数据点分配到距离最近的簇 对每一个簇,计算簇中所有点的均值,并将均值作为质心'''...原创 2018-12-22 16:46:01 · 227 阅读 · 0 评论