Machine Learning
qxdoit
这个作者很懒,什么都没留下…
展开
-
Machine Learing -- 简介
怎么样让机器具备自我学习能力,可以采取的手段之一是机器学习而机器学习的步骤具体可以分为三步:1.选择一个function set, (define a set of function)2.选择对function 的评价方法 (goodness of function)3.选择最好的一个function (pick the best of function)...原创 2018-04-22 12:39:59 · 228 阅读 · 0 评论 -
numpy--学习
numpy 和 pandas 都是采用c语言编写pandas 又是基于numpy 的升级版本,采用矩阵运算,比python内置的字典,列表快很多numpy 的几种属性: arr = np.array([[1,2,3], [2,3,4]])print(arr)print("shape : ",arr.shape)print("number o...原创 2018-12-05 16:29:02 · 326 阅读 · 0 评论 -
结合sklearn介绍几种常用的特征选择方法
原文链接https://www.cnblogs.com/hhh5460/p/5186226.html 结合Scikit-learn介绍几种常用的特征选择方法 作者:Edwin Jarvis特征选择(排序)对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能,更能帮助我们理解数据的特点、底层结构,这对进一步改善模型、算法都有着重...转载 2018-12-04 22:44:11 · 2595 阅读 · 0 评论 -
PCA
@TOCPCA的理论知识以及与K-L变换的关系PCA是主成分分析(Principal Components Analysis)的简称。这是一种数据降维技术,用于数据预处理。一般我们获取的原始数据维度都很高,那么我们可以运用PCA算法降低特征维度。这样不仅可以去除无用的噪声,还能减少很大的计算量。K-L转换(Karhunen-Loève Transform)是建立在统计特性基础上的一种转换,它...转载 2018-12-04 21:53:52 · 350 阅读 · 0 评论 -
机器学习实战--决策树
代码:import numpy as npimport operator#计算香农熵,度量数据集的无序程度def calcShannonEnt(dataSet): numEntries = len(dataSet) labelCountes = {} for featureVect in dataSet: currentLable = featu...原创 2018-10-17 12:05:03 · 112 阅读 · 0 评论 -
机器学习实战--KNN手写数字识别
数据集:https://github.com/pbharrin/machinelearninginaction/blob/master/Ch02/digits.zip代码:import numpy as npimport operatorimport matplotlibimport matplotlib.pyplot as pltimport osdef classfy0KN...原创 2018-10-16 15:40:48 · 289 阅读 · 0 评论 -
机器学习实战--KNN约会数据分类
约会数据: https://github.com/pbharrin/machinelearninginaction/blob/master/Ch02/datingTestSet2.txt代码如下:import numpy as npimport operatorimport matplotlibimport matplotlib.pyplot as plt#数据读取与预处理d...原创 2018-10-16 11:48:37 · 1676 阅读 · 0 评论 -
机器学习实战--KNN
import numpy as npimport operatordef createDataSet(): group = np.array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]]) labels = ['A','A','B','B'] return group,labelsdef classify0(inX,dataset,lab...原创 2018-10-15 11:05:35 · 158 阅读 · 0 评论 -
pandas--数据处理
目录 pandas的基础用法:pandas 选择数据 pandas的基础用法: s = pd.Series([1,3,6,np.NaN,44,1]) print(s) dates = pd.date_range('20181203',periods=6)print(dates) ...原创 2018-12-04 00:14:04 · 163 阅读 · 0 评论