机器学习
Yeoman92
You can! Because you were the best one of the 120.
展开
-
Python机器学习算法库——决策树(scikit-learn学习 - 决策树)
决策树决策树(DTs)是一种用于分类和回归的非参数监督学习方法。目标是创建一个模型,通过从数据特性中推导出简单的决策规则来预测目标变量的值。 例如,在下面的例子中,决策树通过一组if-then-else决策规则从数据中学习到近似正弦曲线的情况。树越深,决策规则越复杂,模型也越合适。决策树的一些优势是:便于说明和理解,树可以可视化表达;需要很少的数据准备。其他技术通常需要数据标准化,需要创建虚拟翻译 2017-06-18 20:24:20 · 27840 阅读 · 2 评论 -
机器学习实战第二章——KNN算法(源码解析)
#coding=utf-8 ''''' Created on 2015年12月29日 @author: admin ''' from numpy import array from numpy import tile from numpy import zeros import operator from os import listdir # 创建数据集,并返回数据集转载 2017-07-03 11:11:36 · 1004 阅读 · 0 评论 -
机器学习实战第三章——决策树(源码解析)
#coding=utf-8 ''''' Created on 2016年1月5日 @author: ltc ''' from math import log import operator from ScrolledText import example # 计算信息熵 def CalcShannonEnt(dataSet): #计算数据集的输入个数转载 2017-07-03 11:14:11 · 1796 阅读 · 0 评论 -
使用sklearn做各种回归
使用sklearn做各种回归 基本回归:线性、决策树、SVM、KNN 集成方法:随机森林、Adaboost、GradientBoosting、Bagging1. 数据准备为了实验用,我自己写了一个二元函数,y=0.5*np.sin(x1)+ 0.5*np.cos(x2)+0.1*x1+3。其中x1的取值范围是0~50,x2的取值范围是-10~10,x1和x2的训练集一共有500个,测试集有100原创 2017-07-13 14:49:27 · 38198 阅读 · 8 评论 -
UndefinedMetricWarning: Precision is ill-defined and being set to 0.0 in labels with no predicted sa
from sklearn import metricsy_true = [0, 1, 2, 0, 1, 2]y_pred = [0, 2, 1, 0, 0, 1]y_true_1 = [0, 1, 2, 0, 1, 2]y_pred_1 = [0, 2, 3, 0, 0, 1]y_true_2 = [0, 1, 2, 0, 1, 2]y_pred_2 = [0, 1, 1, 0, 0, 1]原创 2017-07-19 16:51:48 · 26018 阅读 · 6 评论 -
sklearn库之各分类算法简单应用
KNNfrom sklearn.neighbors import KNeighborsClassifierimport numpy as npdef KNN(X,y,XX):#X,y 分别为训练数据集的数据和标签,XX为测试数据 model = KNeighborsClassifier(n_neighbors=10)#默认为5 model.fit(X,y) predicte原创 2017-07-11 11:21:33 · 4164 阅读 · 0 评论 -
混淆矩阵(交叉表)及Kappa系数的计算
交叉分类表,是以两个不同时期的地理实体类型为横纵坐标的表格。 ①用于参照的时期的类型位于表格的上方,按照横方向排列 ②用以比较的时期的类型位于表格的左方,垂直排列 ③在横纵坐标上类型的排列顺序一致 ④位于对角线上的方格中记录的是两个时期的数据集中没有发生类型变化的单元格数量,非对角线上记录的是从参考时期的类型到比较时期的类型变化的单元格的数量 ⑤最后一行和最后一列是分别对行和列的单元格数量原创 2017-08-03 17:54:41 · 34169 阅读 · 1 评论