机器学习
TwT520Ly
人之所以能,是相信能!
展开
-
【机器学习】KNN算法-手写识别
一:KNN算法介绍1.1 简介KNN算法即k最近邻分类算法,是机器学习的一种。从训练样本集中选取k个与测试样本“距离”最近的样本,这k个样本中出现频率最高的类别作为该测试样本的类别。1.2 要求目标:分类未知类别的案例。 输入:待分类未知类别案例项目(测试集),已知类别案例集合D(训练集)。 输出:未知类别案例的可能分类。1.3 步骤下面是一个常见的一个二分类示意图转载 2017-07-14 11:44:35 · 1104 阅读 · 0 评论 -
脊回归(Ridge Regression)
脊回归的来源 \qquad在线性回归算法的过程中,使用最小二乘法计算线性回归模型参数的时候,如果设计矩阵XXX存在多重共线性,那么最小二乘法对输入变量中的噪声是十分敏感的,容易导致估计的不稳定性,因此引入了脊回归。多重共线性 \qquad线性回归模型中的解释变量存在精确的相关关系和较大的相关性从而使模型估计难以精确计算。脊回归 \qquad当设计矩阵XXX存在多重非线性的时候(病态矩...原创 2018-04-17 19:45:02 · 1324 阅读 · 0 评论 -
【Python基础】类中__slots__使用
说明Python的新建类要求继承Python的一个内建类型,一般是继承object,但是也可以是继承list或者dict类型等其他内建类型。在默认情况下,每一个类都会通过一个__dict__进行访问,这个参数维护了一个类实例的所有属性。而且__dict__只是保存了实例的变量,对于类的属性是不保存的。__slots__是一个元组类型,包括能访问的属性,在定义了__slots__之后是不能新建元...原创 2018-04-16 10:00:23 · 349 阅读 · 0 评论 -
【机器学习】GBDT+LR算法进行特征扩增
参考文献: https://blog.csdn.net/lilyth_lilyth/article/details/48032119 https://blog.csdn.net/asdfghjkl1993/article/details/786062680.简介\qquadCTR估计也就是广告点击率预估,计算广告训练与平滑思想说明了是用LR算法对于预测的有效性。LR(Logistic ...原创 2018-03-31 15:29:22 · 8661 阅读 · 3 评论 -
【Python学习】sklearn.preprocessing.LabelBinarizer()
在多数的机器学习比赛中,给出的标签都是非数字化的,所以我们需要对其进行转换。代码如下:from sklearn import preprocessingfeature = [[0,1], [1,1], [0,0], [1,0]]label= ['yes', 'no', 'yes', 'no']lb = preprocessing.LabelBinarizer() #构建一个转换对象...原创 2018-03-13 11:35:10 · 9807 阅读 · 0 评论 -
【Python学习】字符串前面添加(u,r,b)的功能
1.r/R 表示非转义的原始字符串,比如在字符串中如果出现\n是换行,但是如果在字符串的前面添加r则表示\和n两个字符,一般常见于正则表达式中。2.b Python3里默认的str是(Python2里的)unicode, bytes是(Python2)的str, b前缀代表的就是bytes。 Python2里, b前缀没什么具体意义, 只是为了兼容Python3的这种写法。3.u/U ...原创 2018-03-06 10:32:09 · 2970 阅读 · 0 评论 -
【Python学习】拼接函数vstack()、concatenate()、hstack()等
1.concatenate()Input:import numpy as npa = np.array([[1,2]])b = np.array([[3,4]])print(np.concatenate((a,b),axis=0))print(np.concatenate((a,b),axis=1))c = np.array([[1,2],[3,4]])d = np.arr...原创 2018-03-03 15:52:17 · 1862 阅读 · 0 评论 -
【Python学习】Numpy测试题(1)
题目原文1.Import numpy as np and see the version?import numpy as npprint(np.__version__)__version__就像是一种内置的宏。2.How to create a 1D array?import numpy as nparray = np.array([i for i in ran...原创 2018-03-03 10:51:48 · 1763 阅读 · 0 评论 -
【Python学习】Numpy函数repeat和tile用法
numpy数组用扩展函数repeat和tile,但是数组不能进行动态扩展,所以在调用上述函数进行扩展的时候,系统会重新分配新的空间进行存储扩展后的数据。repeat函数功能:可以对数组中的元素进行连续复制 用法:numpy.repeat(a, repeats, axis=None)a.repeat(repeats, axis=None)其中a为数组,repeats表示重复的...原创 2018-03-03 10:00:21 · 14019 阅读 · 0 评论 -
【机器学习】机器学习目录
第一篇 机器学习基础篇第一章 线性模型1 普通线性回归2 广义线性模型3 逻辑回归4 线性判定分析第二章 决策树1 决策树基本原理与构建2 CART算法3 回归决策树4 分类决策树第三章 贝叶斯分类器1 贝叶斯定理与朴素贝叶斯2 高斯贝叶斯分类器3 多项式贝叶斯分类器4 伯努利贝叶斯分类器5 递增式学习第四章 K近邻法1 KNN算法2 KD树第五章 数据降维1 维度灾难与降维2 主成分分析(PCA)原创 2017-08-19 23:43:41 · 1093 阅读 · 0 评论