- 博客(5)
- 资源 (6)
- 问答 (3)
- 收藏
- 关注
原创 独热编码
独热编码 one-hot code, 即有多少个状态就有多少比特,且只有一个比特为1,其他全为0的一种码制。在机器学习中对于离散型的分类型的数据,需要对其进行数字化比如说性别这一属性,只能有男性或者女性两种,一种简单的方式就是男性为0,女性为1,使用简单的序列对分类值进行表示后,进行模型训练时可能会产生一个问题:特征因为数值不同影响模型的训练效果,在模型训练的过程中不同的值使得同一特征在样本中的权
2018-01-23 16:57:48 1545
翻译 A basic walkthrough of xgboost python package
This document gives a basic walkthrough of xgboost python package. 这份文档是xgboost python包的一个简单使用参考。List of other Helpful LinksPython walkthrough code collections Python API ReferenceInstall XG
2018-01-22 10:28:35 548
原创 批梯度下降法与随机梯度下降法
选定线性回归模型后,确定参数 θ后就可以将模型用来预测。 目标函数 J(θ) 最小时 θ 才能确定。因此问题归结为求极小值问题,使用梯度下降法。 梯度下降法最大的问题是求得的有可能是全局极小值,这与初始点选取有关。 梯度下降法流程: 1)首先对 θ 赋值,可以是随机的,也可以让 θ 是一个全零的向量。 2)改变 θ 的值,使得 J(θ) 按梯度下降的方向进行减少。 梯度方向由 J(θ) 对
2018-01-18 10:12:16 405
原创 ID3与C4.5和CART决策树算法
决策树学习算法最著名的代表是ID3、C4.5和CART,三种决策树算法有不同的特征选择方案:ID3用信息增益,C4.5用信息增益率,CART用基尼(gini)系数。 ID3算法是决策树的一个经典的构造算法,在一段时期内曾是同类研究工作的比较对象,但通过近些年国内外学者的研究,ID3算法存在的问题如下: (1)信息增益的计算依赖于特征数目较多的特征,而属性取值最多的属性并不一定最优。 (2)I
2018-01-12 16:07:04 835
转载 Java正则表达式的解释说明
表达式意义:1.字符x 字符 x。例如a表示字符a \ 反斜线字符。在书写时要写为\\。(注意:因为java在第一次解析时,把\\解析成正则表达式\,在第二次解析时再解析为\,所以凡是不是1.1列举到的转义字符,包括1.1的\,而又带有\的都要写两次) \0n 带有八进制值 0的字符 n (0 \0nn 带有八进制值 0的字符 nn (0 \0mnn
2018-01-08 15:58:08 654
PyQt4安装包
2017-06-27
Galago开源搜索引擎
2016-05-25
磁盘分区助手PA5.2_Portable
2015-06-02
概率问题为什么 0<=P(X=a|Y=b)<=P(X=a)<=1 不正确??
2017-03-28
Java中接口是Object类的子类吗?
2016-04-27
哪位来解释下GitHub 网站怎么用?
2016-04-13
TA创建的收藏夹 TA关注的收藏夹
TA关注的人