机器学习
erinapple
这个作者很懒,什么都没留下…
展开
-
C++ 栈
首先看一下原c++栈的方法的基本用法: push(): 向栈内压入一个成员;pop(): 从栈顶弹出一个成员;empty(): 如果栈为空返回true,否则返回false;top(): 返回栈顶,但不删除成员;size(): 返回栈内元素的大小...原创 2018-03-13 16:40:43 · 182 阅读 · 0 评论 -
LR的并行化
LR的并行化主要从样本数量以及样本维度两个方面分析,将样本形成的矩阵形式,分解为按照行分,列分。 (之所以按照列分,是因为点乘加和等运算)思考:用LR需要做归一化处理,而XGBOOST等树模型在做分类问题不需要。因为LR需要特征之间的权重加和表示,特征的量级不同会影响到实验结果,但是XGBOOST主要是统计信息,影响较小,故而可以不用归一化。同理onehot等特征处理也是这个道理。在XGBOOST...原创 2018-05-15 11:24:00 · 1591 阅读 · 1 评论 -
reset_index()
对pandas重置reset_index()df = df.reset_index(drop=True)reset_index将索引恢复成数据列后,该列的名称显示为index,但是我用df['index']提取这列数据时,却提示KeyError: 'index'。请问要如何才能取到这列数,以及如何向这列赋予一个新的列名?谢谢df.rename({"原列名":"新列名"}, inplace=True...原创 2018-05-13 21:14:00 · 10061 阅读 · 2 评论 -
机器学习sklearn 以及流程方法
http://python.jobbole.com/86910/在机器学习和数据挖掘的应用中,scikit-learn是一个功能强大的python包。在数据量不是过大的情况下,可以解决大部分问题。学习使用scikit-learn的过程中,我自己也在补充着机器学习和数据挖掘的知识。这里根据自己学习sklearn的经验,我做一个总结的笔记。另外,我也想把这篇笔记一直更新下去。1 scikit-lear...转载 2018-05-13 15:20:34 · 5836 阅读 · 2 评论 -
python 中的map fit apply
map只对一个序列而言的。apply只是整个dataframe上任意一列或多列,或者一行或多行, 即可在任意轴操作。 在一列使用apply时,跟map效果一样。 多列时只能用apply。applymap 在整个dataframe的每个元素使用一个函数。 fit()可以说是调用的通用方法。fit(X),表示用数据X来训练某种模型。 函数返回值一般为调用fit方法的对象本身.fit(x,y)传两个参数...原创 2018-05-13 14:42:44 · 546 阅读 · 0 评论 -
Unix时间戳转换(python)
Unix时间戳转换(python)# -*- coding: utf-8 -*- import time def timestamp_datetime(value): format = '%Y-%m-%d %H:%M:%S' # value为传入的值为时间戳(整形),如:1332888820 value = time.localtime(value) ## 经过localt...转载 2018-05-13 10:10:26 · 855 阅读 · 0 评论 -
数据重新排列
删除行索引重排:ser.reset_index(drop = True)df.reset_index(drop = True)------------------------------------------直接修列索引:df = pd.DataFrame(df,columns = ['One','Two','Three'])pandas contact 之后,一定要记得用reset_index...原创 2018-05-12 17:44:06 · 790 阅读 · 0 评论 -
list 求属性名
list()当输入是元组时,可以将其转化为list。而在处理读入的特征时候,可以用list获取属性特征。元组;Python的元组与列表类似,不同之处在于元组的元素不能修改。元组使用小括号,列表使用方括号。元组创建很简单,只需要在括号中添加元素,并使用逗号隔开即可。如下实例:tup1 = ('physics', 'chemistry', 1997, 2000);tup2 = (1, 2, 3, 4...原创 2018-05-12 17:15:21 · 591 阅读 · 0 评论 -
大数定律 以及中心极限定律
大数定律:如果对任何 ε > 0, 都有limn→∞P(|ξn − ξ| ≥ ε) = 0,那么我们就称随机变量序列 {ξn, n ∈ N} 依概率收敛到随机变量 ξ, 记为 ξnp→ ξ.中心极限定理:定理 2. 设 {Xn} 为 i.i.d 的随机变量序列,具有公共的数学期望 µ和方差 σ2. 则 X1 +· · ·+Xn 的标准化形式 √1nσ(X1 +· · ·+Xn −nµ)满足中...原创 2018-05-10 12:59:45 · 430 阅读 · 0 评论 -
xgboost 输出重要特征
def ceate_feature_map(file_name,features): outfile = open(file_name, 'w') for i, feat in enumerate(features): outfile.write('{0}\t{1}\tq\n'.format(i, feat)) #feature type, use...转载 2018-10-26 15:34:02 · 3118 阅读 · 0 评论