数据规整化:合并、清理、过滤

合并数据集:.merge()、.concat()等方法,类似于SQL或其他关系型数据库的连接操作。concathttps://blog.csdn.net/ly_ysys629/article/details/73849543

2018-03-28 16:40:57

阅读数 73

评论数 0

labelencoding onehot

Label encoding在某些情况下很有用,但是场景限制很多。比如有一列 [dog,cat,dog,mouse,cat],我们把其转换为[1,2,1,3,2]。这里就产生了一个奇怪的现象:dog和mouse的平均值是cat。而且像decision tree,random forest和xgbo...

2018-03-26 19:52:46

阅读数 66

评论数 0

机器学习实战 adaboost学习

建立决策树首先得建立树桩,单层决策树(仅基于单个特征来做决策)transpose转置可以对数组进行重置,返回的是源数据的视图(不会进行任何复制操作)。def plotimage(dataMat, labelMat): matplus = [] matmini = [] fo...

2018-03-16 15:25:48

阅读数 74

评论数 0

FM, deepFM综述

https://tracholar.github.io/machine-learning/2017/03/10/factorization-machine.html

2018-03-14 21:10:40

阅读数 139

评论数 0

C++ unsighed

无符号数,作用为存储的数据范围大  unsigned char是无符号字节型,char类型变量的大小通常为1个字节(1字节=8个位),且属于整型。整型的每一种都有无符号(unsigned)和有符号(signed)两种类型(float和double总是带符号的),在默认情况下声明的整型变量都是有符号...

2018-03-13 17:20:28

阅读数 147

评论数 0

C++ 栈

首先看一下原c++栈的方法的基本用法: push(): 向栈内压入一个成员;pop(): 从栈顶弹出一个成员;empty(): 如果栈为空返回true,否则返回false;top(): 返回栈顶,但不删除成员;size(): 返回栈内元素的大小...

2018-03-13 16:40:43

阅读数 80

评论数 0

python

del:它是根据索引(元素所在位置)来删除举例说明:>>> str=[1,2,3,4,5,2,6]>>> del str[1]>&amp...

2018-03-13 14:41:33

阅读数 51

评论数 0

matlab读取.txt格式的数据格式

a=textread('testingset.txt');直接将数据转换为.data格式matlab 在linux下使用的时候,

2018-03-09 20:54:40

阅读数 285

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭