自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Transfer

机器要学习

  • 博客(4)
  • 资源 (9)
  • 收藏
  • 关注

原创 python实现one-hot编码

''' one-hot编码 '''from sklearn.preprocessing import OneHotEncoder from sklearn.preprocessing import LabelEncoderfrom sklearn.preprocessing import LabelBinarizerfrom sklearn.preprocessing import Mul...

2018-04-16 23:33:37 7480 2

原创 pandas常用数据预处理方法

数据样式python代码df = pd.read_csv('../dataset/ai_risk_train/train_auth_info.csv', low_memory=False)# print(df)'''查看数据的基本信息'''print(df.info())'''整个数据的整体的分布'''print(df.describe())'''查看数据集的空值,或者说是缺失值'''pri

2018-04-10 12:52:55 1887

原创 提取排序特征(python实现)

Series.rank()obj = pd.Series([7, -5, 7, 4, 2, 0, 4])print(type(obj.rank()))print(obj.rank())print (obj.rank(method = 'first',ascending=False))print (obj.rank(method = 'max',ascending=False))print

2018-04-07 17:48:21 1700

原创 求两个pandas.Series的交/并集

名称 功能 intersection 交集 union 并集代码演示>>> import pandas as pd>>> s1 = pd.Series([4,5,6,20,42])>>> s2 = pd.Series([1,2,3,5,42])# 求交集 #>>> pd.Series(list(set(s1).intersection(set(s2))))0 42

2018-04-01 16:28:43 15073 1

LogisticRegression 参数详解

这个文件是对python sklearn库里面的Logistic Regression模型的参数解释。

2018-09-21

cutemarked

cutemarked是一款易操作、多功能的、开源的MarkDown编辑器。

2018-01-17

lightGBM.whl

LightGBM 是一个梯度 boosting 框架,使用基于学习算法的决策树。它可以说是分布式的,高效的.

2017-12-21

windows cp.exe

用过Linux的用户对这个cp命令很熟悉,但windows下却没有这个命令,把它拷贝到windows\system32目录下,就可以通过命令行来调用了。

2017-10-05

winutils.exe 32位

该可执行文件可用于解决IDEA缺少winutils.exe的编译问题,当初我就遇到这个问题然后到处找资源,实属不易啊。

2017-09-05

mysql-connector-java-5.1.6-bin.jar

JDBC,配置sqoop时使用

2017-08-17

MySQL源码包

附上安装教程:http://blog.csdn.net/roger_royer/article/details/76403917

2017-08-17

WinSCP_5.9.3.7136

该工具是与远程服务器交互文件的工具

2017-07-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除