自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 No module named 'sklearn.cross_validation

银行卡诈骗中的一段代码:from sklearn.cross_validation import KFold, cross_val_scoredef printing_Kfold_scores(x_train_data,y_train_data): fold =KFold(len(y_train_data),5,shuffle=False) for iteration, ...

2020-04-13 11:46:04 150

原创 模型融合

import pandas as pdimport numpy as npimport warningsimport matplotlibimport matplotlib.pyplot as pltimport seaborn as snswarnings.filterwarnings('ignore')%matplotlib inlineimport itertoolsi...

2020-04-04 16:56:02 215

原创 建模调参

读取数据`df_train = pd.read_csv('used_car_train_20200313.csv', sep=' ')df_test = pd.read_csv('used_car_testA_20200313.csv', sep=' ')一种减少数据占用内存的方法def reduce_mem_usage(df): """ 通过调整数据类型,帮助我们减少数...

2020-04-01 17:09:28 209

原创 二手车特征工程

常见的特征工程包括:异常处理: 通过箱线图(或 3-Sigma)分析删除异常值; BOX-COX 转换(处理有偏分布); 长尾截断; 特征归一化/标准化: 标准化(转换为标准正态分布); 归一化(抓换到 [0,1] 区间); 针对幂律分布,可以采用公式:l o g ( 1 + x 1 + m e d i a n )数据分桶: 等频分桶; 等距分桶; Best-KS 分桶(类似利用基尼指数进行二...

2020-03-28 09:50:50 218

原创 二手车EDA

EDA目标:EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让接下来的预测问题更加可靠。完成对于数据的探索性分析,并对于数据进行一些图表或者文字总结并打卡。代...

2020-03-23 21:15:57 112

转载 kmeans算法代码

import randomfrom sklearn import datasetsimport numpy as npimport matplotlib.pyplot as pltfrom mpl_toolkits.mplot3d import Axes3D%matplotlib inline# 正规化数据集 Xdef normalize(X, axis=-1, p=2): ...

2019-12-11 17:04:34 757 1

原创 np.random.choice方法

def choice(a, size=None, replace=True, p=None)#表示从a中选取size个数,replace 代表的意思是抽样之后还放不放回去,如果是False的话,#那么通一次挑选出来的数都不一样,如果是True的话, 有可能会出现重复的,因为前面的抽的放回去了。#p表示每个元素被抽取的概率,如果没有指定,a中所有元素被选取的概率是相等的。np.random...

2019-12-02 09:18:28 160

原创 np.insert的用法

np.insert(arr, obj, values, axis)#arr原始数组,可一可多,obj插入元素位置,values是插入内容,axis是按行按列插入。插入的数组是一维的import numpy as npa = np.array([1,4,6,5,6,8])np.insert(a,0,9)array([9, 1, 4, 6, 5, 6, 8])#插入元素都是在所给位置之...

2019-11-27 10:23:13 20508 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除