自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 python 矩阵旋转

逆时针旋转90°#逆时针旋转90°matrix = list(zip(*matrix))[::-1]#顺时针旋转90°matrix = list(zip(*(matrix[::-1])))

2020-07-30 10:11:03 323

原创 Metabase、FineBI安装与简单评测

Metabase一、安装win10系统https://www.cnblogs.com/cuiyubo/p/11448815.html二、效果三、感受优点:安装简单快捷,上手简单,出图快,基本不用啥教程,图符合自己审美缺点:相比其他BI,可视化方法不是太多,如果丰富一下可视化方法就好了metabase与其他主流开源BI对比:httpsFineBI一、安装官网下载,注册激活二、效果做了一个小图效果图(来自软件自带实例)三、感受优点:可视化方法丰富不足:上手需要时间,相

2020-06-02 09:26:34 1021 1

原创 Pseudo Labeling标签平滑

https://www.kaggle.com/cdeotte/pseudo-labeling-qda-0-969

2020-04-26 15:37:10 314

原创 特征工程技巧

https://www.kaggle.com/c/ieee-fraud-detection/discussion/108575

2020-04-26 08:53:29 169

原创 PR曲线代码

from sklearn.metrics import roc_auc_scoredef get_pr(oof,target): pos = target[target==1] threshold = np.sort(oof)[::-1] y = target[oof.argsort()[::-1]] y=y.reset_index(drop=True) ...

2019-06-05 16:02:23 3476 4

原创 dataframe一列数据从object转为float

data['note_n'] = pd.to_numeric(data['note_n'])

2018-12-12 12:28:40 18354

原创 特征工程前的数据可视化技巧

以泰坦尼克乘客生还数据为例。读取数据后:data.head()data.describe()data.info()观察数据大概情况。plt.figsize=(16,8)sns.countplot('Survived',data=data)plt.title('Survived')sex:f,ax=plt.subplots(1,2,figsize=(18,8))data...

2018-12-06 18:04:20 620

转载 (转)XGBoost参数调优完全指南

原文地址:https://www.2cto.com/kf/201607/528771.html简介如果你的预测模型表现得有些不尽如人意,那就用XGBoost吧。XGBoost算法现在已经成为很多数据工程师的重要武器。它是一种十分精致的算法,可以处理各种不规则的数据。构造一个使用XGBoost的模型十分简单。但是,提高这个模型的表现就有些困难(至少我觉得十分纠结)。这个算法使用了好几个参数。所...

2018-12-05 12:34:39 253

原创 sklearn中的train_test_split(数据分割)、preprocessing(归一化)、cross_val_score(交叉验证)

1、train_test_split(数据分割):from sklearn.model_selection import train_test_splitX=np.random.randint(0,100,(10,4))y=np.random.randint(0,3,10)y.sort()print('样本:')print(X)print('标签:')print(y)# 分...

2018-11-17 12:36:48 5011

原创 sklearn入门

sklearn使用流程:准备数据集→选择类型→训练模型→测试模型from sklearn import datasetsiris=datasets.load_iris()digits=datasets.load_digits()#查看数据集#irisprint(iris.data)print(iris.data.shape)print(iris.target_names) ...

2018-11-17 12:28:40 182

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除