自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 iterrows根据条件为某列循环赋值 dataframe 根据条件为行赋值

1、dataframe 使用iterrows 根据条件 为新列赋值2、删除一个list中有元素(str)被包含在其他元素中

2022-08-12 22:18:37 1048 1

原创 dataframe处理数据、删除dataframe中的某列、查看dataframe某列是否有空值,查看dataframe中某一列有多少不一样的值,中“时间列”仅保留年月,根据自定义分组

dataframe 处理数据

2022-08-06 15:38:14 900 1

原创 DataWhale一周算法进阶3---模型融合

文章目录一 任务二 代码问题一 任务用你目前评分最高的模型作为基准模型,和其他模型进行stacking融合,得到最终模型及评分果。二 代码import pandas as pd import numpy as npimport sysfrom sklearn.preprocessing import StandardScalerfrom sklearn.linear_model ...

2019-01-09 20:12:23 681 2

原创 DataWhale一周算法进阶2---特征工程(半成品。。继续改进)

文章目录一 任务二 特征工程一 特征工程二 特征选择三 特征选择——IV值四 特征选择——随机森林Reference一 任务特征选择:分别用IV值和随机森林进行特征选择。再用【算法实践】中的7个模型(逻辑回归、SVM、决策树、随机森林、GBDT、XGBoost和LightGBM),进行模型评估。二 特征工程一 特征工程特征工程指的是把原始数据转变为模型的训练数据的过程,它的目的就是获取更...

2019-01-07 21:53:23 331

原创 DataWhale一周算法进阶1---数据预处理(数据探索)

文章目录一 任务二 数据探索一 数据中的变量二 数据预处理导包移除模型无关信息项和status将城市的汉字转为数字缺失值较多的student_feature的处理日期型特征处理其他数值特征的处理三 问题Reference一 任务数据类型转换和缺失值处理(尝试不同的填充看效果)以及及其他你能借鉴的数据探索。建议:将数据探索的过程记录下来,例如:1.为什么要这样转换,转换后对结果有没有影响2...

2019-01-04 20:57:51 471

原创 DataWhale一周算法实践4---模型调优(五折交叉验证实践)

一 本次任务使用网格搜索法对7个模型进行调优(调参时采用五折交叉验证的方式),并进行模型评估,记得展示代码的运行结果二 k折交叉验证&网格搜索法K折交叉验证(k-fold cross validation),将初始采样(样本集X,Y)分割成K份,一份被保留作为验证模型的数据(test set),其他K-1份用来训练(train set)。交叉验证重复K次,每份验证一次,平均...

2018-12-15 16:52:59 6441

原创 DataWhale一周算法实践3---模型评估(accuracy、precision,recall和F-measure、auc值)

文章目录1 参数详解1.1 accuracy1.2 precision1.3 recall1.4 F1-score1.5 auc值1.6 roc曲线2 基于本次项目对6个评分参数的理解3 对于7个模型的6个参数的计算3.1 accuracy3.2 precision3.3 recall3.4 F1-score3.5 auc值3.6 roc曲线4 思考1 参数详解我们在在分类任务时,经常会对模型...

2018-12-13 18:41:54 2153

原创 DataWhale一周算法实践2---模型构建((随机森林、GBDT、XGBoost和LightGBM)

一 参考博客构建随机森林、GBDT、XGBoost和LightGBM这4个模型,评分方式任意。https://blog.csdn.net/w952470866/article/details/78987265 随机森林https://blog.csdn.net/xiaoliuhexiaolu/article/details/80582247 GBDThttps://blog.cs...

2018-12-11 17:07:36 1071

原创 DataWhale一周算法实践1---模型构建(逻辑回归 svm 决策树)

背景背景:报名参加一周带做算法实践的小项目数据:数据是金融数据, 我们要做的是预测贷款用户是否会逾期。表格中, status是标签: 0表示未逾期, 1表示逾期。实验读取数据import pandas as pd# A.读取数据data_all = pd.read_csv('./data_all.csv', encoding='gbk')data_all.head()...

2018-12-09 17:54:31 361

原创 Homebrew安装brew:command not found,及could not symlink XXX,XXX is not writable

一 什么是Homebrew?二 Homebrew的安装步骤三 安装过程中出现的问题    1. 安装命令详解/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"    2.目录 /usr/local/bin 没有在PATH这个环境变量里Warning: /...

2018-05-23 15:43:55 16887 7

原创 百度滴滴京东实习生面试题

1. Linux接触的多吗?2. LInux和MySql的区别?3. 你的项目的前台怎么搭建的?4. Mysql涉及的事务简单的介绍一下?5. 用过javascript,说一下你的轮播图怎么做的?6. 数据库表的查询有几种方式,画一下你的表结构,写一个查询语句?7. Ajax简单介绍一下,.post和.get的区别,还有其他的方法吗,他们的区别.8. Session和c

2018-05-22 22:51:16 538 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除