自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 Task2——索引

2.1单级索引df.loc[1103] #单行索引df.loc[[1102,2304]] #多行索引loc按索引取出value,iloc是按行列序号取出value555,pycharm一开电脑就崩,我这台小破机实在是有点抵不住了https://github.com/datawhalechina/joyful-pandas/blob/master/%E7%AC%AC2%E7%AB%A0%...

2020-04-23 22:11:50 66

原创 pandas基础

一、数据读写import pandas as pdimport numpy as np#查看Pandas版本pd.__version__ #数据读取df = pd.read_csv('data/table.csv')df.head()df_txt = pd.read_table('data/table.txt') #可设置sep分隔符参数df_txt#需要安装xlrd包...

2020-04-20 20:47:19 101

原创 Task5-模型融合

将多个model进行融合,看是否可以得到一个性能更好的model1)直接对预测结果进行平均## 生成一些简单的样本数据,test_prei 代表第i个模型的预测值test_pre1 = [1.2, 3.2, 2.1, 6.2]test_pre2 = [0.9, 3.1, 2.0, 5.9]test_pre3 = [1.1, 2.9, 2.2, 6.0]# y_test_true 代表...

2020-04-04 17:08:51 145

原创 Task4-建模调参

###通过调整数据类型,减少内存,节省空间#改变特定数据的存储格式def reduce_mem_usage(df): """ iterate through all the columns of a dataframe and modify the data type to reduce memory usage. """ start_mem = df....

2020-03-31 13:17:32 102

原创 Task3-特征工程

1)删除异常值#删除异常值def outliers_proc(data, col_name, scale=3): """ 用于清洗异常值,默认用 box_plot(scale=3)进行清洗 :param data: 接收 pandas 数据格式 :param col_name: pandas 列名 :param scale: 尺度 :return...

2020-03-28 20:27:42 112

原创 EDA-Task2

EDA-task2#导入warnings包,利用过滤器来实现忽略警告语句。import warningswarnings.filterwarnings('ignore')import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport missingno ...

2020-03-24 16:12:03 94

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除