- 博客(6)
- 收藏
- 关注
原创 Task2——索引
2.1单级索引df.loc[1103] #单行索引df.loc[[1102,2304]] #多行索引loc按索引取出value,iloc是按行列序号取出value555,pycharm一开电脑就崩,我这台小破机实在是有点抵不住了https://github.com/datawhalechina/joyful-pandas/blob/master/%E7%AC%AC2%E7%AB%A0%...
2020-04-23 22:11:50 90
原创 pandas基础
一、数据读写import pandas as pdimport numpy as np#查看Pandas版本pd.__version__ #数据读取df = pd.read_csv('data/table.csv')df.head()df_txt = pd.read_table('data/table.txt') #可设置sep分隔符参数df_txt#需要安装xlrd包...
2020-04-20 20:47:19 110
原创 Task5-模型融合
将多个model进行融合,看是否可以得到一个性能更好的model1)直接对预测结果进行平均## 生成一些简单的样本数据,test_prei 代表第i个模型的预测值test_pre1 = [1.2, 3.2, 2.1, 6.2]test_pre2 = [0.9, 3.1, 2.0, 5.9]test_pre3 = [1.1, 2.9, 2.2, 6.0]# y_test_true 代表...
2020-04-04 17:08:51 186
原创 Task4-建模调参
###通过调整数据类型,减少内存,节省空间#改变特定数据的存储格式def reduce_mem_usage(df): """ iterate through all the columns of a dataframe and modify the data type to reduce memory usage. """ start_mem = df....
2020-03-31 13:17:32 135
原创 Task3-特征工程
1)删除异常值#删除异常值def outliers_proc(data, col_name, scale=3): """ 用于清洗异常值,默认用 box_plot(scale=3)进行清洗 :param data: 接收 pandas 数据格式 :param col_name: pandas 列名 :param scale: 尺度 :return...
2020-03-28 20:27:42 126
原创 EDA-Task2
EDA-task2#导入warnings包,利用过滤器来实现忽略警告语句。import warningswarnings.filterwarnings('ignore')import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport missingno ...
2020-03-24 16:12:03 107
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人