- 博客(8)
- 收藏
- 关注
原创 Pandas基础—变形
4 变形透视表其他变形方法哑变量与因子化一 、透视表1.pivot一般状态下,数据在Dataframe会以压缩(stacked)状态存放,例如上面的Gender,两个类别被叠在一列中,pivot函数可将某一列作为新的cols:import numpy as npimport pandas as pddf = pd.read_csv('data/table.csv')df.h...
2020-04-28 20:52:01 177
原创 Pandas基础
分组SAC过程groupby 函数聚合、过滤和变换apply函数1 SAC过程1.内涵SAC指的是分组操作中的split-apply-combine过程其中split指基于某一些规则,将数据拆成若干组,apply是指对每一组独立地使用函数,combine指将每一组的结果组合成某一类数据结构2.apply过程在该过程中,我们实际往往会遇到四类问题:¶整合(Aggregati...
2020-04-26 23:23:48 131
原创 索引
第二章 索引1.单级索引2.多级索引3.索引设定4.常用索引型函数5.重复元素处理6.抽样函数`#### 1 单级索引loc方法、iloc方法、操作符最常用的索引方法可能就是这三类,其中iloc表示位置索引,loc表示标签索引,[]也具有很大的便利性,各具有特点先建立一个数据集import numpy as npimport pandas as pddf = pd.r...
2020-04-23 22:56:41 308
原创 Pandas基础
Pandas基础文件读取与写入基本数据结构常用基本函数排序1.文件读取与写入1.1 读取csv格式df = pd.read_csv('data/table.csv')df.head()txt格式df_txt = pd.read_table('data/table.txt') #可设置sep分隔符参数df_txtxls或xlsx格式需要安装xlrd包df_excel...
2020-04-20 21:00:42 119
原创 打卡 Datawhale 零基础入门数据挖掘-Task5 模型融合
打卡 Datawhale 零基础入门数据挖掘-Task5 模型融合Tip:此部分为零基础入门数据挖掘的 Task5 模型融合 部分,带你来了解各种模型结果的融合方式,在比赛的攻坚时刻冲刺Top,欢迎大家后续多多交流。赛题:零基础入门数据挖掘 - 二手车交易价格预测地址:https://tianchi.aliyun.com/competition/entrance/231784/introduc...
2020-04-04 21:37:45 335
原创 建模调参——天池Datawhale零基础入门数据挖掘- 二手车交易价格预测
Datawhale零基础入门数据挖掘- 二手车交易价格预测内容介绍1.线性回归模型线性回归对于特征的要求;处理长尾分布理解线性回归模型;2.模型性能验证评价函数与目标函数交叉验证方法留一验证方法针对时间序列问题的验证绘制学习率曲线绘制验证曲线3.嵌入式特征选择Lasso回归Ridge回归决策树4.模型对比常用线性模型常用非线性模型5.模型调参...
2020-04-01 00:20:56 394
原创 Task 3 特征工程 Datawhale零基础入门数据挖掘- 二手车交易价格预测
Task 3 特征工程 Datawhale零基础入门数据挖掘- 二手车交易价格预测Tips:此部分为零基础入门数据挖掘的Task3特征工程部分,主要包含各种特征工程以及分析方法赛题:零基础入没人能数据挖掘-二手车交易预测价格地址:https://tianchi.aliyun.com/competition/entrance/231784/introduction?spm=5176.12281...
2020-03-27 14:48:49 249
原创 打卡—Datawhale 零基础入门数据挖掘-Task2:数据的探索性分析(EDA)
打卡—Datawhale 零基础入门数据挖掘-Task2:数据的探索性分析(EDA)Tip:此部分为零基础入门数据挖掘的 Task2 EDA-数据探索性分析 部分,带你来了解数据,熟悉数据,和数据做朋友,欢迎大家后续多多交流。赛题:零基础入门数据挖掘 - 二手车交易价格预测地址:https://tianchi.aliyun.com/competition/entrance/231784/intr...
2020-03-22 13:41:56 336
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人