2021-04-16

?vssyu

于 2021-04-16 23:49:02 发布

阅读量71

点赞数

本文链接：https://blog.csdn.net/vssyu/article/details/115774121

版权

数据分析的一些常用处理

Test_data.isnull().sum()可以查看pandas的数据缺失值
SaleID 0
name 0
regDate 0
model 0
brand 0
bodyType 1413
fuelType 2893
gearbox 1910
power 0
kilometer 0
notRepairedDamage 0
regionCode 0
seller 0
offerType 0
creatDate 0
v_0 0
v_1 0
v_2 0
v_3 0
v_4 0
v_5 0
v_6 0
v_7 0
v_8 0
v_9 0
v_10 0
v_11 0
v_12 0
v_13 0
v_14 0
dtype: int64

missing = Train_data.isnull().sum()
missing = missing[missing > 0]
missing.sort_values(inplace=True)
missing.plot.bar()

在这里插入图片描述

del Train_data["offerType"]

可以删除某一列

Train_data['price'].value_counts()

500 2337
1500 2158
1200 1922
1000 1850
2500 1821
…
25321 1
8886 1
8801 1
37920 1
8188 1
Name: price, Length: 3763, dtype: int64
左边是某一个型号的类型，右边是数量。length是种类。

sns.distplot(Train_data.skew(),color='blue',axlabel ='Skewness')

此代码可以把数据变正太分布
在这里插入图片描述

plt.hist(Train_data['price'], orientation = 'vertical',histtype = 'bar', color ='red')
plt.show()

在这里插入图片描述

plt.hist(np.log(Train_data['price']), orientation = 'vertical',histtype = 'bar', color ='red') 
plt.show()

在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

?vssyu

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

数据的探索性分析（EDA）

Eytins1的博客

03-24

1341

探索性数据分析（EDA）文章目录探索性数据分析（EDA）什么叫探索性数据分析探索性分析的步骤实战案例什么叫探索性数据分析探索性数据分析（Exploratory Data Analysis，简称EDA），摘抄网上的一个中文解释，是指对已有的数据（特别是调查或观察得来的原始数据）在尽量少的先验假定下进行探索，通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。当我们...

Datawhale &天池二手车交易价格预测— Task1 赛题理解 +Task2 数据分析

chutu2018的博客

03-24

1480

二手车交易价格预测— Task1 赛题理解 +Task2 数据分析文章目录： 1 赛题理解二手车交易价格预测是Datawhale与天池联合发起的0基础入门系列赛事第一场 —— 零基础入门数据挖掘之二手车交易价格预测大赛。 1.1 比赛目的赛题以二手车市场为背景，要求选手预测二手汽车的交易价格，这是一个典型的回归问题。通过这道赛题来引导大家走进AI数据竞赛的世界，主要针对于于竞赛新人进行自我...

参与评论您还未登录，请先登录后发表或查看评论

二手车价格预测-EDA数据探索（一）

小白cvnice的博客

03-21

271

EDA之总览数据 ## 基础工具 import numpy as np import pandas as pd import warnings import matplotlib import matplotlib.pyplot as plt import seaborn as snsfrom scipy.special import jnfrom IPython.display import...

零基础入门数据挖掘--二手车交易价格预测之二--数据探索性分析

meili1021的专栏

03-24

181

探索性数据分析的步骤 1、简略观察数据 head() shape 2、数据总览通过describe()来熟悉数据的相关统计量通过info()来熟悉数据类型 3、判断数据缺失和异常查看每列的存在nan情况，pd.isnull().sum() 异常值检测，Train_data['notRepairedDamage'].value_counts() 4、了解预测值的分布总体分布概...

Task2:数据的探索性分析（EDA）

沉梦昂志

03-23

551

Task2:数据的探索性分析（EDA）什么是EDAEDA目标主要工作导入、观察数据数据概况判断数据缺失判断数据异常了解预测值的分布特征分为类别特征和数字特征数字特征分析什么是EDA 探索性数据分析（Exploratory Data Analysis，简称EDA），是指对已有的数据（特别是调查或观察得来的原始数据）在尽量少的先验假定下进行探索，通过作图、制表、方程拟合、计算特征量等手段探索数据的结...

nessus2021-04-16最近漏洞更新包all-2.0.tar.gz

05-16

nessus2021-04-16最近漏洞更新包，以把插件包上传到服务器后，执行/opt/nessus/sbin/nessuscli update 插件包文件路径

Pipeline-Trigger-2021-04-16T03-08-08.065Z:为工具链创建

04-16

标题“Pipeline-Trigger-2021-04-16T03-08-08.065Z:为工具链创建”表明这是一个关于构建自动化流程的项目，可能是一个持续集成/持续部署（CI/CD）的配置文件或者相关脚本，创建于2021年4月16日的特定时间。...

人工智能现状与未来[2021-04-16]（98页）.pdf

05-22

人工智能现状与未来[2021-04-16]（98页）.pdf

クイックノート.one (2021-04-16).one

04-22

my note book

Windows 下的 3264 位调试器 x64_dbg 2.4 2021-04-16 官方中文版.zip

04-22

x64_dbg 中文版功能开源直观和熟悉的新用户界面类似C的表达式解析器 DLL和EXE文件的全功能调试（TitanEngine） IDA般的侧边栏与跳跃箭头 IDA样的指令令牌高亮（高亮寄存器等）存储器映射 ...

零基础入门数据挖掘——EDA数据探索性分析

楚天云

03-24

825

零基础入门数据挖掘——EDA数据探索性分析零基础入门数据挖掘——EDA数据探索性分析EDA简介EDA目标主要内容代码示例载入各种数据科学以及可视化库载入数据总览数据概况判断数据缺失和异常了解预测值的分布特征分为类别特征和数字特征，并对类别特征查看unique分布数字特征分析零基础入门数据挖掘——EDA数据探索性分析本篇博客为参加Datawhale零基础入门数据挖掘-Task2 数据分析课程知识...

pytorch回归实战--基于阿里天池二手车售价预测

weixin_41613259的博客

05-14

1640

这次是学了这么长时间的pytorch想用一下，找了阿里天池的二手车数据竞赛。这里给一个基本版的结果。应该能做到500分，后面换一些特征和随机森林融合的话大概能做的400。参考了论坛里的数据处理方法。 Datawhale 零基础入门数据挖掘-Task3 特征工程一、数据清洗首先导入包 import warnings warnings.filterwarnings('ignore') import pandas as pd import numpy as np import matplotlib.pyp

python缺失值可视化

holal的博客

06-03

2174

以阿里二手车交易价格预测训练数据为例 #coding:utf-8 #导入warnings包，利用过滤器来实现忽略警告语句。 import warnings warnings.filterwarnings('ignore') import pandas as pd import matplotlib.pyplot as plt import missingno as msno ## 1) 载入训练集和测试集； path = 'D:\python_test\二手车价格预测/data/' Train_da

Python语句整理

qq_46047782的博客

06-09

397

1. import pandas as pd import numpy as np 2.载入训练集和测试集 path = './****/' Train_data = pd.read_csv(path+'****', sep=' ') Test_data = pd.read_csv(path+'****', sep=' ') sep是分隔 print('Train data shape:',Train_data.shape) print('TestA data shape:',Test_data.

数据挖掘组队学习打卡——Task2：数据分析

qq_41023125的博客

03-24

621

目录1 EDA目标2 载入需要的库3 载入数据4 数据总览4.1 通过describe()来熟悉数据的相关统计量4.2 通过info()来熟悉数据类型5 判断数据缺失值和异常5.1 查看每列的存在nan情况5.2 可视化看下缺省值5.3 异常值检测6 了解预测值的分布6.1 总体分布概况（无界约翰逊分布等）7 特征分为类别特征和数字特征，并对类别特征查看unique分布8 数字特征分析8.1 相关...

笔记：数据缺失可视化

billgates2020的博客

03-28

531

数据缺失可视化 #coding:utf-8 #导入warnings包，利用过滤器来实现忽略警告语句。 import warnings warnings.filterwarnings(‘ignore’) import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import...

二手车交易赛题理解&EDA

zzd416160489的博客

03-24

157

赛题理解读入数据后，.head()可以查看数据的前几行，从而观察数据大致的样子；不同问题有不同的评价指标，有的可以通过调用第三方库如sklearn，有的则需要自己实现。本地线下有一个明确的指标很重要，因为线上的提交、测试往往都有限制。 EDA EDA的目标： EDA的价值主要在于熟悉数据集，了解数据集，对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使...

EDA学习笔记

qq_38435525的博客

03-24

794

Task 02 EDA：Exploratory Data Anylsis 探索性数据分析是指对已有数据在尽量少的先验假设下通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法; 该方法在上世纪70年代由美国统计学家J.K.Tukey提出。传统的统计分析方法常常先假设数据符合一种统计模型，然后依据数据样本来估计模型的一些参数及统计量，以此了解数据的特征，但实际中往往有很...

缺失值处理，你真的会了吗？

吉姆0818

10-07

1786

缺失值处理是一个数据分析工作者永远避不开的话题，如何认识与理解缺失值，运用合适的方式处理缺失值，对模型的结果有很大的影响。本期Python数据分析实战学习中，我们将详细讨论数据缺失值分析与...