python | 简单的数据分析

本文介绍了使用Python进行数据分析的一个案例,包括设置工作目录、加载数据、查看数据的基本信息,如数据维度、数据类型,并展示了数据中存在的一些异常值、空值情况,以及各列取值的种类和频率。还提到了后续的数据处理步骤,如填充缺失值和进行One-Hot编码。
摘要由CSDN通过智能技术生成

做数据分析的两大利器:python和R语言,这里介绍一个我用python学习的案例

第一步,设置工作目录

#encoding:utf8
import os
os.chdir("G:\\Anaconda3\\Scripts\\lecture01\\Feature_engineering_and_model_tuning\\Feature-engineering_and_Parameter_Tuning_XGBoost")

第二步,加载包

import pandas as pd
import numpy as np
%matplotlib inline

第三步,载入数据

#载入数据:
train = pd.read_csv('Train.csv',encoding = "ISO-8859-1")
test = pd.read_csv('Test.csv',encoding = "ISO-8859-1")

第四步,查看数据

  • 维数
train.shape, test.shape

((87020, 26), (37717, 24))

  • 数据类型
#看看数据的基本情况
train.dtypes

ID object
Gender object
City object
Monthly_Income int64
DOB object
Lead_Creation_Date object
Loan_Amount_Applied float64
Loan_Tenure_Applied float64
Existing_EMI float64
Employer_Name object
Salary_Account object
Mobile_Verifie

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值