数据加载及探索性数据分析

这篇博客介绍了使用Python进行数据加载和初步探索性数据分析的过程,包括读取CSV文件,查看数据基本信息,处理缺失值,筛选特定数据,以及进行简单的统计分析和数据可视化。示例中使用了pandas库,涉及数据切片、重命名列、删除列、数据统计以及数据排序等操作。
摘要由CSDN通过智能技术生成

第二期组队学习开始啦,这次在python基础上报名了动手数据分析,加油呀!希望在产出上相较第一期有一些进步~学习内容概括从数据的导入到观察数据特征到筛选特定目标数据,包括删除列显示特定位置的数据结果,获得数据的基本统计信息等等。
第一次的task难度不高,如果能附上数据可视化的话,会使得基本统计数据更直观。程序和结果import numpy as np
import pandas as pd

df = pd.read_csv(‘D:\pythondata\train.csv’)
df.head(3)

chunker = pd.read_csv(‘D:\pythondata\train.csv’, chunksize=1000)
df = pd.read_csv(‘D:\pythondata\train.csv’,
names=[‘乘客ID’,‘是否幸存’,‘舱位等级’,‘姓名’,‘性别’,‘年龄’,‘兄弟姐妹’,‘父母子女个数’,‘船票信息’,‘票价’,‘客舱’,‘登船港口’],index_col=0,header=0)
print(df.head())
df.info()#查看数据基本信息
print(df.head(10))
print(df.tail(15))
#查看前10和后15
print(df.isnull().head(10))
#检查数据是否为空,空的话返回True,不空返回False
df.to_csv(‘D:\pythondata\train_chinese.csv’,encoding=‘utf-8’)#保存
1234567891011121314151617注释:1.在路径中尽量不要出现中文,路径用“\”更不容易出错。
2.这些在遇到和内存一样大的数据时读取起来会比较困难

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值