数据加载及探索性数据分析

最新推荐文章于 2022-09-29 10:27:15 发布

COMME des FUCKDOWN*

最新推荐文章于 2022-09-29 10:27:15 发布

阅读量270

点赞数

文章标签： python

本文链接：https://blog.csdn.net/weixin_43489260/article/details/108110699

版权

这篇博客介绍了使用Python进行数据加载和初步探索性数据分析的过程，包括读取CSV文件，查看数据基本信息，处理缺失值，筛选特定数据，以及进行简单的统计分析和数据可视化。示例中使用了pandas库，涉及数据切片、重命名列、删除列、数据统计以及数据排序等操作。

摘要由CSDN通过智能技术生成

第二期组队学习开始啦，这次在python基础上报名了动手数据分析，加油呀！希望在产出上相较第一期有一些进步~学习内容概括从数据的导入到观察数据特征到筛选特定目标数据，包括删除列显示特定位置的数据结果，获得数据的基本统计信息等等。
第一次的task难度不高，如果能附上数据可视化的话，会使得基本统计数据更直观。程序和结果import numpy as np
import pandas as pd

df = pd.read_csv(‘D:\pythondata\train.csv’)
df.head(3)

chunker = pd.read_csv(‘D:\pythondata\train.csv’, chunksize=1000)
df = pd.read_csv(‘D:\pythondata\train.csv’,
names=[‘乘客ID’,‘是否幸存’,‘舱位等级’,‘姓名’,‘性别’,‘年龄’,‘兄弟姐妹’,‘父母子女个数’,‘船票信息’,‘票价’,‘客舱’,‘登船港口’],index_col=0,header=0)
print(df.head())
df.info()#查看数据基本信息
print(df.head(10))
print(df.tail(15))
#查看前10和后15
print(df.isnull().head(10))
#检查数据是否为空，空的话返回True,不空返回False
df.to_csv(‘D:\pythondata\train_chinese.csv’,encoding=‘utf-8’)#保存
1234567891011121314151617注释：1.在路径中尽量不要出现中文，路径用“\”更不容易出错。
2.这些在遇到和内存一样大的数据时读取起来会比较困难

最低0.47元/天解锁文章

COMME des FUCKDOWN*

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据加载及探索性数据分析

第二期组队学习开始啦，这次在python基础上报名了动手数据分析，加油呀！希望在产出上相较第一期有一些进步~学习内容概括从数据的导入到观察数据特征到筛选特定目标数据，包括删除列显示特定位置的数据结果，获得数据的基本统计信息等等。第一次的task难度不高，如果能附上数据可视化的话，会使得基本统计数据更直观。程序和结果import numpy as npimport pandas as pddf = pd.read_csv(‘D:\pythondata\train.csv’)df.head(3)ch
复制链接

扫一扫