数据分析第一节_数据加载和初步认识

最新推荐文章于 2024-06-28 09:48:33 发布

??�??o

最新推荐文章于 2024-06-28 09:48:33 发布

阅读量173

点赞数

文章标签： python 数据分析

本文链接：https://blog.csdn.net/KuiGuniang/article/details/108418605

版权

前置条件：导入numpy和pandas包；

import numpy as py
import pandas as pd

df=pd.read_csv("train.csv")
df_chunker=pd.read_csv("train.csv",chunksize=1000)
#逐块读取的好处；

df=pd.read_csv("train.csv")
df_abso=pd.read_csv("C://administrator/myPython/train.csv")

df=pd.read_csv("train,csv")
df_modify=pd.read_csv("train.csv",names=["乘客ID","姓名"],index_col="乘客ID，header=0）
#header设置为0的原因；

df.to_csv("train_chaniese.csv")

#默认是5行
df.head()
df.tail()
df.index
df.columns

#返回整个表的布尔类型，后可接.head()查看前几列；
df.isnull()
df.info()
df.describe()

#有两种方式
df.客舱
or
df["客舱"]

df.loc[[1],["姓名","客舱"]]
or
df.iloc[[1,2],[2,4]]

max(df["兄弟姐妹个数"]+df["父母子女个数"])
min(df["兄弟姐妹个数"]+df["父母子女个数"])

df.drop(["姓名"])
df.drop(["姓名","客舱"],axis=1)
df.[df["年龄"]<10]

df.sort_values(by="年龄",ascending=False)

关注