打算从基础开始学习数据分析,给自己一个整理内容和学习消化的时间,所以,这也将成为我的学习笔记。
1. 数据描述
原始数据集包括六个属性:Gender,Length,Diameter,Height,Weight,Rings:
- Gender :M (male), F (female), I (infant)
- Length:最长外壳尺寸(毫米)
- Diameter:垂直于长度的直径(毫米)
- Height:带壳肉的高度(毫米)
- Weight:整只鲍鱼的重量(克)
- Rings:确定鲍鱼的实际年龄,有点像估计一棵树的年龄。 随着鲍鱼的生长,在鲍鱼壳中形成环,通常以每年一环的速度形成。
2. 数据读取
2.1 导入库
import pandas as pd
2.2 读取文件
data = pd.read_csv("abalone.csv")
2.3 查看数据表信息
先来一波儿基础操作,热热身~
data.columns # 查看数据列名
data.shape # 查看数据框中有多少个观测值
data.head(4) # 打印数据的前四行
data.head(4)['Rings'] # 打印前四行中Rings的值
data.tail(3) # 提取数据集的最后三行
data.tail(3)['Weight'] # 输出最后三行鲍鱼的重量
data