1 第一章:数据载入及初步观察
import numpy as np
import pandas as pd
1.4.1 任务一:pandas中有两个数据类型DateFrame和Series,通过查找简单了解他们。然后自己写一个关于这两个数据类型的小例子🌰[开放题]
a = pd.Series(np.random.randn(5), index=['a','b','c','d', 'e'])
a
a 1.746811 b -0.741633 c -0.638711 d -0.223092 e -0.025310 dtype: float64
s = pd.Series({'b':1, 'a':0, 'c':2})
s
b 1 a 0 c 2 dtype: int64
d={'one':pd.Series([1, 2, 3],index=['a', 'b', 'c']),'two':pd.Series([4, 5, 6, 7], index=['a', 'b', 'c', 'd'])}
d
{'one': a 1 b 2 c 3 dtype: int64, 'two': a 4 b 5 c 6 d 7 dtype: int64}
df = pd.DataFrame(d)
df
1.4.2 任务二:根据上节课的方法载入"train.csv"文件
df