1.通过字典dictionary创建Series
import pandas as pd
data={
'a':0,'b':1,'c':2}
s=pd.Series(data)
s
2.通过数组array创建Series
import numpy as np
import pandas as pd
array=np.arange(10,16)
s=pd.Series(array,index=list('abcdeg'))
s
3.从series中找出包含两个以上元音字母的单词:
4.如何计算两个系列之间的欧氏距离?
import pandas as pd
p = pd.Series([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
q = pd.Series([10, 9, 8, 7, 6, 5, 4, 3, 2, 1])
sum((p-q)**2)**0.5
5.DataFrame读CSV文件操作,
1 读取csv时只读取某列?
2 读取dataframe每列的数据类型?
3 读取dataframe的行数和列数?
4 从dataframe中找到a列最大值对应的行?
5 在dataframe中根据行列数读取某个值?
6 在dataframe中根据index和列名称读取某个值?
import pandas as pd
fpath = 'test.csv'
df = pd.DataFrame({
'a':range(100),
'b':np.random.choice(['apple','banana','carrot'],100)
})
df.to_csv(fpath,index=None)
x=pd.read_csv('test.csv') #导入文件
x['a']#读a列
y=pd.read_csv(fpath,usecols=['a']).head()#读a列
x['b']#读b列
x[['a']]#读取dataframe每列的数据类型
x[['b']]#读取dataframe每列的数据类型
x.dtypes #数据类型
a=x.shape[