Pandas基础(一)
导入pandas库
import pandas as pd
import numpy as np
pd.__version__ ##查看pandas版本
文件的读取和写入
(1)读取CSV格式
df_csv = pd.read_csv('data/table.csv")
df_csv.head()
(2)读取txt格式
df_txt = pd.read_table('data/table.txt')
df_txt.head()
(3)读取xls或xlsx格式
##需要安装xlrd包
df_xls = pd.read_excel('data/table.xlsx')
de_xls.head()
(4)写入csv和xlsx格式
df_csv.to_csv('data/newtable.csv')
df_xls.to_excel('data/newtable2.xlsx', sheet_name='sheet1')
基本数据结构
1、Series
(1)创建一个Series
对于一个Series,要明确四大属性,值(value)、索引(index)、名字(name)、类型(dtype)
s = pd.Series(np.random.randn(5),index=['a','b','c','d','e'],name='这是一个Series',dtype='float64') #注意S是大写
(2)访问Series的属性
s.values
s.name
s.index
s.dtype
(3)取出Seires中的某一个元素
s['a']
2. Dataframe
(1)创建一个Dataframe
注意D和F都是大写,index表示索引,每一列对应的值的表示方法是:’col1‘:list
df = pd.DataFrame({
'col1':list(