pandas学习-第1章 pandas基础
文件读取与写入
import pandas as pd
import numpy as np
# 读取
df = pd.read_csv('data/table.csv')
df_txt = pd.read_table('data/table.txt')
df_excel = pd.read_excel('data/table.xlsx')
pd.read_csv('data/Kobe_data.csv',index_col='shot_id').head() #index_col的作用是将某一列作为行索引
# 写入
df.to_csv('data/new_table.csv')
df.to_excel('data/new_table2.xlsx', sheet_name='Sheet1')
Series和DataFrame常见属性和方法
Series常见属性有:
- values
- index
- name
- dtype
Series常见方法:
# 创建一个Series
s = pd.Series(np.random.randn(5),
index=['a','b','c','d','e'],
name='这是一个Series',
dtype='float64')
# 访问属性
s.valuses
s.name
s.index
s.dtype
# 取出某一个元素
s['a']
# 调用方法
s.mean()
# 查看可以调用的方法
print([attr for attr in dir(s) if not attr.startswith('_')])
DataFrame常见属性有:
- index(行)
- columns(列)
- values
- shape
DataFrame常见方法:
#