1.数据分析过程常用的数据类型
csv , txt , xls/xlsx , url交互 , 数据库取数
2.csv文件读写
(1)导入库
import pandas as pd
import numpy as np
(2)读取
#方法一
df = pd.read_csv('data.csv') #返回dataframe格式的数据
df.head()
#也可以用read_table来指定分隔符
df1=pd.read_table('data/table.csv', sep=',')
df1.head()
#一个文件不会总是有header row(页首行),读取这样的文件,设定column name
df3=pd.read_csv('data/table.csv', header=None) #此时不包含行标题
df3.head()
#设置列名
df4=pd.read_csv('data/table.csv', names=['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l'])
df4.head()
(3)写入
df.to_csv('data/new_table.csv')
#df.to_csv('data/new_table.csv', index=False) #保存时除去行索引