从Excel中导入
这里我们用到的包:pandas
- 使用excelfile类
xls = pd.ExcelFile('data3.xls')
data = xls.parse('Sheet1', index_col=None, na_values=['NA'])
data
- 使用read_excel函数
data2 = pd.read_excel('data3.xls', 'Sheet1', index_col=None, na_values=['NA'])
data2
从文本文件中读取
这里我们用到的包:numpy、pandas
- 简单文件读取
data = np.loadtxt('data.txt', delimiter=',') # 使用numpy读取
data
df = pd.read_csv('data.txt', header=None) # 使用pandas读取
df
- 复杂文本文件
df2 = pd.read_csv('data2.txt', skipfooter=3, delimiter='[ ,]*')
# delimiter='[ ,]*'是正则表达,表示一个或多个空格,或用来分割记录值的逗号
df2
- 正则表达式
data3 = np.round(np.random.randn(100, 7), 2)
df3 = pd.DataFrame(data3, columns=['time', 'posx', 'posy', 'posz', 'velx', 'vely', 'velz'])
df3.head() # 展示前几个数据
vel = df3.filter(regex='vel*') # 提取vel开头的列
vel.head()