python导入数据一直是我比较头疼的地方(当然其他方面也一样,只是导入数据后才感到头疼)
numpy导入txt
txt文件中仅含有一个纯数字矩阵,运行代码,X即该矩阵,其中的数字为float类型。
import numpy as np
X =np.loadtxt('./pca.txt',dtype=np.float32)
pandas导入csv
csv文件中,含有第一行表头,此外就是数值矩阵。
iloc函数能够基于索引位来选取数据集,0:4就是选取 0,1,2,3这四行,需要注意的是这里是前闭后开集合。
import pandas as pd
# 读取csv文件
maotai = pd.read_csv('./SH600519.csv')
# 选取maotai中的0-2425行,第2列的数据,并将其值赋给training_set
training_set = maotai.iloc[0:2426, 2:3].values
csv文件下载链接:https://pan.baidu.com/s/1doIh1gzNeAR3PUSabYPr1Q
提取码:m1ez