pandas是基于NamPy(python数据包)的数据分析工具,当你有一个大的数据集类似2G这样的,不能用excel打开一次性读取完,这时候就要用到pa. read. csv()分块读取。
其中:
1.filepath_or_buffer: 读取文件的路径URL;
2.header=0是表格没有列名,否则用使header=None;
3.read_csv()中有一个chunksize参数是指划分的块多大,例如chunksize=100指的是划分的每个块有100条数据;
4.Dateframe :表格型数据结构
3种np.arange()以及 reshape
1.np.arange(4)—(0,1,2,3)
2.np.arange(1,5)—(1,2,3,4)
3.np.arange(1,2,0.1)—(1,1.1,1.2…,1.9)
4.reshape(4,4)调整函数矩阵维度4行4列