数据分析用的,可以将数据读入后做数据处理。
常用的数据结构是DataFrame(表格型)。他是有一定顺序排列的多列数据组成的,
既有行索引(index)也有列索引(column),都是从0开始
创建DataFrame我们常用的是 字典来创建
以字典的键作为每一列的名称,以字典值(数组)作为每一列。
同时DataFrame会自动加上每一行的索引,从0开始。
使用字典创建的DataFrame,columns参数是不可以被使用的,如果传入的列和字典键不匹配,相应的值为NaN
dic = {'ralph':[90,99,100,98],'kong':[99,100,100,100]}
pd.DataFrame(data=dic,index=('语文','文综','数学','外语'))
pd.DataFrame(data=dic)
用numpy创建:
用直接读取csv文件:
读取出来是多维数组