1.读取文件和数据属性的基本查看方法
数据类型 | 读取方法 |
---|---|
csv,tsv,txt | pd.read_csv(filepath) |
excel | pd.read_excel(filepath) |
mysql | pd.read_sql(filepath) |
注意,读取mysql时,要先进行sql连接
import pymysql
conn = pymysql.connect(
host="127.0.0.1"
user="root"
password="123456"
database="data_info"
charset="utf8"
)
mysql_info=pd.read_sql("select * from information",con=conn)
其他一些查看表属性的基本操作
improt pandas as pd
filepath="./information.txt"
info = pd.read_csv(filepath,sep=",",header=None,names=["column_A","column_B","column_C"],skiprows=2)
#第二个参数表示文件中的数据以什么形式进行分割,第三个参数表示文件有无标题行,第四个参数表示对文件的每一列的属性进行命名,最后一个参数表示跳过前两行数据不进行处理
info.head() #读取前几行数据
info.shape #用元祖返回数据的行数和列数
info.columns #查看列索引
info.index #查看行索引
2.DataFrame和Series
如上图,一整张表就是一个DataFrame,即DataFrame是一个二维数组。PV一整列就称为是一个Series,2019/9/3的一整行数据也