1、Pandas数据读取
1. pandas读取纯文本文件
·读取csv文件
·读取csv文件
2. pandas读取xlsx格式excel文件
3. pandas读取mysql数据表
1、读取纯文本文件
1.1读取CSV,使用默认的标题行、逗号分隔符
import pandas as pd
fpath="./datas/ml-latest-small/ratings.csv"
#注意是反斜杠/,不然会报错
注意:地址中是反斜杠/,不然会报错
使用pd.read_csv读取数据
ratings=pd.read_csv(fpath)
查看前几行的数据
ratings.head()
#查看前几行的数据
ratings.head()
查看数据的形状,返回(行数,列数)ratings.shape
#查看数据的形状,返回(行数,列数)
ratings.shape
查看列名列表
ratings.columns
#查看列名列表
ratings.columns
查看索引列
ratings.index
#查看索引列
ratings.index
查看每列的数据类型
ratings.dtypes
#查看每列的数据类型
ratings.dtypes
1.2 读取txt文件,自己指定分隔符、列名
fpath2='./datas/crazyant/access_pvuv.txt'
pvuv2=pd.read_csv(
fpath2,
sep='\t',
header=None,
names=['pdate','pv','pu']
#注意设置列名的时候是names,而不是nameread_csv() got an unexpected keyword argument 'name'
)
pvuv2
注意:设置列名的时候是names,而不是name 报错:read_csv() got an unexpected keyword argument 'name'
2、读取excel文件
fpath3='./datas/crazyant/access_pvuv.xlsx'
p3=pd.read_excel(fpath3)
p3
3、读取MySQL数据库
!pip install pymysql
#使用的方法是read_sql
import pymysql
使用的方法是read_sql:
coon=pymysql.connect(
host='127.0.0.1',
user='root',
database='test'
charset='utf-8'
)
mysql_page=pd.read_sql('select * form crazyant_pvuv',con=coon)
注意:host是数据库的本地连接,user都是你本地电脑中设置的参数