数据格式及读取的api
数据类型 | 说明 | API |
---|---|---|
csv,tsv,txt | 用逗号,tab分割的纯文本文件 | pd.read_csv |
excel | xls或者xlsx文件 | pd.read_excel |
mysql | 关系型数据库表 | pd.read_sql |
环境准备
import pandas as pd
import pymysql
读取纯文本文件
csv文件读取
# csv文件读取
df=pd.read_csv("/Users/fujunhua/Desktop/学习笔记/测试数据/csv_data.csv")
# 打印所有数据(左侧是索引,右侧是数据)
print(df)
txt文件读取
# txt文件读取
df=pd.read_csv("/Users/fujunhua/Desktop/学习笔记/测试数据/txt_data.txt",sep="\t",header=None,names=['id','name'])
print(df)
读取excel文件
df=pd.read_excel("/Users/fujunhua/Desktop/学习笔记/测试数据/excel_data.xlsx")
print(df)
读取mysql数据库文件
# 创建数据库连接
conn=pymysql.connect(
host='127.0.0.1',
user='root',
password='12345678',
database='test',
charset='utf8'
)
# 执行sql语句读取数据
df=pd.read_sql("select * from user",con=conn)
print(df)
注意事项
- 如果遇到报错 ModuleNotFoundError
说明当前环境中没有安装该模块
到anaconda的environments中下载对应模块即可
记得更换镜像源,否则会很慢
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes
- 如果提示zsh: command not found: conda
source ~/.zshrc