1.csv文件读写
- pandas内置了10多种数据源读取函数,常见的就是CSV和EXCEL
- 使用
read_csv
方法读取,结果为dataframe格式 - 在读取csv文件时,文件名称尽量是英文
- 参数较多,可以自行控制,但很多时候用默认参数
- 读取csv时,注意编码,常用编码为utf-8、gbk 、gbk2312和gb18030等
- 使用
to_csv
方法快速保存
2. excel文件读写
- 使用read_excel读取,读取后的结果为dataframe格式
- 读取excel文件和csv文件参数大致一样, 但要考虑工作表sheet页,所以多了一个
sheet_name
参数 - 参数较多,可以自行控制,但很多时候用默认参数
- 读取excel时,注意编码,常用编码为utf-8、gbk 、gbk2312和gb18030等
使用to_excel快速保存为xlsx格式
3. 数据库文件读写
- 使用
sqlalchemy
建立连接 - 需要知道数据库的相关参数,如数据库IP地址、用户名和密码等
- 通过pandas中
read_sql
函数读入, 读取完以后是dataframe格式 - 通过dataframe的
to_sql
方法保存
3.1 查询数据库
3.2 写入数据库
进入数据库查看写入结果