Python数据分析与应用-----pandas统计分析基础

最新推荐文章于 2022-11-25 21:03:30 发布

比格丽巴格丽抱

最新推荐文章于 2022-11-25 21:03:30 发布

阅读量490

点赞数

文章标签：数据库

本文链接：https://blog.csdn.net/qq_51186720/article/details/115827630

版权

pandas统计分析基础

pandas统计分析基础

一.读写不同数据源的数据

1.读写数据库数据

（1）.数据库数据读取

pandas提供了读取与存储关系型数据库数据的函数与方法除了pandas库外，还需要使用SQLAlchemy库建立对应的数据库连接。SQLAlchemy配合相应数据库的Python连接工具（例如MySQL数据库需要安装mysqlclient或者pymysql库），使用create_engine函数，建立一个数据库连接。
creat_engine中填入的是一个连接字符串。在使用Python的SQLAlchemy时，MySQL和Oracle数据库连接字符串的格式如下：
数据库产品名+连接工具名：//用户名:密码@数据库IP地址:数据库端口号/数据库名称？charset = 数据库数据编码
read_sql_table只能够读取数据库的某一个表格，不能实现查询的操作。
pandas.read_sql_table(table_name, con, schema=None, index_col=None, coerce_float=True, columns=None)
read_sql_query则只能实现查询操作，不能直接读取数据库中的某个表
pandas.read_sql_query(sql, con, index_col=None, coerce_float=True)
read_sql是两者的综合，既能够读取数据库中的某一个表，也能够实现查询操作。
pandas.read_sql(sql, con, index_col=None, coerce_float=True, columns=None)
pandas三个数据库数据读取函数的参数几乎完全一致，唯一的区别在于传入的是语句还是表名。
在这里插入图片描述

（2）.数据库数据存储

数据库数据读取有三个函数，但数据存储则只有一个to_sql方法。
DataFrame.to_sql(name, con, schema=None, if_exists=’fail’, index=True, index_label=None, dtype=None)
在这里插入图片描述

2.读写文本文件

（1）.文本文件读取

文本文件是一种由若干行字符构成的计算机文件，它是一种典型的顺序文件。
csv是一种逗号分隔的文件格式，因为其分隔符不一定是逗号，又被称为字符分隔文件，文件以纯文本形式存储表格数据（数字和文本）。
使用read_table来读取文本文件。
pandas.read_table(filepath_or_buffer, sep=’\t’, header=’infer’, names=None, index_col=None, dtype=None, engine=None, nrows=None)
使用read_csv函数来读取csv文件。
pandas.read_csv(filepath_or_buffer, sep=’,’, header=’infer’, names=None, index_col=None, dtype=None, engine=None, nrows=None)
在这里插入图片描述