最新Python数据分析：pandas读取和写入数据_pandas写入(2)，字节技术面试

最新推荐文章于 2024-06-16 22:13:43 发布

2401_84140112

最新推荐文章于 2024-06-16 22:13:43 发布

阅读量1k

点赞数 28

分类专栏：程序员文章标签： python 学习面试

本文链接：https://blog.csdn.net/2401_84140112/article/details/138823885

版权

程序员专栏收录该内容

146 篇文章 0 订阅

订阅专栏

最后

Python崛起并且风靡，因为优点多、应用领域广、被大牛们认可。学习 Python 门槛很低，但它的晋级路线很多，通过它你能进入机器学习、数据挖掘、大数据，CS等更加高级的领域。Python可以做网络应用，可以做科学计算，数据分析，可以做网络爬虫，可以做机器学习、自然语言处理、可以写游戏、可以做桌面应用…Python可以做的很多，你需要学好基础，再选择明确的方向。这里给大家分享一份全套的 Python 学习资料，给那些想学习 Python 的小伙伴们一点帮助！

👉Python所有方向的学习路线👈

Python所有方向的技术点做的整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。

👉Python必备开发工具👈

工欲善其事必先利其器。学习Python常用的开发软件都在这里了，给大家节省了很多时间。

👉Python全套学习视频👈

我们在看视频学习的时候，不能光动眼动脑不动手，比较科学的学习方法是在理解之后运用它们，这时候练手项目就很适合了。

👉实战案例👈

学python就与学数学一样，是不能只看书不做题的，直接看步骤和答案会让人误以为自己全都掌握了，但是碰到生题的时候还是会一筹莫展。

因此在学习python的过程中一定要记得多动手写代码，教程只需要看一两遍即可。

👉大厂面试真题👈

我们学习Python必然是为了找到高薪的工作，下面这些面试题是来自阿里、腾讯、字节等一线互联网大厂最新的面试资料，并且有阿里大佬给出了权威的解答，刷完这一套面试资料相信大家都能找到满意的工作。

需要这份系统化学习资料的朋友，可以戳这里获取

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

delimiter：str，默认为None。sep的别名。
header：int，list of int，表示列名的行号。如果没有传递列名，则header = 0，列名为文件的第一行。如果显式传递了列名，则header = None。
names：array，指定列名
index_col：int，sequence或False。表示索引列的位置，取值为sequence则代表多重索引
usecols：array，指定读取的列
skiprows：从文件开头算起，需要跳过的行数

先在当前工作目录下创建csv文件，如下图可以看到这个csv文件包含三列数据，列名为studentNo，name，age。使用read_csv将这三列数据读入到DataFrame。使用cat命令显示文件内容：

读取数据

import pandas as pd
df = pd.read\_csv('01.csv')
df

当使用read_table()时，运行代码后出现一个Warning，使用的是最新的版本python3.7。根据提示，修改如截图：
FutureWarning: read_table is deprecated, use read_csv instead, passing sep='\t'

df = pd.read_table('doupo.txt')
df

使用to_csv()方法，可以将数据导出为逗号分隔的数据文件。详述省略。

02 读取写入Excel文件

python处理excel文件用到的模块包含openpyxl、xlsxwriter、xlutils、xlrd、xlwt。想要了解更多关于这几个处理excel文件的python包的详情，可以访问python-excel官网。因为我使用的是Anaconda，Anaconda已经默认安装了xlrd和xlwt等模块，故无需再使用pip去安装啦。

而Python的数据分析库pandas提供了read_excel函数来读取.xls和.xlsx两种excel文件。其中.xls是office excel 2007之前的版本默认保存的文件扩展名。而.xlsx是2007版本之后的。有时一个excel文件会包含多个工作表，比如下面这个表格文有book和movie两个工作表。

使用xlrd读取excel文件：

# xlrd为读取excel的库
import xlrd  
workbook = xlrd.open_workbook('douban.xlsx')
sheetnames = workbook.sheet_names()

sheet1 = workbook.sheet_by_name(sheetnames[1])  
#通过sheet名称获取到第2张工作表book
#或 sheet1 = workbook.sheets()[1] 
#或 sheet1 = workbook.sheet\_by\_index(1)

print('sheet名称列表：' + sheetnames)  
print('第1张工作表名称：' + sheet1.name)
print('列数：' + str(sheet1.ncols))
print('行数：' + str(sheet1.nrows))
print('第2行所有数据：' + str(sheet1.row_values(2))) # 包括列名这一行，从0算起，
print('第2列所有数据：' + str(sheet1.col_values(1)))

通过pandas.read_excel方法读取excel文件，read_excel( )默认读取第一个工作表的，如果我想要读取movie这个工作表的话，就需要传参啦。

df = pd.read_excel('douban.xlsx', sheet_name = 'movie')
df

这时存储在表中的数据通过pandas.read_excel方法读取到DataFrame中啦，结果显示如下：

使用to_excel()方法，可以将数据存储到excel文件里。写入方法不详说了。

03 数据库的读取与写入

Python处理数据库时同样有第三方库，比如PyMySQL，SQLAlchemy等等，利用这些ORM库（ORM，全称object-relational mapping，即对象关系映射）可以实现对数据库的增删改查。而pandas实现数据库读取有3个方法，分别为read_sql，read_sql_table，read_sql_query。

read_sql_table只能读取数据库的某一个表格，不能实现查询的操作，而read_sql_query只能实现查询操作，不能直接读取数据库中的某个表，read_sql是两者的结合。语法：

pandas.read_sql_table(table_name,con,schema=None,index_col=None,coerce_float=True,columns=None)
pandas.read_sql_query(sql,con,index_col=None,coerce_float=True)
pandas.read_sql(sql,con,index_col=None,coerce_float=True,columns=None)

参数说明：

sql、table_name：string类型，分别表示SQL语句和数据库表名
con：表示数据库连接信息
index_col：int、sequence或者False，表示设定的列作为行名
coerce_float：boolean，将数据库中的decimal类型的数据转换为pandas中的float64类型的数据，默认True
columns：list类型，表示读取数据的列名，默认None

这里使用的是SQLAlchemy库来建立数据库连接，需要数据库驱动使用的Python内置的SQLlite。对SQLite的简介如下：

SQLite是一个进程内的库，实现了自给自足的、无服务器的、零配置的、事务性的 SQL 数据库引擎。它是一个零配置的数据库，这意味着与其他数据库一样，您不需要在系统中配置。

from sqlalchemy import create_engine
# create\_engine()用来初始化数据库连接
engine =  create_engine('sqlite://', echo = False)
df = pd.DataFrame({'name': ['tom', 'David', 'mary'], 'age': [18,19,17], 'score': [89,90,59]})
df

将df写入数据库中取名为“student”的表，需要查看下是否有成功写入数据库，执行sql请求，获取所有数据。实现代码如下：

df.to_sql('student', con=engine)
engine.execute("SELECT \* FROM student").fetchall()

使用pandas的读取数据库方法来读取：

# read\_sql\_query 
df = pd.read_sql_query('SELECT \* FROM student', con = engine)

# read\_sql\_table
df = pd.read_sql_table('student', con = engine)

# read\_sql


**网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。**

**[需要这份系统化学习资料的朋友，可以戳这里获取](https://bbs.csdn.net/forums/4304bb5a486d4c3ab8389e65ecb71ac0)**

**一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！**

2401_84140112

关注

28
点赞
踩
29

收藏

觉得还不错? 一键收藏
0
评论
最新Python数据分析：pandas读取和写入数据_pandas写入(2)，字节技术面试

Python崛起并且风靡，因为优点多、应用领域广、被大牛们认可。学习 Python 门槛很低，但它的晋级路线很多，通过它你能进入机器学习、数据挖掘、大数据，CS等更加高级的领域。Python可以做网络应用，可以做科学计算，数据分析，可以做网络爬虫，可以做机器学习、自然语言处理、可以写游戏、可以做桌面应用…Python可以做的很多，你需要学好基础，再选择明确的方向。这里给大家分享一份全套的 Python 学习资料，给那些想学习 Python 的小伙伴们一点帮助！
复制链接

扫一扫