Python入门学习之数据分析实战获取数据

最新推荐文章于 2024-07-15 15:01:56 发布

搬砖的苦行僧

最新推荐文章于 2024-07-15 15:01:56 发布

阅读量358

点赞数

文章标签： mysql python 数据库大数据 json

本文链接：https://blog.csdn.net/WhyLW/article/details/105566527

版权

在这里插入图片描述

想用一个完整的案例讲解Python数据分析的整个流程和基础知识，实际上以一个数据集为例，数据集是天池上的一个短租数据集，后台回复：短租数据集，即可获得。

先来想一下数据分析的流程，第一步获取数据，因此本节内容就是获取数据以及对数据的基本操作。

数据导入

导入.xlsx文件

要导入一个.xlsx后缀的Excel文件，可以使用pd.read_excel(路径)方法

# 导入.xlsx文件
df_review = pd.read_excel(r"D:\个人\data\reviews.xlsx")
df_review
（想了解更多的Python数据分析，爬虫，web,人工智能等资料请看文章末尾，免费获取。）

结果：
在这里插入图片描述
df_review数据包含了两个字段，listing_id和date

读入数据时必不可少的参数就是路径，不同的操作系统下文件路径的写法也不同，通常windows操作系统下关于路径有两种写法：

反斜杠“ \ ”:右键点击这个文件，选择属性，可以看到它所在的位置，默认是使用 \ 来表示，由于反斜杠“\”在Python中被定义为转义符号，因此在写的时候就要在路径的最前方加一个转义符 r，r"D:\个人\data\reviews.xlsx"

在这里插入图片描述
斜杠“ / ”：不需要加r，全部用 / 来写：“D:/个人/data/reviews.xlsx”

两种方式看个人习惯吧。

sheet_name 参数

对于.xlsx文件来说，可能会存在多个sheet表，因此也可以设置sheet_name参数指定导入的sheet表，可以传入sheet表的名字，也可以按照从0递增的顺序来指定，不指定sheet表则默认第一个sheet.

# 指定Sheet表
df_review = pd.<

关注