使用Python从5种主要数据源中提取数据

Did you know that in 2020 around 147 GB of data is generated per day? And, we have already stored around 40 trillion GB of data until now. All these stored data are not even the same. Data types like text or numbers have different formats. That explains why we have different types of data sources.

您是否知道在2020年每天产生约147 GB的数据? 并且,到目前为止,我们已经存储了约40万亿GB的数据。 所有这些存储的数据都不相同。 文本或数字等数据类型具有不同的格式。 这就解释了为什么我们有不同类型的数据源。

When you are working with data, you should know how to ingest the data from different sources. In this article, we are going to ingest data from various sources with the help of python libraries.

在处理数据时,您应该知道如何从不同来源提取数据。 在本文中,我们将借助python库从各种来源提取数据。

We will go through the below Data sources.

我们将审阅以下数据源。

1. RDBMS Database

1. RDBMS数据库

2. XML file format

2. XML文件格式

3. CSV file format

3. CSV文件格式

4. Apache Parquet file format

4. Apache Parquet文件格式

5. Microsoft Excel

5. Microsoft Excel

Do we have one python library which fetches data from all the sources?

我们是否有一个python库可以从所有来源获取数据?

Nope, because every data source has its own protocol for data transfer. We have multiple python library which does this job. Consider this article as a one-stop place to know about these python libraries.

不会,因为每个数据源都有自己的数据传输协议。 我们有多个python库可以完成这项工作。 将本文视为了解这些python库的一站式网站。

In this article, we explain why we save data in different sources and how we retrieve data using python library.

在本文中,我们解释了为什么我们将数据保存在不同的源中以及如何使用python库检索数据。

Let’s start with our data fetching story.

让我们从我们的数据获取故事开始。

1.关系数据库管理系统(RDBMS)数据库 (1. Relational database management system (RDBMS) Database

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值