hive 练习数据集_您需要练习数据科学技能并做出出色组合的所有数据集

本文提供了各种Hive练习数据集的链接,旨在帮助数据科学家提升技能并建立出色的项目组合。这些数据集涵盖了多个领域,适合进行大数据分析和人工智能相关的实践。
摘要由CSDN通过智能技术生成

hive 练习数据集

The only way to learn data science, data analysis, machine learning, or artificial intelligence topics is by practicing or doing projects. There is no other alternative to that. But most of the time when I did a project for my portfolio or practice a new concept, I had to spend a good amount of time finding a suitable dataset. I decided to write this article to share some of the datasets I found very useful and interesting. That way at least you have some dataset to practice in hand.

学习数据科学,数据分析,机器学习或人工智能主题的唯一方法是练习或做项目。 除此之外,没有其他选择。 但是大多数时候,当我为自己的投资组合做一个项目或实践一个新概念时,我不得不花费大量的时间来寻找合适的数据集。 我决定写这篇文章,分享一些我认为非常有用和有趣的数据集。 这样,至少您手中有一些数据集可以练习。

人口普查数据集 (Census Dataset)

If you want to get a taste of how to explore a big dataset, work with this one. This dataset is very big.

如果您想了解如何探索大型数据集,请使用此数据集。 该数据集非常大。

This one is great for Exploratory Data Analysis, Statistical Analysis & Modeling, and, Data Visualization practice.

这对于探索性数据分析,统计分析和建模以及数据可视化实践非常有用

Download this dataset from here.

从此处下载此数据集。

Airbnb数据集 (Airbnb Dataset)

I received this dataset as a part of an interview a while ago.

不久前,我在一次采访中收到了这个数据集。

I was asked to do an Exploratory Data Analysis and develop a Machine Learning Model using this dataset.

我被要求进行探索性数据分析并使用该数据集开发机器学习模型

This dataset has a lot of text data and numerical data. You can use this dataset to practice a lot of different types of projects.

该数据集包含大量文本数据和数字数据。 您可以使用此数据集来实践许多不同类型的项目。

You will see several datasets in this link. But I was asked to download the listings.csv file for my interview.

您将在此链接中看到几个数据集 。 但是我被要求下载listings.csv文件进行采访。

汽车数据集 (Cars Dataset)

This is a reasonable size dataset that can be used to practice some Regression Models and Exploratory Data Analysis.

这是一个合理大小的数据集,可用于实施某些回归模型和探索性数据分析。

This dataset contains these columns: YEAR, Make, Model, Size, (kW), Unnamed: 5, TYPE, CITY (kWh/100 km), HWY (kWh/100 km), COMB (kWh/100 km), CITY (Le/100 km), HWY (Le/100 km), COMB (Le/100 km), (g/km), RATING, (km), TIME (h).

该数据集包含以下列:年,品牌,型号,尺寸,(kW),未命名:5,TYPE,城市(kWh / 100 km),HWY(kWh / 100 km),COMB(kWh / 100 km),城市( Le / 100 km),HWY(Le / 100 km),COMB(Le / 100 km),(g / km),额定值(km),时间(h)。

Here is the link for this dataset

这是此数据集的链接

心脏病数据集 (Heart Disease Dataset)

I found this dataset in Kaggle. Since then I have used it in so many different articles to demonstrate a concept.

我在Kaggle中找到了这个数据集。 从那时起,我在许多不同的文章中都使用它来演示一个概念。

These are two examples:

这是两个示例:

You will find some examples of Exploratory Data Analysis done and details about the dataset as well. Check out this dataset. I am sure you will use it a lot.

您将找到一些“ 探索性数据分析”示例以及有关数据集的详细信息。 签出此数据集。 我相信您会经常使用它。

Download this dataset from this link.

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值