datawhale-动手学数据分析task01

最新推荐文章于 2024-05-02 13:23:17 发布

VIP文章 Wanbolin

最新推荐文章于 2024-05-02 13:23:17 发布

阅读量239

点赞数

文章标签：数据分析 python

本文链接：https://blog.csdn.net/Wanbolin/article/details/117932148

版权

Pandas介绍
Pandas 是 Python 的核心数据分析支持库，提供了快速、灵活、明确的数据结构，旨在简单、直观地处理关系型、标记型数据。Pandas 的目标是成为 Python 数据分析实践与实战的必备高级工具，其长远目标是成为最强大、最灵活、可以支持任何语言的开源数据分析工具。经过多年不懈的努力，Pandas 离这个目标已经越来越近了。
Pandas 适用于处理以下类型的数据：
与 SQL 或 Excel 表类似的，含异构列的表格数据;有序和无序（非固定频率）的时间序列数据;带行列标签的矩阵数据，包括同构或异构型数据;任意其它形式的观测、统计数据集, 数据转入 Pandas 数据结构时不必事先标记
🔗Pandas中文网：https://www.pypandas.cn/
加载数据
本次动手学数据分析使用的数据为Kaggle上的泰坦尼克项目（Titanic: Machine Learning from Disaster)
🖇️数据集下载链接：https://www.kaggle.com/c/titanic/data
Titanic: Machine Learning from Disaster
处理直接从网页下载数据外，可以直接使用命令行下载，更加快速直接； 🔸如何使用命令行下载数据： 🔹首先要安装Kaggle API，具体安装步骤请查看官方GtiHub: https://github.com/Kaggle/kaggle-api 🔹安装好后，直接在电脑终端运行：kaggle competition

关注