【数据分析之道-Pandas(二)】DataFrame

文章介绍了DataFrame的基本概念,包括其作为表格型数据结构的特性。详细讲述了通过字典、列表、ndarrays以及CSV文件创建DataFrame的方法,并展示了如何添加和删除列。适合初学者了解和掌握DataFrame的使用。
摘要由CSDN通过智能技术生成

在这里插入图片描述

专栏导读

✍ 作者简介:i阿极,CSDN Python领域新星创作者,专注于分享python领域知识。

本文录入于《数据分析之道》,本专栏针对大学生、初级数据分析工程师精心打造,对python基础知识点逐一击破,不断学习,提升自我。
订阅后,可以阅读《数据分析之道》中全部文章内容,包含python基础语法、数据结构和文件操作,科学计算,实现文件内容操作,实现数据可视化等等。
✍ 其他专栏:《数据分析案例》《机器学习案例》

😊😊😊如果觉得文章不错或能帮助到你学习,可以点赞👍收藏📁评论📒+关注哦!👍👍👍

📜📜📜如果有小伙伴需要数据集和学习交流,文章下方有交流学习区!一起学习进步!💪

1、DataFrame简介

DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。
在这里插入图片描述

DataFrame 构造方法如下:

pandas.DataFrame( data, index, columns, dtype, copy)

参数说明:

  • data:一组数据(ndarray、series, map, lists, dict 等类型)。

  • index:索引值,或者可以称为行标签。

  • columns:列标签,默认为 RangeIndex (0, 1, 2, …, n) 。

  • dtype:数据类型。

  • copy:拷贝数据,默认为 False。

2、DataFrame创建

Pandas DataFrame是一种二维标签化数据结构,可以将其看作一个电子表格或SQL表。每列可以有不同的数据类型(数值,字符串,布尔值等),也可以有行和列标签。

在Pandas中创建DataFrame有多种方法,下面介绍其中的几种方法。

2.1字典创建DataFrame

使用Python的字典可以很方便地创建DataFrame,其中字典的键作为列标签,值作为列数据。

示例如下:

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 32, 18, 47],
        'city': ['New York', 'Paris', 'London', 'Los Angeles']}

df = pd.DataFrame(data)
print(df)

在这里插入图片描述

2.2列表创建DataFrame

从多个列表创建DataFrame也是很常见的方法。在这种情况下,每个列表代表一个列,可以通过将这些列表组合成字典,然后传递给pd.DataFrame()函数来创建DataFrame。

示例如下:

import pandas as pd

names = ['Alice', 'Bob', 'Charlie', 'David']
ages = [25, 32, 18, 47]
cities = ['New York', 'Paris', 'London', 'Los Angeles']

data = {'name': names, 'age': ages, 'city': cities}
df = pd.DataFrame(data)
print(df)

在这里插入图片描述

2.3ndarrays 创建DataFrame

import pandas as pd

data = {'age':[25, 32,18,47], 'name':['Alice','Bob','Charlie','David']}

df = pd.DataFrame(data)

print (df)

在这里插入图片描述

2.4CSV文件创建DataFrame

import pandas as pd

df = pd.read_csv('data.csv')
print(df)

data.csv是一个包含数据的CSV文件。如果CSV文件不包含列标签,则可以将header=None传递给read_csv()函数。如果CSV文件使用其他分隔符,则可以将sep参数设置为相应的分隔符。

3、DataFrame基本操作

3.1添加列

可以使用df[‘new_column’] = values的方式添加新列,其中values是一个与行数相同的列表或数组。

示例如下:

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie', 'David'],
        'age': [25, 32, 18, 47],
        'city': ['New York', 'Paris', 'London', 'Los Angeles']}

df = pd.DataFrame(data)
df['gender'] = ['F', 'M', 'M', 'M']
print(df)

在这里插入图片描述

3.2删除列

使用df.drop(‘column_name’, axis=1)的方式删除指定列。其中,axis=1表示沿着列的方向删除,axis=0表示沿着行的方向删除。

示例如下:

df = df.drop('gender', axis=1)
print(df)

在这里插入图片描述


📢文章下方有交流学习区!一起学习进步!💪💪💪
📢首发CSDN博客,创作不易,如果觉得文章不错,可以点赞👍收藏📁评论📒
📢你的支持和鼓励是我创作的动力❗❗❗

评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

i阿极

你的鼓励是我创作最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值