pandas库函数学习笔记

本文介绍了Pandas库中的一些核心函数,包括read_csv用于读取文件,Data.insert用于在DataFrame中插入数据,.iloc和.loc用于选取数据,DataFrame构造二维表格,duplicates检查重复值,drop_duplicates删除重复行,以及pd.concat进行数据拼接和pd.get_dummies进行独热编码等。
摘要由CSDN通过智能技术生成

Pandas中的数据结构

  • Series: 一维数组,类似于Python中的基本数据结构list,区别是Series只允许存储相同的数据类型,这样可以更有效的使用内存,提高运算效率。就像数据库中的列数据;series包含数据跟索引
  • DataFrame: 二维的表格型数据结构。DataFrame既有行索引还有列索引,它有一组有序的列,每列既可以是不同类型(数值、字符串、布尔型)的数据,或者可以看做由Series组成的字典。
  • Panel:三维的数组,可以理解为DataFrame的容器。

1、pandas.read_csv函数 用于读取文件

        基本参数:

filepath_or_buffer  文件的路径

header 作为每一列的别名(即第一行的值),当文件没有设置列名时:默认值为0:表示使用文件中原来存在的列名,也可能就是第一行的数据;当设置值为None时:表示用【0,1,2....】来作为列名

names 用于结果的列表名称,再输出时自己设定列名,可以用列表的形式来定义,比如names=['population','profite'],当header=None

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值