dataframe修改数据_数据分析pandas

Data本节主要介绍Pandas在数据分析中的应用

pandas是一种快速,强大,灵活且易于使用的开源数据分析和处理工具,

建立在Python编程语言和numpy之上。主要特点如下:

  • 具备按轴自动或显示数据对齐功能的数据结构

  • 集成时间序列功能

  • 数学运算简约

  • 灵活处理缺失数据

  • 合并关系型运算

pandas两大数据结构:Series and DataFrame

Series是一种类似于一维数组的对象,它由一组数组以及一组与之对应的标签组成。仅由一组数据即可产生最简单的series. 基本数据结构如下图所示:

5c5ee1af57c9b024705955f64e46eed9.png

常见操作如下:

f1437dea1ca333c89191d89b487c19ae.png

可以将Series 看成一个定长的有序字典,是索引值到数据的一个映射

c890556d7ccbb51b3194ecff9618cb07.png

DataFrame

DataFrame是一种表格型数据结构,它包含有一组有序的列,每列可以是不同的值烈性。DataFrame既有行索引也有列索引,可以看做由series组成的字典。具体数据结构如图所示:

dad5a73db15d391c75a18c5c4891623b.png

构建DataFrame数据结构,常见基本操作

eb8eaf83bde04f6b86d8105deb0f1db8.png

算术运算中,自动对齐不同的索引数据

be1e827379d01d3aeb07f8728d780400.png

DataFrame构造器的数据

b2e9d93421ab0af64c256d72695be7f1.png

索引对象

负责管理轴坐标和其他元数据,构建Series和DataFrame时,所用到的任何数组或其他序列的标签都会被转换成一个Index, index的值无法修改,可以保证多个数据结构之前安全共享。

cfeb3004ee66615bd1ae3aed91f672ba.png

pandas中的主要index对象

38f0eb4b4fad9efeeb42f92814c0f63e.png

index的方法和属性

fc97a95158bbc5420d5c291d74e2fafa.png

基本功能

介绍操作数据容器Series和DataFrame中的数据的基本手段。

重新索引

pandas对象的一个重要方法是reindex,其作用是创建一个适应新索引的新对象。

cb86bccb27dff44cd6c2d00ea51fa387.png

807cd15c5da857015e5839a3db89fd68.png

对于dataFrame,reindex可以修改(行)索引、列,或两个都修改。如果仅传入一个序列,则会重新索引行

e6b89c15a2ed3b3f8d7c1d8bf46b0ebc.png

a070d8a07bd25a1f23c37ea3d7268967.png

丢弃指定轴上的项

b6ce1e10723fa4e8d5f7f2540d2d0d33.png

索引,选取和过滤

be89e556e98d3393cb0bffe4307f62ff.png

9c7ee7e39d8055c35f4e6af3d019a002.png

DataFrame 索引选项

  • DataFrame.at

  • Access a single value for a row/column label pair.

  • DataFrame.iloc

  • Access group of rows and columns by integer position(s).

  • DataFrame.xs

  • Returns a cross-section (row(s) or column(s)) from the Series/DataFrame.

  • Series.loc

  • Access group of values using labels.

算术运算和数据对齐

df1+df2

Equivalent to dataframe + other, but with support to substitute a fill_value for missing data in one of the inputs. With reverse version, radd.

Among flexible wrappers (addsubmuldivmodpow) to arithmetic operators: +-*///%**.

1a003c3846b91ee11f75a976d62b8c88.png

ca4f1b71cf5e594ad51244b9367776d8.png

791fcfdeea84305c6b65eec043776d64.png

3e90c4e0870d2806c3515e9505dc4be3.png

5b1891c313a7a07c4b119064c47f5aba.png

DataFrame和Series之间的运算

03c77561133307cdeaa66d869a75ee8f.png

相减

73430dce44625659f926dbcb8c5e5714.png

76afeaf97a26f983903c527393280e0e.png

函数应用与映射

5303bd3110d1e3e753644e0b95c3bf13.png

排序和排名

根据条件对内置序列进行排序。要对行或列索引进行排序

811d0768de20d04afcd5baea09b169d0.png

汇总和描述性统计

01e4ee3c7507febb06324eda5f794fee.png

56b87c075490f961774e05374dffcc99.png

524cd6a7e7df9364ec4e194df7dd0eaa.png

描述性统计函数

a7359effb58ae13c6430f0e00470fbf2.png

相关系数和协方差

数据基础

7da2f0117c9ef972cf610136e3a14803.png

2f0393a7eaf38130fa40ef4e66220f9c.png

相关系数f09541953a487938543d9b1d9b7d802d.png

协方差

ea995660573c975d8efbb36588cad95b.png

6a4120458f5e85dd0b0c2950fcf828ef.png

唯一值、值计数以及成员资格

c3bbab7a2413c04717c33fd344c8e840.png

c0d5fdcf72cf8e09eb7a8dae72909b6a.png

处理缺失数据

28401a0fcf4a316359baa3de47a855dc.png

7dd1c525791878c7c3f1a6ad94d45690.png

324dae4367e0e3270cd39adea7533ac1.png

f5d8d14e5098bd97ff20254a8a5c3f37.png

3b5cf65b818ea24566476dc1a488a7ef.png

b98e0bf6d64134ef85a7b725c83dd2f6.png

层次化索引

b452b08ae7efa7b13275651c6fff3331.png

f4c6d84a9b4fc9f7d0988688756afa9a.png

重排分级数据

bce1c5104dfc3e6e92caf6ea1e434896.png

368742fac3f7e8870a97b62053ff420b.png

使用级别汇总统计

644bde93b88950c7f6da792d8d919902.png

使用DataFrame的列

ce893f2a12d13984bf0ebb892f2f3960.png

1160d4918856994db41542ac5eb12318.png

9efc6e4cab6acea4c7dfd284d22d5518.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值