numpy合并不同维度矩阵_好全啊!千字图文实例详解numpy、pandas

numpy

NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。

NumPy 的前身 Numeric 最早是由 Jim Hugunin 与其它协作者共同开发,2005 年,Travis Oliphant 在 Numeric 中结合了另一个同性质的程序库 Numarray 的特色,并加入了其它扩展而开发了 NumPy。NumPy 为开放源代码并且由许多协作者共同维护开发。

NumPy 是一个运行速度非常快的数学库,主要用于数组计算,包含:

  • 一个强大的N维数组对象 ndarray

  • 广播功能函数

  • 整合 C/C++/Fortran 代码的工具

  • 线性代数、傅里叶变换、随机数生成等功能

8e38422e1c8591e6f7f8fe722d25e03e.png

Pandas

pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。

Pandas 是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发team继续开发和维护,属于PyData项目的一部分。Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了很好的支持。Pandas的名称来自于面板数据(panel data)和python数据分析(data analysis)。panel data是经济学中关于多维数据集的一个术语,在Pandas中也提供了panel的数据类型。

cbe9051bd1de87030e1dce4114c8452a.png

c237f85fff42c5d15863742d5859a150.png

a7e70097929719540fb6d1e521afd0df.png

43c543caeef6eb7ffeaba55a45bdd4bf.png

47943ad87c0fce3984bff9b155f897c7.png

b74afd9999ff18c09d033e1b5eb057a7.png

2c74388dd566897a3172453890b8dedb.png

330360453a3db84e7b4f3b13d59104c5.png

7108eed8428c1ac9f3b1192275fe741c.png

pd.Series

Series 用于存储一行或者一列的数据,以及与之相关的索引集合(类似于列表,但是有索引)。

dba838d2ecc610a01cd32e5ee0d4d1ff.png

5f43d16147020f42831735bef0b5f062.png

2a45a448f7b404ffcd50581f67d17151.png

97fdb4a3a28ad868ce86cd4df428ea4e.png

77769c327ad52de41182620dc505cae6.png

3e7a36eff8997b89d1b959970a733d00.png

d434a85bb2bf48a0b6f5175fb2b5220d.png

8d094f6f2a75831facf4314e688f039b.png

pd.DataFrame(...)

    DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。DataFrame既有行索引也有列索引,它可以被看做由series组成的字典(共用同一个索引)。

    DateFrame特点:
(1)DataFrame中面向行和面向列的操作基本是平衡的。
(2)DataFrame中的数据是以一个或多个两维块存放的(而不是列表、字典或别的一维数据结构)

f22f462f87be69a28f64b8316d437d03.png

694412e1ab1bd17248419509c9a06963.png

11139a49103753fe99227de82ed889d6.png

f8b4f76764ab60840310ba1c8784efcb.png

176f02ecd32d55070be200559f260bb4.png

6721b2f7afeadb9150d1b6f99c22abdf.png

fc3a20b719ca6949bd88c1f5a0654f1d.png

0e76de1930f5d02f397b2b3a65c9494a.png

897776ff40f7bc395ae17e24a1a4089f.png

39eb84f70462cfc3ee864a49611b62e0.png

d851af38f8de6b7a813703285d22e9e6.png

c12c22d348694e304cc01db6f25deb70.png

b844f73a3a609ec94d4302ca26a6b16e.png

25023512b88814ca431a017e537e68a9.png

03

索引

59f32bd6ab63ed01cb6c9c49b6299e68.png

d76630eaa85d7e0749a9dbd37713b21b.png

d236e75f74c9058531543fd849590b6e.png

  • 重新索引:reindex

78cb1d0f0217faffcf4bb3778d20fbf4.png

94f1b928e2d19338ef6ab18ae9bb0280.png

d7a74277bdcac5fe71034b76c66f0182.png

  • 索引、切片、过滤

0abd4ef01494527db73d3089fd90c522.png

7f4217f019b0b34080e5daa932c471af.png

19cdd871e8a6f73735ea25354a1a055d.png

9c75fb280a4480ae4a0802bb6a69878f.png

  • 使用loc 、iloc进行索引

b77ddadd637aa2affd8532d610aaee6e.png

ac3bf49f36bcd87649b6dbb73008b27c.png

62efc1eb7d870480178c5f75594de6cb.png

83c062d8f3992202562c7eee509e7f60.png

4e521638c7997a13d6dfbb5ff85949c0.png

  • 删除(drop)

c4498142cbe33011523d17d9fae9f011.png

8a516dfaf9b79d8c1ea220bdc0b60444.png

064ec6488ca81f615f0b2c53666d2470.png

bd8d5cf7b68656acc994b6977930ae94.png

675b505011169e25a72f89fdb2ae4cbd.png

04

算术运算与数据对齐

f208f1a6b73f91bbd2247716c9a67eb3.png

266356c75c3da8b82c8666e283904837.png

404cc2f9c4cdd3ba8459779b69dad27c.png

d83b9f33929de33b68dcf7d960453559.png

48def992f51d9454d84fb5781b9e698a.png7c85c804846709939594fe3517744e25.png

  • DataFrame 与 Series间的运算

c9b62f879cfd7bdbbf01c2a7259a51ae.png

27122c15cb02014493b7be188e06ddda.png

eecdd68cbaf89f20756cfb22b01f8181.png

07b6de55a9ab65567c6526e0cd4fdb30.png

05

函数应用

12c9b39ef9dda8938f70fc5694851d61.png

0a0f304723979455e08cb6675607f864.png

e776ed7512db92fc497c1af85f307a0a.png

ed0e725c8aec8437db8ad6fb9a4c505f.png

dff6390a7c9c899943c99e48bf2c21c1.png

  • 排序、排名1502851f47096046747bac35894645a0.png

b084ac75cb70d6e2a6c8bf5f08c927fb.png

c4a592c37078f9fa95fff3a7e46978e8.png

6d93c9813bf319be1336c71c553c9112.png

5370113e6ffecd668b061288eaae12d1.png

acccadd2c56b2506a9c9c8ca922d9c37.png

62e84fde48aa8d6064aa8d32717e22f4.png

68827377b150853c230fb104e43694dd.png

beae5bf5b92b7271bf7d498800fe55a1.png

  • 带有重复值的轴索引

f9ff455c65326bcb377beb87d5415559.png

40a38b8871d26bb10c9d16a0193c7bc5.png

06

汇总与描述统计

034487ae53d498573d4d8a1af9245ce6.png

9fe5d57212cf11af1e2d0e79a1a21a83.png

83bc989286514edca01cd5828377a1d5.png

e38d76480f78d67975fc432d2813a9df.png

792c65e7a5a6bb3a41165f8f9ffac3a5.png

d531adc0bc61b4965fcbe0c53909a7c8.png

c67dc186aadc46ff48359ac2bd9f748f.png

3033db5b3099c085795930e3a4d25135.png1508b33a73a9f4c8a77e40a3bd51324e.png

07

唯一值、值计数、成员资格

eca1913212864913a1c31c8f6841fed5.png

550b051891107978d5fdfb4798ddf503.png

da5fbf2dcdb5853bd1adac08f12a768d.png

79a77ffb41910ce419c3cddb43d850a3.png

08

数据清洗

  • 处理缺失数据

e1e11521d98940f136f6e01b68cdcf5d.png

39583aa824ab0740f5269828077e415d.png

d4ae6a0e9cd2e85c3272f0ed55f1b07a.png

a69f65fed1149129b70c67a36b7de68f.png

c8a17010f0af5c062b36479a4b3230c9.png

7a9759e415e9338d9bc2bd1a81f41d8a.pngf056b015bf4f9d9dd9a5a61e63d8f7a8.png

5ec7a43233a4e8a5b0b3822cb40c959e.png

09

导入导出数据

265c080519cad429e04396e49c970d67.png 

                     c5642133e7abcac0fb36962c87c67b95.png

293de9f527c64f994febd1c10bd8c634.png02e44325c4956393cf71031dedfc6fed.png

10

合并(concat、merge)

  • concat合并 

ed1ea80a6656eb89296c2c223dd8b3ae.pngee28e9bf5d92b2309f3c65460e310a3c.png

b2eeb040d920ce188c8305689b47a585.png

086405b44c553ac9507eab041874dbf6.png

7072dcaaedbad1b0e66c397045ff9e55.pngbe2fa496bdcf82e5a174b93f027db374.png

cde6fd781740438b295218e74c0bda2f.png

50c8393ef0f22d9aad67062783bea448.png

9de21557ca500c13d9e6d83b63261fd4.png

b6b1e743c26e87604b159319e228d7c8.png

7c10de36bd7ad597a6589eac41431469.png

  • merge合并 

4367b01b226034d1f591fa2bf757efe0.png

32cefda646e4d8c36b7474b2c883cb55.png

14d564da4cfaad595682d7af6580b0a4.png

749ff71fc6feb61f26e8b3b0927faaba.png

97f6a030df0e107080e11616f61613c7.png

aeafae94c04b51a4b0a22545163d8e9e.png

11. 分组 groupby

5645fd17f96aca4e0edba1e60c93032b.png

afa1be22fef451b52f1fbf4b2cf10c1f.png

b7989abae589684abcc349b951688475.png

11-1  对分组进行迭代

79dc5fc7c8e246ada87e137807988a73.png

c9de111f833167c3163ebd5d6fa482ec.png

3d424594157701ccc3fc55c064bb4dc0.png

8751a61b34f5bd6c5ee84637ec833b75.png

11-2  分组方法

9229921b5314b6266e161887b4e55364.png

523e87b8ee63ea1351eea2b8d91a104c.png

11-3  分组运算和转换

e6e3e54249d1351f9bef9dee8704df5e.png

00bc69ce3d4c14cc735dbfc0d29ebf94.png

d63ab09eef24d78534ab3af5967b1259.png

363141cd9ff5a28b7e811b455f336a9e.png

8ce3795d147eccd08d34e060e78678b4.png

467eff8583c1bd75f0f3d802f58b4d20.png

11-4  groupby示例

105f8aeb2de97176adf116032ac94f16.png

49d4e0f0ffb38f1dabe55fbacded3a9b.png

e175e38b3809b62094f12200c827fb78.png

32b0a2f3d390e16a62de2008a0fab8f6.png

3cbaa04620ad654c93b7438b6887e92c.png

6aee6073be8b074a028744951d31b3a6.png

3449968cb6ad6fe429dc4fa43e65bd9f.png

c8d37dfcb9b77e1888ef7fa2f840fc4a.png

11402c5450eb226872953b32267d6178.png

eac0723e6752d685eb3c5fc6e9eeb668.png

dd80bd1611b446360816bfb8f31fae73.png

0e1577ab0449fa94bc04b753d9a6e62c.png

12.  透视表 pivot_table

12-1  透视表示例

1b92e072f8fbf0e8a5156ade182dbd68.png

3e3c880f7ab6c748a514b753ed76bf23.png

d38fa13db11344b9e04f2b3864ea5d2a.pngb235d189c9ef5eaf1472c09f6d2378c2.png

0a416f4d1fb71e3de10d5fa7a1a246c0.png

5db5121f670cdb9f074b0891d5b47637.png

6389b82ed252a5358b32d4681ce2eb20.png

12-2  透视表示例

319d6e02d1d357f9a9e1f278389fdfc9.png

1d19884f405b65d4274c0cce44d030dd.png

dcb6a009bcddf10b2d38ac7fbdee4c4e.png

ba500a24cefa8cc0b5dda8909bc39c52.png

ae2275d898821fc7ce2d992a79d3f7c3.png

418c5beac6bd5e6cbdcad78d154dc024.png

b21be4d1e1dcca44e9b15fe8797a31de.png

1040ef2181dd0a72804d778c9f606a34.png

e9662a4efdc2be61b2cd0b610c97f339.png

7f8b01f5b9c9eb272699e439f15ad5d5.png

703545a84690fa098b844bc090a42de5.png

f5ae84eb0dba691d57ce4c4aeec2f4b7.png

12. 数据聚合

01e1f2bf108d1dbbe6d2c665bfda0659.png

abe2a7c0aabab213774a42733f95b941.png

3ebde9a6491e45f1e976513ac499cd90.png

8714d7870b2dec7df98e167dc5f0f2e4.png

1f760ae8d8e10bc189e52c9f7418ce75.png

a8c938a91ad8f14876558a0ade40c5c6.png

505b62c81ccc138ed40725ce7630c87b.png

5327a5a8ff74116f018492eeda0fda62.png

bdd85b805ea81a6072f6141c03c6a0fd.png

13. 交叉表

4d6696fcc1980888b81b01c56c7dca1c.png

87d4b5efd654566fc2d82067a8019912.png

7f706d24d162373a97a88475ae534a46.png

d843b6300a2cf2b97ae892aa9c3a0bfa.png

3010e12eed32f845c3aea310f91c632a.gif

   如果您觉得这篇文章对您有帮助,

 请点击底部广告支持一下吧,谢谢啦~

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值