pandas
文章平均质量分 65
Everyang-
这个作者很懒,什么都没留下…
展开
-
用Pandas Index高效比对百万级别文本
前言 在Excel进行表表运算时,特别是以某表文本字段为关键字,查询另一表文本,即进行vlookup操作时,经常出现两边数据的不匹配。特别是如果数据量足够大,将产生较多的问题。 上述操作实际上是两集合的运算问题。解决办法有很多,就Pandas中,就可以以merge功能处理。但本文用Pandas的Index集合操作,可以更好理解Pandas的高效功能。 1、实验数据 import pandas as pd a = ['王三','王五','刘一','刘八','林二'] b = ['王六','王五','刘三'原创 2021-03-21 20:21:45 · 408 阅读 · 0 评论 -
用Pandas对Excel不规范字段二次分类汇总
用Pandas对Excel不规范字段二次分类汇总 前言: 在实务中,常常有这样的情况:有一张Excel表格是汇总表,比如按班级汇总的分数表;但发现因为学员归属表错误或缺漏等原因,还有张三等五人,没有被归类到任何一个班级。如果数量级很少,查询未被归属的信息,返回到原表用Excel重新进行分类汇总是可行的。但如果数量级较大,或者归属表信息一时难以完整修改,可以用Pandas简单进行二次汇总功能。即另外建立一张针对缺漏归属的新表,根据上一汇总表和新归属表,进行二次汇总运算。 一、实例: 1、原汇总表 在下表中原创 2021-03-21 14:08:19 · 463 阅读 · 0 评论