最近莫名其妙同时处于浑浑噩噩和工作到深夜两个状态,当然干的还是男朋友的工作,至于我自己的学业,可能已经毁了吧。
在给他整理数据过程中,学习到一些技巧,这边记录下来,不然以后又要忘记。
我写代码太喜欢复制粘贴,导致后来连最简单的打开文件都不会写,我现在在有意改正这个习惯,多手打几次,希望能记住吧。
1.按照某一列的值,分组,fillna
有这个需求是因为这个数据是以年和公司名作为一行记录的关键词,就是一个公司的好几年为一段,然后又是下一个公司的好几年,年数也不固定。这时有一个值,把之前记录的结果匹配上来之后,出现了某几年有结果,某几年是空值。因为这个指标是累加值,所以某个公司如果有值,后面就不应该有空值,就应该按照之前的值填充。但是也有可能这个公司就是没有这个指标,那就都是nan。
数据大概长这样:
图一:关键字
图二:原来的数据
图三:处理结果
我想了一下这个怎么实现,众所周知,我是编程婴儿,我大概只能想到疯狂写 while 循环和 if 来把这一列填充好,但是感觉好烦,这个逻辑还得想一下。
后来我想到 fillna 好像有可以按上一个值填充的方法,但是网上没有分组 fillna 填充的。
我