数据处理
哇哈哈∞
这个作者很懒,什么都没留下…
展开
-
dataframe踩坑日记之pd.merge()
目标:读两个.csv文件,每个文件的第一列均为日期,但其它列包含的内容完全不一样,要把两个文件按日期将文件进行整合。一般来说,有这一行代码足够了(读者可自行查询outer、on的含义):df = pd.merge(df, df2, how="outer", on=["date"])但生成的数据显示on=[“date”]并没有起作用,同一个时间的数据并没有放在同一行,而是分两行存放了。通过各种搜索,锁定问题的根源在于两者的date格式不匹配。既然这样,那就让两者的格式匹配吧。方法如下:df["da原创 2021-10-28 11:06:11 · 981 阅读 · 0 评论 -
python Dataframe groupby 大坑
之前就碰到过pandas.Dataframe的某一列有取字符型和数字时,用groupby分组报错的问题。之后也没弄明白时什么原因,就逃避了。今天又是一个类似的问题,啥也不说了,见图:"nu"值的取值全为数字,用这种方法得到其取值范围是正确的;"gamma"值的取值有字符也有数字,原本取值只有8类,却给我返回13类,有些明明相同的类却变成了有字符有数字。。。总结下来就是:用Dataframe数据处理时,尽量不要一个变量既能取字符又能取数字。如果实在避免不了,那就妄想用该变量的groupby得到一个令人原创 2021-09-07 20:28:07 · 1485 阅读 · 0 评论