Dataframe
Bob_tensor
这个作者很懒,什么都没留下…
展开
-
Windows如何通过Anaconda定时调用python脚本
如果你用的是Anaconda环境下的python,先把.ipybn文件转为.py文件在win 搜索框输入: 任务计划程序转载 2020-03-16 19:27:15 · 1401 阅读 · 0 评论 -
Dataframe优化内存(转)
Pandas】Pandas处理大数据集的方法(内存优化,减少内存使用量90%)将内存使用量减少高达90%的方法当使用具有小数据(小于100兆字节)的pandas时,性能很少成为问题。当我们迁移到更大的数据(100兆字节到几千兆字节)时,性能问题会使运行时间更长,并导致代码因内存不足而完全失败。虽然像Spark这样的工具可以处理大型数据集(100千兆字节到多兆兆字节),但充分利用它们的功能通常...转载 2020-03-09 17:24:45 · 1449 阅读 · 0 评论 -
Dataframe的函数操作
Dataframe中map(),apply(),applymap(),agg()函数区别与用法:1.map()函数只能对Series的所有元素进行操作2.applymap()函数只能对Dataframe的所有元素进行操作3.apply()函数既能对Series的所有元素进行操作,也能对Dataframe的所有元素进行操作,还能对Series、Dataframe的列或行(axis=)进行...转载 2019-08-22 14:50:54 · 8715 阅读 · 0 评论 -
pandas 用均值填充缺失值列的技巧
pd.DataFrame中通常含有许多特征,有时候需要对每个含有缺失值的列,都用均值进行填充,代码实现可以这样:for column in list(df.columns[df.isnull().sum() > 0]):mean_val = df[column].mean()df[column].fillna(mean_val, inplace=True)-------代码分解---...转载 2019-08-30 13:20:21 · 5469 阅读 · 0 评论