数据处理
文章平均质量分 54
Y1nhl
这个作者很懒,什么都没留下…
展开
-
Jupyter notebook和 Jupyter lab内核死亡问题的原因和解决方案
之前也遇到过几次内核死亡的问题,也一直没有想解决办法。这里总结一下并提出几个解决办法。首先明确一下jupyter出现内核死亡的原因:jupyter lab 或者 jupyter notebook 本身是一个web服务, 无法支持高并发和频繁的计算任务,对于大规模运行或高并发是不够能力处理,所以机会内核死亡。所以如果平时也习惯用pycharm,移植代码到pycharm运行就没问题了。我是因为很少用pycharm,甚至都没装pycharm。原创 2024-05-07 20:03:50 · 1197 阅读 · 0 评论 -
2024DCIC海上风电出力预测Top方案 + 光伏发电出力高分方案学习记录
海上风电出力预测的用电数据分为训练组和测试组两大类,主要包括风电场基本信息、气象变量数据和实际功率数据三个部分。风电场基本信息主要是各风电场的装机容量等信息;气象变量数据是从2022年1月到2024年1月份,各风电场每间隔15分钟的气象数据;实际功率数据是各风电场每间隔15分钟的发电出力数据。☆2.目标转化这里的处理应该是最终获TOP的trick。之前在砍老师的文章中也提到了这个处理,例如预测房价时,转换为预测单位面积下的房价。本题海上风力很类似。原创 2024-05-07 20:02:54 · 663 阅读 · 0 评论 -
解决pandas无法在循环中批量修改
最近在做数据处理的时候遇到一个DataFrame无法在循环中批量修改的问题,具体问题如下我有这样一个DataFrame我想只提取role_id为1和2的行的月份,然后构建新名为time的新列我写的代码如下但是无法实现,time列只会有最后一次循环的的结果。原创 2023-10-21 19:35:57 · 112 阅读 · 1 评论 -
利用pandas将每一行是一个列表的Series转为独热编码
写在前面 : 这个任务如何直接读取每一行然后列表构造倒是不太复杂,只是比较慢,这里是提供一个利用pandas比较简洁的实现方式同时也给自己做一个笔记,因为涉及到一些平时较少使用的函数。我有这样一个表,每个人有一个role_id,记录了每个人7天(day列2-8)的行为,有的人可能某天没有某种类型(type列)行为,有的人一天也可能有多个类型的行为。[在这里插入图片描述](https://img-blog.csdnimg.cn/b9e59ee549af45e0a98e8cce1454fe66.png。原创 2023-11-06 01:09:35 · 104 阅读 · 2 评论