- 博客(8)
- 收藏
- 关注
原创 Datawhale AI夏令营 大模型技术(微调)
基于大模型微调技术,微调适用于高考语文现代文阅读和英语阅读的QAG的大模型,完成输入文章输出问题与答案的任务。一直想系统学习一下pandas,在教程中找到一份pandas教程,先存在这里,之后有需要可以详细学习。
2024-08-11 10:52:53
60
原创 Datawhale AI夏令营 社会科学赛道 时间序列模型
导入包读取数据此处electricity_price_parsed读入后只剩两列,timestamp列为索引,就可以直接从索引中提取时间相关的信息。
2024-08-03 23:45:41
409
原创 Datawhale AI夏令营 社会科学赛道 时间序列挖掘+ABM构建模型
不同月份/小时下的出清价格受市场竞争影响较大回顾对数据做出的挖掘,可学习到一些时间序列挖掘的方法和步骤绘制出清价格在一日内的变化趋势绘制总负荷和出清价格分布,出清价格存在负电价和高电价,之后进行进一步分析按小时/月分析总负荷和电价,并分析原因分析负电价和高电价按小时/月分布的频数,并分析原因通过时间序列挖掘,对电价随时间/季节的变化有了进一步的认识,但不太清楚将这些分析出来的信息运用在模型训练中。
2024-07-31 23:15:59
650
原创 Datawhale AI夏令营 社会科学赛道baseline详解
预先计算 sorted_unit 的累积和.cumsum(): 这是 pandas 的一个方法,用于计算累积和。它返回一个新的 Series,每个元素是从 DataFrame 的开始到当前行的列的累积和。例如,如果0 1001 2002 150在执行cumsum()后,0 100 1001 200 3002 150 450# 找到最后一个满足总需求的机组报价prices[:5]用于找到累计和大于需求的行。
2024-07-28 23:38:17
692
原创 49.字母异位词分组
初次尝试将字符串转成列表再转成集合进行比较,这样会去重,测试用例[[‘ddddddddddg’, ‘dgggggggggg’]]过不了。解决办法:改用sorted函数。修改之后,时间复杂度太高,时间会超限。解决办法:正如题目标签,用哈希表。
2024-06-16 00:23:54
432
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人