这个夏令营不简单 #AI夏令营 #Datawhale #夏令营 AI+社会科学Task1 Baseline精读

赛题背景

需要解决问题:

简单概括一下就是做一个能够预测在有多种因素影响下电力现货市场的市场清出报价。

本质上是一个回归问题。

给出的数据:

  • 电力市场的市场出清价格,市场需求等信息:

    • Day/Time:交易时间,中国电力现货市场15分钟结算一次,一天共96个交易点

    • demand:区域内电力总负荷(总需求),单位为MW

    • clearing price (CNY/MWh):市场出清电价,单位为元/MW·h

  • 存放市场供给者(各发电机组)的参数信息:

    • unit ID:每个机组唯一的ID

    • Capacity(MW):机组的额定容量(额定功率),越高机组的发电能力越强

    • utilization hour (h) :电厂的年平均运行小时数,需要注意多个机组可能共同属于一个电厂,有相同的值

    • coal consumption (g coal/KWh):每发一度电需要耗费多少煤炭,为成本参数

    • power consumption rate:电厂单位时间内耗电量与发电量的百分比

概念解析:

出清价格:

  1. 所有发电机组申报自己卖出的电价和电量

  2. 市场根据机组报价,从低到高排序,依次从低价开始成交

  3. 当成交的容量和大于等于总需求时,达到市场出清(供需平衡),这时候最后一个达成交易的机组报价为市场出清价格

博弈从何而来?

定价格低了:原本可以卖更多的钱

定价高了:要是太高了就超过清出价格了,就一个也卖不出,最后只能亏本卖出。

价格帽:

保证电力公司不坐地起价:

报价上线和下线以及出清价格上线下线

边际定价:

生产额外一单位产品(这里是一度电)带来的成本增加

赛题baseline部分代码理解

总步骤:

导入库->读取数据->数据预处理->找出边际定价->预测

  


electricity_price["timestamp"] = pd.to_datetime(

electricity_price["day"] + " " + electricity_price["time"].str.replace("24:00:00", "00:00"))

mask = electricity_price['timestamp'].dt.time == pd.Timestamp('00:00:00').time()

electricity_price.loc[mask, 'timestamp'] += pd.Timedelta(days=1)

electricity_price = electricity_price[["timestamp", "demand", "clearing price (CNY/MWh)"]]

electricity_price["timestamp"] = pd.to_datetime(electricity_price["day"] + " " + electricity_price["time"].str.replace("24:00:00", "00:00")):这一行将daytime两列的数据合并成一个新的时间戳列timestamp

以上代码将24:00:00变成了00:00:00,是因为pandas里面的库并不支持解读24:00:00

利用方法是创建一个mask的布尔类型变量,来判断是否需要转换同时判断是否需要日期+1

sorted_unit = unit.sort_values("coal consumption (g coal/KWh)") # 按照一度电的耗煤量(近似为边际成本)降序排序

sorted_unit.head()

sorted_unit['cumulative_capacity'] = sorted_unit['Capacity(MW)'].cumsum()

prices = []

for demand in electricity_price["demand"]:

price = sorted_unit[sorted_unit['cumulative_capacity'] >= demand]["coal consumption (g coal/KWh)"].iloc[0]

prices.append(price)



print(len(prices))

prices[:5]

这边采用根据按照一度电的耗煤量(近似为边际成本),来进行边际成本的计算,市场清出的机制,需要引入一个cumulative_capacity作为变量来计算累计发电容量,这样就可以通过for循环算出每个时刻的边际成本,然后再将边际成本作为出清价格,添加在Dataframe中

model = LinearRegression()

train_length = 55392

prices = np.array(prices).reshape(-1, 1)

X = prices[:train_length]

y = electricity_price["clearing price (CNY/MWh)"].iloc[:train_length].values.reshape(-1, 1)

model.fit(X, y)

y_pred = model.predict(prices[train_length:])

y_pred = y_pred.flatten() # 2维矩阵转为1维

y_pred[:5]

这段代码使用线性回归模型(LinearRegression)来预测电力市场的出清价格。

  1. prices = np.array(prices).reshape(-1, 1):将之前计算的出清价格列表prices转换为NumPy数组,并重塑为一列的二维数组,这是为了适应机器学习模型的输入格式。

  2. X = prices[:train_length]y = electricity_price["clearing price (CNY/MWh)"].iloc[:train_length].values.reshape(-1, 1):定义训练集的特征X和目标变量yX是训练集的出清价格,而y是实际的出清价格(从electricity_price DataFrame中选取)。

  3. y_pred = y_pred.flatten():将预测结果从二维数组转换为一维数组,这是因为predict()方法默认返回二维数组,即使预测结果只有一列。

目前不足

  • 边际成本并不能直接反映现实市场中的情况

  • 边际成本还被其他因素影响

优化策略

  • 尝试ABM方法

  • 利用外部数据(天气、煤价)

  • 研究交易规则、竞品影响

  • 思考总开机时间、机组发电效率等

  • 5
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
目标检测(Object Detection)是计算机视觉领域的一个核心问题,其主要任务是找出图像中所有感兴趣的目标(物体),并确定它们的类别和位置。以下是对目标检测的详细阐述: 一、基本概念 目标检测的任务是解决“在哪里?是什么?”的问题,即定位出图像中目标的位置并识别出目标的类别。由于各类物体具有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具挑战性的任务之一。 二、核心问题 目标检测涉及以下几个核心问题: 分类问题:判断图像中的目标属于哪个类别。 定位问题:确定目标在图像中的具体位置。 大小问题:目标可能具有不同的大小。 形状问题:目标可能具有不同的形状。 三、算法分类 基于深度学习的目标检测算法主要分为两大类: Two-stage算法:先进行区域生成(Region Proposal),生成有可能包含待检物体的预选框(Region Proposal),再通过卷积神经网络进行样本分类。常见的Two-stage算法包括R-CNN、Fast R-CNN、Faster R-CNN等。 One-stage算法:不用生成区域提议,直接在网络中提取特征来预测物体分类和位置。常见的One-stage算法包括YOLO系列(YOLOv1、YOLOv2、YOLOv3、YOLOv4、YOLOv5等)、SSD和RetinaNet等。 四、算法原理 以YOLO系列为例,YOLO将目标检测视为回归问题,将输入图像一次性划分为多个区域,直接在输出层预测边界框和类别概率。YOLO采用卷积网络来提取特征,使用全连接层来得到预测值。其网络结构通常包含多个卷积层和全连接层,通过卷积层提取图像特征,通过全连接层输出预测结果。 五、应用领域 目标检测技术已经广泛应用于各个领域,为人们的生活带来了极大的便利。以下是一些主要的应用领域: 安全监控:在商场、银行
目标检测(Object Detection)是计算机视觉领域的一个核心问题,其主要任务是找出图像中所有感兴趣的目标(物体),并确定它们的类别和位置。以下是对目标检测的详细阐述: 一、基本概念 目标检测的任务是解决“在哪里?是什么?”的问题,即定位出图像中目标的位置并识别出目标的类别。由于各类物体具有不同的外观、形状和姿态,加上成像时光照、遮挡等因素的干扰,目标检测一直是计算机视觉领域最具挑战性的任务之一。 二、核心问题 目标检测涉及以下几个核心问题: 分类问题:判断图像中的目标属于哪个类别。 定位问题:确定目标在图像中的具体位置。 大小问题:目标可能具有不同的大小。 形状问题:目标可能具有不同的形状。 三、算法分类 基于深度学习的目标检测算法主要分为两大类: Two-stage算法:先进行区域生成(Region Proposal),生成有可能包含待检物体的预选框(Region Proposal),再通过卷积神经网络进行样本分类。常见的Two-stage算法包括R-CNN、Fast R-CNN、Faster R-CNN等。 One-stage算法:不用生成区域提议,直接在网络中提取特征来预测物体分类和位置。常见的One-stage算法包括YOLO系列(YOLOv1、YOLOv2、YOLOv3、YOLOv4、YOLOv5等)、SSD和RetinaNet等。 四、算法原理 以YOLO系列为例,YOLO将目标检测视为回归问题,将输入图像一次性划分为多个区域,直接在输出层预测边界框和类别概率。YOLO采用卷积网络来提取特征,使用全连接层来得到预测值。其网络结构通常包含多个卷积层和全连接层,通过卷积层提取图像特征,通过全连接层输出预测结果。 五、应用领域 目标检测技术已经广泛应用于各个领域,为人们的生活带来了极大的便利。以下是一些主要的应用领域: 安全监控:在商场、银行
健身国际俱乐部系统是一种专为健身俱乐部设计的管理软件,它通过集成多种功能来提高俱乐部的运营效率和服务质量。这类系统通常包含以下几个核心模块: 1. **会员管理**:系统能够记录会员的基本信息、会籍状态、健身历史和偏好,以及会员卡的使用情况。通过会员管理,俱乐部可以更好地了解会员需求,提供个性化服务,并提高会员满意度和忠诚度。 2. **课程预约**:会员可以通过系统预约健身课程,系统会提供课程时间、教练、地点等详细信息,并允许会员根据个人时间表进行预约。这有助于俱乐部合理安排课程,避免资源浪费。 3. **教练管理**:系统可以管理教练的个人信息、课程安排、会员反馈等,帮助俱乐部评估教练表现,优化教练团队。 4. **财务管理**:包括会员卡销售、课程费用、私教费用等财务活动的记录和管理,确保俱乐部的财务透明度和准确性。 5. **库存管理**:对于俱乐部内的商品销售,如健身装备、营养补充品等,系统能够进行库存管理,包括进货、销售、库存盘点等。 6. **数据分析**:系统能够收集和分析会员活动数据,为俱乐部提供业务洞察,帮助俱乐部制定更有效的营销策略和业务决策。 7. **在线互动**:一些系统还提供在线平台,让会员可以查看课程、预约私教、参与社区讨论等,增强会员之间的互动和俱乐部的社区感。 8. **移动应用**:随着移动设备的普及,一些健身俱乐部系统还提供移动应用,方便会员随时随地管理自己的健身计划。 9. **安全性**:系统会确保所有会员信息的安全,采取适当的数据加密和安全措施,保护会员隐私。 10. **可扩展性**:随着俱乐部业务的扩展,系统应该能够轻松添加新的功能和服务,以适应不断变化的市场需求。 健身国际俱乐部系统的选择和实施,需要考虑俱乐部的具体需求、预算和技术能力,以确保系统能够有效地支持俱乐部的运营和发展。通过这些系统的实施,健身俱乐部能够提供更加专业和高效的服务,吸引和保留更多的会员,从而在竞争激烈的
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值