自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 JoyRL学习笔记(绪论、马尔科夫决策过程、动态规划)

马尔可夫性质(Markov property)是指一个随机过程在给定现在状态及所有过去状态情况下,其未来状态的条件概率分布仅依赖于当前状态。如上图所示,强化学习的关键就在于智能体和环境的交互,假设在某个给定的环境下,能采取的所有动作的集合被称为动作空间(action space)。γ为折扣因子,一方面可以通过设置它的大小来减少未来奖励的权重,另一方面对于一些并非有限回合结束的交互,可以通过设置γ来避免无穷的奖励。策略迭代先固定策略π,估计状态价值函数V,推算动作价值函数Q,优化Q,改进π。

2023-11-15 20:57:08 84 1

原创 2023“SEED”第四届江苏大数据开发与应用大赛--新能源赛道竞赛学习笔记1

最后按照baseline跑通模型,由于使用lightgbm,数据无须归一化和onehot,直接带入模型即可,得到的结果传后RMSE分数为240.5,另跑了一个随机森林回归模型,按照各0.5的权重融合模型,最后得到分数为234.1,目前排名46。其次是预处理:本次竞赛虽然是时间序列,但根据数据的类型可以得知,可能更适合树模型,因此首选从时序中再次提取新的时序特征,如:季度、月、是否为周末等特征。下一步准备按照直播中的方法加入一些外部数据作为特征,以及融合模型,尝试得到更好的结果。

2023-10-18 11:38:49 186 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除