![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
笔记
文章平均质量分 86
Jay.J.ming
这个作者很懒,什么都没留下…
展开
-
设计模式——桥接模式详解
一文搞定桥接模式,拒绝标题党原创 2023-03-13 09:14:11 · 6585 阅读 · 3 评论 -
Java学习——Stream流
Java Stream流常用方法原创 2023-03-05 23:21:12 · 327 阅读 · 0 评论 -
Java设计模式——单例模式,桥接模式,组合模式
Java设计模式之单例模式,桥接模式,组合模式原创 2023-03-05 21:18:29 · 252 阅读 · 0 评论 -
Java学习——lambda表达式
lambda表达式原创 2023-03-04 12:10:26 · 9579 阅读 · 2 评论 -
Java学习——面向对象基础
java面向对象基础知识,包括两大功能三大特征,修饰符与关键字的解读原创 2023-02-25 20:24:25 · 170 阅读 · 0 评论 -
Java学习——java基础知识
java从入门到入土每周两篇持续更新中……原创 2023-02-25 16:25:27 · 118 阅读 · 0 评论 -
快速排序(分治思想)(C++)
算法思想第一步:确定分界点分界点可以是任意一点,合理即可第二步:调整区间假设分界点为x,将区间调整为>x和<=x两部分第三步:递归处理左右两段注:对于步骤二,可以暴力解决,也可以通过指针的方法提高效率main函数int main(void) { int n; scanf("%d", &n); if (n <= 0) { puts(""); } vector<int> vec(n); for (int i = 0; i &l转载 2022-01-03 16:30:41 · 128 阅读 · 0 评论 -
Policy Gradient
简介强化学习是一个通过奖惩来学习正确行为的机制。 家族中有很多种不一样的成员,有学习奖惩值,根据自己认为的高价值选行为, 比如 Q learning, Deep Q Network, 也有不通过分析奖励值,直接输出行为的方法,这就是今天要说的 Policy Gradient 了。甚至我们可以为 Policy Gradients 加上一个神经网络来输出预测的动作。对比起以值为基础的方法,Policy Gradients 直接输出动作的最大好处就是,它能在一个连续区间内挑选动作,而基于值的,比如 Q-lear原创 2021-06-30 18:08:28 · 464 阅读 · 0 评论 -
基于深度强化学习的长期推荐系统
A deep reinforcement learning based long-term recommender system基于深度强化学习的长期推荐系统ABSTRACT推荐系统旨在最大化长期推荐的整体准确性。然而,现有的推荐模型大多采用静态视图,忽略了推荐是一个动态的顺序决策过程。结果,他们无法适应新的情况,并遭受冷启动问题。虽然顺序推荐方法最近已经得到了关注,但是长期推荐的目标仍然没有被明确地解决,因为这些方法是为短期预测情况开发的。为了克服这些问题,我们提出了一种新的基于深度强化学习的top原创 2021-04-14 11:43:39 · 1718 阅读 · 0 评论 -
GCN算法及实例分析
一.GCN前瞻知识1.图卷积计算公式:H(l+1)=σ(D~−12A~D~−12H(l)W(l))\mathrm{H}^{(l+1)}=σ(\widetilde{D}^{-\frac{1}{2}}\widetilde{A}\widetilde{D}^{-\frac{1}{2}}H^{(l)}W^{(l)})H(l+1)=σ(D−21AD−21H(l)W(l))A~=A+I\widetilde{A}=A+IA=A+ID~=∑jA~ij\widetilde{D}=\sum_j\widetilde{A}原创 2020-09-26 23:48:52 · 6774 阅读 · 5 评论