- 博客(9)
- 资源 (2)
- 收藏
- 关注
原创 TSP问题的遗传算法实现
旅行商问题(Traveling Salesman Problem, TSP),又译为旅行推销员问题、货担郎问题,简称为TSP问题,是最基本的路线问题。假设有n个可直达的城市,一销售商从其中的某一城市出发,不重复地走完其余n-1个城市并回到原出发点,在所有可能的路径中求出路径长度最短的一条。TSP问题是组合数学中一个古老而又困难的问题,也是一个典型的组合优化问题,现已归入NP完备问题类。以N个节点的TSP(旅行商问题)问题为例,应用遗传算法进行求解,求出问题的最优解。
2023-01-05 17:31:52 2024
原创 24考研计划(看了个视频,记录一下)
1.一两周学语法(可以适当延长,我英语差)2.长难句练习(直到考前)3.学阅读解题方法(找到不同的题型,和不同题型对应的解题技巧)九月初开始写作,10月开始新题型和翻译,最后完型填空,因为完形填空复习性价比很低。数学,刷题,不断刷题,此时很多模拟题和押题卷会上市,就刷完事了,回顾错题。突飞猛进,正式开始复习分析题,背肖四,背答案素材,练习分析题答题逻辑框架。此时复习的目标是以后做阅读的难点是单词和长难句理解,而不是解题逻辑。专业课刷题作用不大了,笔记回顾,考点背背,回顾错题和难题。...
2022-08-01 22:26:56 533
原创 actor-critic methods(价值学习和策略学习的结合)
输入为a和s,s用conv,a用dense得到各自feature,然后拼接起来,再用全连接层得到一个实数,这就是在s的情况下,做出动作a的分数,可以判断在s的情况下,做出动作a的好坏。输入为状态s,conv卷积层,dense一个或多个全连接层,softmax激活函数。策略网络训练π函数,θ为策略网络的参数。价值网络训练q函数,w为价值网络的参数。这两幅图就是对算法的图解,其实就是两个算法的不断使用,思路和算法上面都写过了。critic是价值网络,给动作打分,可认为是裁判。学习这两个神经网络。......
2022-08-01 11:36:33 497
原创 深度学习-策略学习
J(θ)表示以S为随机变量对V函数进行期望,得到只和θ有关的平均状态价值函数,也就是可以利用J(θ)得到以θ为随机变量,与s无关,找到最好的θ参数,得到与s无关时最大的J(θ)。可以把Qπ挪到右边是因为这里假设Qπ与θ无关,而实际其实是有些关联的,所以这里不太严谨,挪到右边是为了让我们学明白点,好理解点。第二种在连续的时候用,但是由于做积分不太可能,因为近似出的π函数太复杂了,所以用蒙特卡洛近似近似出该积分。如果a离散,则可以直接用,但是一般不行,所以一般用蒙特卡洛近似。如何令策略网络越来越好?...
2022-07-30 23:56:54 446
原创 学生成绩管理系统设计
学生的信息的录入功能: 我实现的学生信息录入学生总分的排序是一体的,每次录入学生信息后立即进行位置排序,因此用双链表 就非常方便,可以很方便地进行插入,而不需要像数组那样拖拽大量元素,这就是我采用双链表的原因。学生总分的排序: 初始化i=1,p指针;但若p.总分=p.next.总 分,则令p的排名为i即可,使下一个的排名不变,实现并列名次。每次通过新的学生学号信息,在双链表中顺序遍历看是否有重复学号,而选择顺序遍历的原因是由于学号 在双链表中的排序是无序的,有序的只要总分的排序,因此采用顺序查找。
2022-02-21 15:22:58 4707
原创 大一下期末C++复习,我不熟的
1.复制构造函数: class abc { public: abc(int z,int c) { x = z; y = c; } abc(abc const &);//复制构造函数 private: int x; int y; }; abc::abc(abc const &p) { x = p.x; y = p.y; } void abc::out() { cout << "x=" &...
2021-07-02 23:33:28 520 3
C++学生学籍管理系统
2021-07-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人