Neural Computation of Decisions in Optimization Problems
动机:需要研究从平台角度出发,进行怎样的促销组合是最优的。
github上MIT复现的hopfieldnet代码
原文用TSP问题举例
原文 | 我要解决的问题 | |
---|---|---|
输出 | 5*5矩阵,行代表城市,列代表该城市在第几个被访问 | 5*1矩阵,每一列代表一个promo是否采用 |
限制条件1 | 每行&每列只有1个1,整个矩阵总和为5 | 每个元素都可以是0/1,总和在(0,5) |
限制条件2 | 路径有效性:相邻两列的城市、头尾的城市应该是可达的 | 输出值为1的promo不能互斥(比如某些场景限制了满减和商家券不能同时使用) |
最优化方向 | 总代价最低 | 某个指标值最高 |
原文E函数(energy function):可以分为四个部分
A部分:确保每行最多只有一个1
B部分:确保每列最多只有一个1
C部分:确保整个矩阵加起来和为n个城市
D部分:计算某个已知的路径的代价