2018年04月_mmc2015

09月 08月 07月 06月 04月 03月 02月 01月

原创 The gossip problem【多智能体通信达成全局一致性需要的最少通信次数】

https://www.sciencedirect.com/science/article/pii/0012365X73901210https://arxiv.org/abs/1511.00867

2018-04-11 13:31:42 851

原创如何解释policy gradient中的baseline具有降低variance的作用

在增强学习中有一大类方法叫policy gradient，最典型的是REINFORCE。在这类方法中，目标函数J(w)（通常是the expectation of long term reward）对policy参数w的gradient为：▽J(w) == E[ ▽logπ(a|s) * return ]== E[ ▽logπ(a|s) * (return-baseline)]~=计算N个samp...

2018-04-09 23:24:22 3706

挖掘DBLP作者合作关系，FP-Growth算法实践

挖掘DBLP作者合作关系，FP-Growth算法实践包括三个代码，一堆结果文件

2017-04-07

Chrome_IE_driver_X64_X32.rar

Chrome_IE_driver 64位32位都有，很好用，已测试。

2016-11-07

dblp测试数据集

dblp测试数据集，包括十六个会议的【部分内容】，使用SDM, ICDM, ECML-PKDD, PAKDD, WSDM, DMKD, TKDE, KDD Explorations, ACM Trans. On KDD, CVPR, ICML, NIPS, COLT、 CVPR、SIGIR、SIGKDD 十六个会议，至少从2000年至今的所有数据。应用代码参考：http://blog.csdn.net/mmc2015/article/details/50988375 确实花了我很多时间搜集

2016-03-26