- 博客(5)
- 收藏
- 关注
原创 极大似然估计
① 频率学派他们认为世界是确定的。他们直接为事件本身建模,也就是说事件在多次重复实验中趋于一个稳定的值p,那么这个值就是该事件的概率。他们认为模型参数是个定值,希望通过类似解方程组的方式从数据中求得该未知数。这就是频率学派使用的参数估计方法-极大似然估计(MLE),这种方法往往在大数据量的情况下可以很好的还原模型的真实情况。② 贝叶斯派他们认为世界是不确定的,因获取的信息不同而异。假设对世界先有一个预先的估计,然后通过获取的信息来不断调整之前的预估计。 他们不试图对事件本身进行建模,而是从旁观者的角
2020-11-19 11:42:25 200 1
原创 【LeetCode31】
【LeetCode31】class Solution {public: void nextPermutation(vector<int>& nums) { int i=nums.size()-1; int tmp; int flag=0; if(nums.size()==0||nums.size()==1) { return; } whil
2020-11-11 11:41:51 99
转载 迁移强化学习
作者:机器之心链接:https://zhuanlan.zhihu.com/p/87220648来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。一、迁移学习是什么?机器学习技术在许多领域取得了重大成功,但是,许多机器学习方法只有在训练数据和测试数据在相同的特征空间中或具有相同分布的假设下才能很好地发挥作用。当分布发生变化时,大多数统计模型需要使用新收集的训练数据重建模型。在许多实际应用中,重新收集所需的训练数据并重建模型的代价是非常昂贵的,在这种情况下,我们需要在任务域
2020-11-07 22:06:57 2216
原创 【LeetCode 1358】
【LeetCode 1358】[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4osxhEOe-1604755774208)(C:\Users\liuyi\AppData\Roaming\Typora\typora-user-images\image-20201107210151741.png)]版本1:int abc_or_not(string s,int l,int r){ int flag1=0,flag2=0,flag3=0; for(int i
2020-11-07 21:29:47 123
原创 常用的强化学习框架
常用的强化学习框架OpenAI Gym (GitHub) (docs)rllab (GitHub) (readthedocs)Ray (Doc)Dopamine: https://github.com/google/dopamine (uses some tensorflow)trfl: https://github.com/deepmind/trfl (uses tensorflow)ChainerRL (GitHub) (API: Python)Surreal GitHub (API:
2020-11-02 21:45:30 6586
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人