机器学习
Eric_LH
把握生命里的每一分钟
展开
-
2021-07-09
解决AttributeError: ‘StanModel’ object has no attribute ‘fit_class’for prophetAttributeError: ‘StanModel’ object has no attribute ‘fit_class’pip3 uninstall fbprophetpip3 install fbprophet --no-cache-dir --no-binary :all:原创 2021-07-09 14:54:37 · 439 阅读 · 0 评论 -
贝叶斯思想(三)
最大似然还有另一个问题:即便一个猜测与数据非常符合,也并不代表这个猜测就是更好的猜测,因为这个猜测本身的可能性也许就非常低。(此处我觉得可以理解为复杂的曲线去精确匹配样本分布,但是这种曲线非常复杂,容易过拟合,反而效果不好)比如 MacKay 在《Information Theory : Inference and Learning Algorithms》里面就举了一个很好的例子:-1 3 7 ...原创 2018-10-17 17:16:49 · 317 阅读 · 0 评论 -
贝叶斯思想(二)
再访拼写纠正介绍了贝叶斯拼写纠正之后,接下来的一个自然而然的问题就来了:“为什么?”为什么要用贝叶斯公式?为什么贝叶斯公式在这里可以用?我们可以很容易地领会为什么贝叶斯公式用在前面介绍的那个男生女生长裤裙子的问题里是正确的。但为什么这里?为了回答这个问题,一个常见的思路就是想想:非得这样吗?因为如果你想到了另一种做法并且证明了它也是靠谱的,那么将它与现在这个一比较,也许就能得出很有价值的信息。...原创 2018-10-17 17:10:43 · 429 阅读 · 0 评论 -
贝叶斯思想(一)
问题引入:一所学校里面有 60% 的男生,40% 的女生。男生总是穿长裤,女生则一半穿长裤一半穿裙子。有了这些信息之后我们可以容易地计算“随机选取一个学生,他(她)穿长裤的概率和穿裙子的概率是多大”,这个就是前面说的“正向概率”的计算。然而,假设你走在校园中,迎面走来一个穿长裤的学生(很不幸的是你高度近似,你只看得见他(她)穿的是否长裤,而无法确定他(她)的性别),你能够推断出他(她)是男生的概...原创 2018-10-17 17:01:19 · 340 阅读 · 0 评论 -
贝叶斯思想(四)
3.2 模型比较理论(Model Comparasion)与贝叶斯奥卡姆剃刀(Bayesian Occam’s Razor)实际上,模型比较就是去比较哪个模型(猜测)更可能隐藏在观察数据的背后。其基本思想前面已经用拼写纠正的例子来说明了。我们对用户实际想输入的单词的猜测就是模型,用户输错的单词就是观测数据。我们通过:P(h | D) ∝ P(h) * P(D | h)来比较哪个模型最为靠谱。...原创 2018-10-17 17:18:49 · 299 阅读 · 0 评论 -
任务型对话系统概要
任务型对话系统概要将对话系统分解成管道(a pipeline)1)语言理解language understanding,2)对话状态跟踪dialog state tracking3)行动选择策略action selection policy4)语言生成language generation...原创 2018-09-18 10:51:05 · 1251 阅读 · 0 评论 -
dropout与过拟合
1.防止过拟合的方法:提前终止(当验证集上的效果变差的时候),early stoppingL1和L2正则化加权soft weight sharingdropout2.dropout率的选择经过交叉验证,隐含节点dropout率等于0.5的时候效果最好,原因是0.5的时候dropout随机生成的网络结构最多。dropout也可以被用作一种添加噪声的方法,直接对input进行操作。输入层设为更原创 2017-10-08 14:00:38 · 908 阅读 · 0 评论 -
2014年以来高被引论文
开门见山: 1.论文:Dropout :一种防止神经网络过拟合的简单方法 (Dropout: A Simple Way to Prevent Neural Networks from Overfitting,N Srivastava, G Hinton, A Krizhevsky, I Sutskever, R Salakhutdinov (2014) ) 摘要:其关键思想是在神经网络的训练过转载 2017-04-19 13:13:04 · 933 阅读 · 0 评论 -
百度人工智能的数据来源
在数据方面,除了海量的优质数据,百度拥有大量自建的高质量数据,包括百度阿拉丁(优质资源开放平台)、百度知道、百度百科、知识图谱等,不仅可以支持结构化数据的文章的生成,还可以支持基于内容聚合方式的文章生成。百度阿拉丁的时效性结构化数据,如体育比赛、彩票、股票信息、恶劣天气预警等,是速报类文章生成的数据基础。百度百科、百度知道和知识图谱是知识类文章生成的重要数据来源。 以百度百科的城市百科为转载 2017-04-19 12:45:21 · 1762 阅读 · 0 评论 -
机器学习与主动学习
利用主动学习方法,基于一个可以衡量样本有用性的评估函数,利用该函数估计出每个样本对于分类预测的价值从而主动挑选出最具价值的样本。把主动学习方法引入蛋白亚细胞定位预测问题中,基于损失函数和标签概率,构建非实验标记样本挑选算法。利用三个分类器在三个数据集上进行实验,按照挑选出来的顺序把非实验样本逐渐加入到原始训练集中重新训练当前分类器并用测试集测试分类器的性能。实验结果一方面表明取得的最好预测结果均比未转载 2015-08-13 14:31:42 · 4774 阅读 · 0 评论