![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 81
Er8cJiang
心有猛虎,细嗅蔷薇!
展开
-
贝叶斯机器学习
贝叶斯机器学习作者Zygmunt Z. 2016-03-28发表于博文你知道贝叶斯定理是如何涉及到机器学习的?对于难题如何组合在一起是非常难掌握的,我们知道这花了一段时间.本文是当时发展的介绍. 虽然我们对此事有一定掌握,但是我不是专家,因此下面可能会包含不准确甚至是错误的地方.请在评论或是私信随意指出.贝叶斯学派和频率学派在本质上,贝叶斯意味着概率.具体的术语存在是由于有两种方法获取概率.贝叶翻译 2016-03-29 18:08:18 · 1388 阅读 · 0 评论 -
一篇文章,带你明白什么是过拟合,欠拟合以及交叉验证
误差模型:过拟合,交叉验证,偏差-方差权衡作者Natasha Latysheva;Charles Ravarani 发表于cambridgecoding介绍 在本文中也许你会掌握机器学习中最核心的概念:偏差-方差权衡.其主要想法是,你想创建尽可能预测准确并且仍能适用于新数据的模型(这是泛化).危险的是,你可以轻松的在你制定的数据中创建过度拟合本地噪音的模型,这样的模型是无用的,并且导致弱泛化能力翻译 2016-03-25 16:13:09 · 9086 阅读 · 4 评论 -
7个步骤掌握使用python进行机器学习
7个步骤掌握使用python进行机器学习有许多python机器学习资源在线免费提供.从哪开始?如何进行?从零到python机器学习大神只要7个步骤.作者Matthew Mayo.发表于KDnuggests.入门.在英语中最打击人的两个单词.第一部往往是最难的,当在这方面有太多选择,通常让人崩溃.从哪开始? 这篇文章旨在用7个不走带领python机器学习知识最少的新人成为知识渊博从业者,使用免费材料翻译 2016-03-30 12:26:25 · 13658 阅读 · 1 评论 -
21个数据科学家面试必须知道的问题和答案
21个数据科学家面试必须知道的问题和答案转载请注明! KDnuggets 编辑提供了用以斟辨“假”数据科学家之二十问的答案,包括什么是正则化(regularization),我们喜爱的数据科学家,模型验证等等。作者:Gregory Piatetsky,KDnuggets近期发布在KDnuggets上的一篇文章:《检测“假”数据科学家的二十问》非常热门,获得了1月阅读排行榜第一名。然而,这些问题并没翻译 2016-03-31 16:11:17 · 6609 阅读 · 0 评论 -
建立神经网络:Part 0
建立神经网络:Part 0转载请注明!机器学习是成功的,时髦的,可以学习实现你的冒险。 这就是我想做的,为了让任何人对如何产生原始实例网络感兴趣,我会从本质上讲解我对神经网络的理解(示例会用Python3。这就是我不喜欢的地方,为什么不是2.7)。 本系列第一项涵盖理论,在试图编写代码或分析任何类型数据之前确保这是巩固的。 什么是神经网络? 一个网络收集一起工作形成更智能结果/解决方案的神经翻译 2016-04-02 17:21:03 · 711 阅读 · 0 评论 -
XX2Vec算法汇总
XX2Vec算法汇总转载请注明! XX2Vec Embed In Sup/Unsup Algorithms used Char2Vec Character Sentence Unsupervised CNN -> LSTM Word2Vec Word Sentence Unsupervised ANN GloVe Word翻译 2016-04-02 18:30:29 · 3780 阅读 · 1 评论 -
应用数学十大算法
应用数学十大算法在JCSE2000年2月发表的论文中,Jack Dongarra and Francis Sullivan 挑选了”21世纪科学和工程实践和发展最具影响力的十大算法”,并展示了这些算法的文章,他们具有许可编纂.(Barry Cipra的SIAM新闻文章给出了谁不能访问原始论文的概述).这十大列表吸引了很多人的注意力. 16年后,我虽然很想用不同的方式生成一个列表,看看与原来的top翻译 2016-04-01 22:44:34 · 2702 阅读 · 0 评论 -
Kaggle竞赛Santander 客户满意
Kaggle竞赛Santander 客户满意Banco Santander 获得了数据科学社区Kaggle最近主办竞赛的帮助。本次大赛的主要目标是建立一个区分满意和不满意客户的预测模型。 银行提供训练和测试数据集。训练数据集提供客户满意度的指标。参赛者要求使用此数据集建立,调整模型,成功预测没有提供满意度指标的测试集。 训练集包含369个匿名变量,和76818观测值。 数据变量可用信息较少。只翻译 2016-04-03 23:38:46 · 2575 阅读 · 2 评论