算法
Snail_Moved_Slowly
这个作者很懒,什么都没留下…
展开
-
机器学习-线性回归
背景 机器学习所研究的主要内容,是关于在计算机上从数据中产生模型的算法,即学习算法。有了学习算法,我们把经验数据提供给它,它就能基于这些数据产生模型,在面对新的情况时,模型会给我们提供相应的判断。在本篇文章及其接下来的文章中不对算法做数学上的推断,如果想知道机器学习的数学推导过程,建议学习NG的机器学习算法公开课,参考笔记可以更好地理解。本篇的顺序是按照周志华的机器学习章节展开,对机器学习...原创 2017-12-10 21:44:26 · 482 阅读 · 0 评论 -
算法-背包
算法是码农能力强弱最直接的一个体现,好好学算法吧,动态规划中经典的问题,背包问题链接:背包。其实01背包是所有背包的基础。转载 2018-05-13 17:02:21 · 270 阅读 · 0 评论 -
bp反向传播公式推导
反向传播公式,主要是链式法则,找了几篇博客,详细推导过程和示例计算都有。https://blog.csdn.net/qrlhl/article/details/50885527https://www.jianshu.com/p/408ab8177a53https://www.zybuluo.com/hanbingtao/note/476663原创 2018-04-15 23:21:15 · 350 阅读 · 0 评论 -
CNN公式推导举例
CNN公式推导本篇文章介绍了cnn的参数基本的计算过程,http://www.datakit.cn/blog/2016/03/23/bp_cnn.html,对于一些细节描述不是很清楚。但是对于参数的传播有例子加以说明。pooling层和卷积层的反向传播需要参考 http://manutdzou.github.io/2016/05/15/CNN-backpropagation.htm原创 2018-04-07 21:06:02 · 841 阅读 · 0 评论 -
用户投票排名算法总结
其实这只能算是一个总结,一个读后感外带一点引申。《基于用户投票的排名算法》系列,作者:阮一峰。这个系列的文章确实写得很漂亮,层层深入,引人思考。作者blog:http://www.ruanyifeng.com/blog/1. 只有赞成票(1)单位时间内用户的投票数进行排名Delicious。实现:每小时统计一次次数,高的在前。优点:简单,确实能反映热度。缺点:不转载 2018-02-04 22:27:24 · 1305 阅读 · 0 评论 -
机器学习-EM算法
从最大似然到EM算法浅解zouxy09@qq.comhttp://blog.csdn.net/zouxy09 机器学习十大算法之一:EM算法。能评得上十大之一,让人听起来觉得挺NB的。什么是NB啊,我们一般说某个人很NB,是因为他能解决一些别人解决不了的问题。神为什么是神,因为神能做很多人做不了的事。那么EM算法能解决什么问题呢?或者说EM算法是因为什么而来到这个世界上,还吸引了那么多转载 2018-01-07 21:28:49 · 333 阅读 · 0 评论 -
机器学习-贝叶斯分类
算法杂货铺——分类算法之朴素贝叶斯分类(Naive Bayesian classification)<div class="entry"> <div id="cnblogs_post_body" class="blogpost-body"><h1>0、写在前面的话</h1> 我个人一直很喜欢算法一类的东西,在我看来算法是人类智慧的精华,其中蕴含着无与伦比的美感。而每次将学过的算法转载 2018-01-07 20:06:45 · 395 阅读 · 0 评论 -
机器学习-simHash文本去重
有1亿个不重复的64位的01字符串,任意给出一个64位的01字符串f,如何快速从中找出与f汉明距离小于3的字符串? 大规模网页的近似查重主要翻译自WWW07的Detecting Near Duplicates for Web CrawlingWWW上存在大量内容近似相同的网页,对搜索引擎而言,去除近似相同的网页可以提高检索效率、降低存储开销。当爬虫在抓取网页时必须很快能...转载 2018-01-14 16:34:41 · 1554 阅读 · 0 评论 -
机器学习-特征工程
目录1 特征工程是什么?2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 标准化与归一化的区别 2.2 对定量特征二值化 2.3 对定性特征哑编码 2.4 缺失值计算 2.5 数据变换 2.6 回顾3 特征选择 3.1 Filter 3.1.1 方差选择法 3.1.2 相关系数法 3.1.3 卡方检验转载 2018-01-21 13:07:42 · 288 阅读 · 0 评论 -
Spark性能优化指南-基础篇
本文转载自美团点评技术团队博客,原文地址:http://tech.meituan.com/spark-tuning-basic.html前言在大数据计算领域,Spark已经成为了越来越流行、越来越受欢迎的计算平台之一。Spark的功能涵盖了大数据领域的离线批处理、SQL类处理、流式/实时计算、机器学习、图计算等各种不同类型的计算操作,应用范围与前景非常广泛。在美团•大众点评,已经有很多同学在各种转载 2017-11-26 10:34:46 · 339 阅读 · 0 评论 -
L2R 入门了解
前言:工作中要用到rank,实现使用point wise,接下来升级可能会用到pair wise,先对l2r算法做个简单的了解。学习资料:排序学习实践---ranknet方法【排序学习】基于Pairwise和Listwise的排序学习...转载 2018-06-03 18:53:38 · 1977 阅读 · 0 评论