数据分析
文章平均质量分 73
小舟科技
这个作者很懒,什么都没留下…
展开
-
我所归纳的机器学习常见面试题
1. 逻辑回归1.1 请说出逻辑回归的损失函数,并且推导出逻辑回归损失函数梯度。1.2 如果数据维度较大,比如上亿维度,逻辑回归应当怎样处理?1.3 如果需要做在线计算该怎么办?1.4 逻辑回归在什么情况下失效?2. 朴素贝叶斯2.1 请给出朴素贝叶斯方法的公式2.2 请用代码实现朴素贝叶斯进行文本分类3. SVM3.1 请介绍 SVM 的原理3.2 如果用原创 2017-12-17 13:22:06 · 583 阅读 · 0 评论 -
Rhadoop集群搭建
系统架构:这种死板的东西,只简要介绍。安装R:这个比较烦,开始几个节点无法联网,yum install R 报错。最后还是实现编译安装,当然编译一次,复制到其他节点即可。 CenOS7中安装,如果到官网下载,只能下载到readme https://mirrors.tuna.tsinghua.edu.cn/CRAN/ 查看原创 2017-12-17 13:43:33 · 356 阅读 · 0 评论 -
生日悖论
之前接触过,一个40个人的班上,总会有人同一天过生日,最后计算到,40人中,至少同一天过生日的概率非常大(超过80%),这也就是生日悖论。那么今天又遇到同样的问题,被人问到一下子卡住了。问题:n个人中,至少两个人有相同生日的概率是多少?当概率大于1/2的时候,n取最小多少?这个概率一下子没想到,所以搜索了一下:N个人中,有两个人生日相同的概率是没有人生日在同一天的概率是:C(365原创 2017-12-17 13:45:39 · 4393 阅读 · 0 评论