- 博客(8)
- 资源 (81)
- 收藏
- 关注
原创 【机器学习】李航 统计学习方法 知识点总结
机器学习实战代码阅读目录知识点 感知机 k近邻法 朴素贝叶斯 决策树 logistic回归和最大熵模型 支持向量机 提升方法 EM算法 隐马尔可夫模型(HMM) 统计学习方法总结 神经网络 K-Means Bagging Apriori 降维方法 引用因为要准备面试,本文以李航的《统计学习方法》为主,结合西瓜书等其他资料对机器学习知识做一个整理.知识点...
2019-06-21 10:43:42 17754 6
原创 Hive分区表的分区操作
Hive 没有行级别的数据的增删改,往表中装载数据唯一途径就是 使用大量数据进行装载,可以通过load 可以 insert动态分区,动态静态所以hive提供了一个动态分区功能,其可以基于查询参数的位置去推断分区的名称,从而建立分区注意:使用,insert...select 往表中导入数据时,查询的字段个数必须和目标的字段个数相同,不能多,也不能少,否则会报错。但是如果字段的类型不一致...
2019-06-27 13:52:34 3445
转载 代码行统计
一、先下载好SourceCounter小工具。解压,然后直接打开文件夹中的SourceCounter.exe。如果没有找到此工具的下载链接,点这里下载二、选择代码类型,勾选上所有类型三、双击点开后,选择文件夹,就可以直接统计出字数了...
2019-06-26 15:39:57 397 1
原创 【Linux 】理解bashrc和profile 的区别
在一般的 linux 或者 unix 系统中, 都可以通过编辑 bashrc 和 profile 来设置用户的工作环境, 很多文章对于 profile 和 bashrc 也都有使用, 但究竟每个文件都有什么作用和该如何使用呢?常见操作系统中的bashrc和profile我们先来看一下常见的Linux系统中的bashrc和profile:在CentOs中:/etc/profile...
2019-06-26 11:15:56 1034
转载 【机器学习】生成模型 判别模型
这篇博客是自己在学习生成模型与判别模型过程中的一些记录,整理了相关的文章后写成,感谢前辈们的辛苦总结简单的说,生成模型是从大量的数据中找规律,属于统计学习;而判别模型只关心不同类型的数据的差别,利用差别来分类。两个模型是啥我们从几句话进入这两个概念:1、机器学习分为有监督的机器学习和无监督的机器学习;2、有监督的机器学习就是已知训练集数据的类别情况来训练分类器,无监督的机器学习...
2019-06-19 17:30:15 11246 4
原创 【机器学习】贝叶斯定理、精准推断、最大似然估计、连续特征参数估计、EM算法
贝叶斯定理、精准推断、最大似然估计、连续特征参数估计、EM算法参考link,GMM通俗理解先验概率:事情未发生,根据以往经验估计事情发生概率后验概率:事情已经发生,根据事实去估计最可能导致此事发生的参数。最大似然估计:根据已经发生的事情,随机估计多个概率模型,然后最大概率下发生此事的最大概率模型。在统计学中,最大似然估计(英语:maximum likelihood estima...
2019-06-18 08:58:02 808
zookeeper.zip
2020-09-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人