- 博客(11)
- 资源 (12)
- 收藏
- 关注
原创 玩大数据期间碰到的一些问题总结
问题一:Zookeeper节点数量为什么建议是奇数个?原因是:“Zookeeper集群,当有一半以上的节点数在工作中的时候,集群才对外服务”。怎么理解上面这句话呢,用实验数据说话:实验一:设置节点数量为偶数 4, 启动 2 个节点。观察结果:集群不对外服务启动 3 个节点。观察结果:集群开始对外服务实验二:设置节点数量为奇数个 5启动3个节点。观察结果:集群开始对外服务总结:Zo...
2018-09-26 09:25:40 1055
原创 使用IntelliJ IDEA碰到的问题总结
文章目录问题一:无法创建Java Class文件问题一:无法创建Java Class文件今天打开项目时,发现右击新建不了java.class文件,于是尝试了以下方法:(1)选择 File——>Project Structure——>Project Settings——>Modules:(2)选择该项目的java存放的文件夹,将其设置为源文件,点击OK,apply即可...
2018-09-25 17:19:38 3205
原创 HA机制的大数据集群的搭建过程
集群规划说明:1、在hadoop2.0中通常由两个NameNode组成,一个处于active状态,另一个处于standby状态。Active NameNode对外提供服务,而Standby NameNode则不对外提供服务,仅同步active namenode的状态,以便能够在它失败时快速进行切换。主备NameNode之间通过一组JournalNode同步元数据信息,一条数据只要成功写入多数...
2018-09-21 17:29:41 683 1
原创 机器学习之朴素贝叶斯算法的推理及相关知识总结
1、朴素贝叶斯公式1.1、贝叶斯公式的应用2、了解贝叶斯网络2.1、知道什么是贝叶斯网络贝叶斯网络又称为有向无环图模型,是一种概率图模型,根据概率图的拓扑结构,考察一组随机变量(X1,X2,X3…Xn)及其n组条件概率分布的性质2.2、贝叶斯网络的两种表示形式2.3、掌握全连接的贝叶斯网络的公式p(x1,x2…,xk)=p(xK|x1,…,xK-1)…p(x2|x1)p(x...
2018-09-19 20:38:16 782 2
原创 机器学习之EM算法的原理推导及相关知识总结
文章目录1、知道先验概率和后验概率2、了解高斯混合模型GMM3、通过最大似然估计推导EM算法的过程的实例4、EM算法5、知道pLSA模型1、知道先验概率和后验概率先验概率(prior probability)是指根据以往经验和分析得到的概率(理解为自定义概率)。而后验概率是在考虑了一个事实之后的条件概率。2、了解高斯混合模型GMMEM是K-means的推广以下的两个问题都是属于无监督学习...
2018-09-17 20:34:16 1237
原创 机器学习之聚类算法的原理推导及相关知识总结
1、知道几个关于”差”的概念2、理解相似度度量的各种方法和相互关系2.1、欧氏距离2.2、jaccard相似系数2.3、余弦相似度2.4、Pearson相似系数3、掌握掌握K-Means算法3.1、知道聚类的思想3.2、K-Means算法原理3.3、知道K-Mediods聚类3.4、如何选取K-means的初始值3.5、K-means的目标函数4、知道聚类的衡量...
2018-09-15 17:00:54 1859
原创 机器学习之支持向量机(SVM)总结
目录:1、知道SVM相关的各种概念2、知道目标函数、损失函数、正则项的意义2.1、目标函数2.2、损失函数2.3、正则化(添加噪音避免过拟合)3、了解SVM算法原理4、知道SVM的目标函数5、知道SVM的损失函数以及公式6、知道SVM支持向量机的计算过程6.1、推导过程:6.2、推导实例7、了解核函数相关知识8、了解SVM算法的调参技巧目录:...
2018-09-12 20:39:35 1987
原创 机器学习之提升算法
1、知道提升、梯度提升是什么意思1.1、提升1.2、梯度提升1.3、了解提升算法的过程2、残差与残差平方和(residual sum of squares)3、了解GBDT算法4、了解XGBoost算法5、了解Adaboost算法5.1、Adaboost算法的原理5.2、例子6、偏差和方差1、知道提升、梯度提升是什么意思1.1、提升每一步产生一...
2018-09-10 20:07:09 1006
原创 机器学习之决策树与随机森林
目录1、了解熵、条件熵、互信息的概念及公式1.1、熵1.2、条件熵1.3、信息增益/互信息2、了解决策树2.1、了解决策树的概念和特点以及和熵的关系2.2、了解树生成的过程2.3、了解决策树三种算法的区别2.4、了解决策树的损失函数2.5、了解解决决策树过拟合的方法2.6、了解后剪枝的过程3、了解Bagging和随机森林4、掌握样本不均衡常用的处理方法...
2018-09-02 22:30:02 779
原创 机器学习之回归总结
目录1、了解线性回归2、了解似然函数3、了解交叉验证的原理4、梯度下降算法1、批量梯度下降算法(Batch Gradient Descent,简称BGD):2、随机梯度下降算法(SGD):3、折中:5、了解一些参数指标6、了解Logistic回归7、了解最小二乘法目录1、了解线性回归当只有一个变量的时候,可以表示为下面的式子。 当为多个特征...
2018-09-02 16:52:05 1255
原创 机器学习之凸优化原理推导及相关知识总结
1、了解凸集和仿射集的基本概念。凸集:在凸集内部的两个点之间的线段仍在图形内,则称这个图形为凸集。 仿射集:通过集合中任意两个不同点的直线仍然在这个集合内则称为这个集合的仿射集。 仿射集说的是直线,凸集说的是线段。 2、知道几何体的向量表达。两个θ+(1-θ)=1代表的是两个点之间的关系是直线关系,如果不等于1则代表是其他的非线性的关系。 3、了解超平面和半空间的概...
2018-09-01 13:43:48 1543
中国计算机学会推荐各种国际学术会议和期刊目录
2018-06-01
Linux命令大全.chm版下载
2017-10-21
mysql-connector-java-5.1.32.jar
2017-10-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人