自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (12)
  • 收藏
  • 关注

原创 玩大数据期间碰到的一些问题总结

问题一:Zookeeper节点数量为什么建议是奇数个?原因是:“Zookeeper集群,当有一半以上的节点数在工作中的时候,集群才对外服务”。怎么理解上面这句话呢,用实验数据说话:实验一:设置节点数量为偶数 4, 启动 2 个节点。观察结果:集群不对外服务启动 3 个节点。观察结果:集群开始对外服务实验二:设置节点数量为奇数个 5启动3个节点。观察结果:集群开始对外服务总结:Zo...

2018-09-26 09:25:40 1055

原创 使用IntelliJ IDEA碰到的问题总结

文章目录问题一:无法创建Java Class文件问题一:无法创建Java Class文件今天打开项目时,发现右击新建不了java.class文件,于是尝试了以下方法:(1)选择 File——>Project Structure——>Project Settings——>Modules:(2)选择该项目的java存放的文件夹,将其设置为源文件,点击OK,apply即可...

2018-09-25 17:19:38 3205

原创 HA机制的大数据集群的搭建过程

集群规划说明:1、在hadoop2.0中通常由两个NameNode组成,一个处于active状态,另一个处于standby状态。Active NameNode对外提供服务,而Standby NameNode则不对外提供服务,仅同步active namenode的状态,以便能够在它失败时快速进行切换。主备NameNode之间通过一组JournalNode同步元数据信息,一条数据只要成功写入多数...

2018-09-21 17:29:41 683 1

原创 机器学习之朴素贝叶斯算法的推理及相关知识总结

1、朴素贝叶斯公式1.1、贝叶斯公式的应用2、了解贝叶斯网络2.1、知道什么是贝叶斯网络贝叶斯网络又称为有向无环图模型,是一种概率图模型,根据概率图的拓扑结构,考察一组随机变量(X1,X2,X3…Xn)及其n组条件概率分布的性质2.2、贝叶斯网络的两种表示形式2.3、掌握全连接的贝叶斯网络的公式p(x1,x2…,xk)=p(xK|x1,…,xK-1)…p(x2|x1)p(x...

2018-09-19 20:38:16 782 2

原创 机器学习之EM算法的原理推导及相关知识总结

文章目录1、知道先验概率和后验概率2、了解高斯混合模型GMM3、通过最大似然估计推导EM算法的过程的实例4、EM算法5、知道pLSA模型1、知道先验概率和后验概率先验概率(prior probability)是指根据以往经验和分析得到的概率(理解为自定义概率)。而后验概率是在考虑了一个事实之后的条件概率。2、了解高斯混合模型GMMEM是K-means的推广以下的两个问题都是属于无监督学习...

2018-09-17 20:34:16 1235

原创 机器学习之聚类算法的原理推导及相关知识总结

1、知道几个关于”差”的概念2、理解相似度度量的各种方法和相互关系2.1、欧氏距离2.2、jaccard相似系数2.3、余弦相似度2.4、Pearson相似系数3、掌握掌握K-Means算法3.1、知道聚类的思想3.2、K-Means算法原理3.3、知道K-Mediods聚类3.4、如何选取K-means的初始值3.5、K-means的目标函数4、知道聚类的衡量...

2018-09-15 17:00:54 1855

原创 机器学习之支持向量机(SVM)总结

目录:1、知道SVM相关的各种概念2、知道目标函数、损失函数、正则项的意义2.1、目标函数2.2、损失函数2.3、正则化(添加噪音避免过拟合)3、了解SVM算法原理4、知道SVM的目标函数5、知道SVM的损失函数以及公式6、知道SVM支持向量机的计算过程6.1、推导过程:6.2、推导实例7、了解核函数相关知识8、了解SVM算法的调参技巧目录:...

2018-09-12 20:39:35 1983

原创 机器学习之提升算法

1、知道提升、梯度提升是什么意思1.1、提升1.2、梯度提升1.3、了解提升算法的过程2、残差与残差平方和(residual sum of squares)3、了解GBDT算法4、了解XGBoost算法5、了解Adaboost算法5.1、Adaboost算法的原理5.2、例子6、偏差和方差1、知道提升、梯度提升是什么意思1.1、提升每一步产生一...

2018-09-10 20:07:09 1004

原创 机器学习之决策树与随机森林

目录1、了解熵、条件熵、互信息的概念及公式1.1、熵1.2、条件熵1.3、信息增益/互信息2、了解决策树2.1、了解决策树的概念和特点以及和熵的关系2.2、了解树生成的过程2.3、了解决策树三种算法的区别2.4、了解决策树的损失函数2.5、了解解决决策树过拟合的方法2.6、了解后剪枝的过程3、了解Bagging和随机森林4、掌握样本不均衡常用的处理方法...

2018-09-02 22:30:02 779

原创 机器学习之回归总结

目录1、了解线性回归2、了解似然函数3、了解交叉验证的原理4、梯度下降算法1、批量梯度下降算法(Batch Gradient Descent,简称BGD):2、随机梯度下降算法(SGD):3、折中:5、了解一些参数指标6、了解Logistic回归7、了解最小二乘法目录1、了解线性回归当只有一个变量的时候,可以表示为下面的式子。 当为多个特征...

2018-09-02 16:52:05 1253

原创 机器学习之凸优化原理推导及相关知识总结

1、了解凸集和仿射集的基本概念。凸集:在凸集内部的两个点之间的线段仍在图形内,则称这个图形为凸集。 仿射集:通过集合中任意两个不同点的直线仍然在这个集合内则称为这个集合的仿射集。 仿射集说的是直线,凸集说的是线段。 2、知道几何体的向量表达。两个θ+(1-θ)=1代表的是两个点之间的关系是直线关系,如果不等于1则代表是其他的非线性的关系。 3、了解超平面和半空间的概...

2018-09-01 13:43:48 1541

中国计算机学会推荐各种国际学术会议和期刊目录

中国计算机学会推荐各种国际学术会议和期刊目录包含主要罗列了国际上计算机相关的各个方向的顶级学术会议和期刊目录(包含A、B、C三个等级)。 包含的方向有: 计算机体系结构/并行与分布计算/存储系统 计算机网络 网络与信息安全 软件工程/系统软件/程序设计语言 数据库/数据挖掘/内容检索 计算机科学理论 计算机图形学与多媒体 人工智能 人机交互与普适计算 交叉/综合/新兴

2018-06-01

Linux命令大全.chm版下载

Linux离线手册,内部包含汉化的Linux命令格式及详细解释 Linux命令大全(修改版) 文件传输 备份压缩 文件管理 磁盘管理 磁盘维护 系统设置 系统管理 文档编辑 网络通讯 bye 功能说明:中断FTP连线并结束程序。 语  法:bye 补充说明:在ftp模式下,输入bye即可中断目前的连线作业,并结束ftp的执行。 ftpcount 功能说明:显示目前以FTP登入的用户人数。 语  法:ftpcount 补充说明:执行这项指令可得 知目前用FTP登入系统的人数以及FTP登入人数的上限。

2017-10-21

staruml-5.0

uml建模工具,常用于构建各种UML模型。简单快捷,欢迎使用

2017-10-19

mysql-connector-java-5.1.32.jar

hive安装。本地独立模式:在本地安装Mysql,元数据放到mySql内。支持hive数据方放入mysql的jar包

2017-10-18

hive-0.9.0

hive的低版本,适用于hadoop2.x版本,防止安装过程发生各种错误

2017-10-18

startuml中文版

startuml中文版敖德萨多adad阿斯蒂芬烦死哒更改阿道夫个电饭锅电饭锅十多个十多个但是合适的防守打法安抚发的萨芬

2017-09-27

工具Tomcat

一个简单的工具用于大数据中在网页上查看HDFS等资源,这时linux系统常用的软件之一,其他的软件会接着上传。

2017-09-18

钱能C++程序设计教程第二版课后答案

找了很久才找到的课后答案,属于稀缺资源

2017-02-21

二维码相关功能实现的类库

一个关于二维码扫描和二维码名片生成功能实现的类库,可引入工程中 实现配合我之前的文章,实现上述功能的实现

2016-10-19

微信图标大全包含APP中各种图标

APP中的各种图标,便于前端小伙伴直接获取图标。

2016-09-11

开源天气预报软件

开源天气预报软件

2016-08-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除