自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (7)
  • 问答 (1)
  • 收藏
  • 关注

原创 Atlas2.1.0兼容CDH6.2.0部署

大数据元数据管理,cdh-atlas

2023-01-29 15:45:32 244

原创 基于spark-ml,gbdt scala实现 libsvm训练集和普通训练集

spark-ml,gbdt scla实现 普通训练集读取数据val conf = new SparkConf().setAppName("gbdt_ms").setMaster("local[*]")val spark = SparkSession.builder().config(conf).enableHiveSupport().getOrCreate()//读取原始数据val parsedRDD =spark.read.textFile("D:\\gbdt\\testSet.txt")

2020-06-17 09:23:27 664

原创 Idea Maven打包后不能读取resources下的配置文件

问题描述正常情况下,在idea中new FileInputStream("src/main/resources/table.xml")或者new File("src/main/resources/table.xml")程序可以执行,没有任何问题。如果打包后运行java -jar xx.java会报错找不到资源文件要取编译后的路径,而不是你看到的src/main/resources的路径。如下:URL url = MyTest.class.getClassLoader().

2020-06-07 18:08:47 5463

原创 Maven 打包的几种方式,最近遇到坑,总结一下

直接打包,不打包依赖包直接打包,不打包依赖包,仅打包出项目中的代码到JAR包中。在POM中添加如下plugin即可,随后执行maven install将依赖JAR包输出到lib目录方式将项目中的JAR包的依赖包输出到指定的目录下,修改outputDirectory配置,如下面的${project.build.directory}/lib。如想将打包好的JAR包可以通过命令直接运行,如java -jar xx.jar,还需要制定manifest配置的classpathPrefix与上.

2020-06-07 14:48:40 951

原创 Sparksql 2.x读取hive数表 IDEA scala程序

maven 依赖<dependency> <groupId>org.scala-lang</groupId> <artifactId>scala-library</artifactId> <version>2.11.0</version></dependency><dependency> <groupId>org.apache.spark<

2020-05-14 00:10:19 392

原创 IDEA maven搭建java-scala混合项目,简单快速

创建项目File->New->Project选择Java的版本,只要是1.8以上的就OK然后下一步:下一步Finish 完成对scala目录source一下Modules->选择scala目录->点击SourcesApply->ok选择Libraries添加scala SDK可以选择系统装的scala,也可以选择maven仓库的,但是要注意和自己的spark版本要一致,不然会有冲突...

2020-05-12 22:46:33 710

基于spark-ml,scala实现gbdt 算法,附带libsvm训练集和普通训练集实现

基于spark-ml,scala实现gbdt 算法,附带libsvm训练集和普通训练集实现,GBDT (Gradient Boosting Decision Tree) 梯度提升迭代决策树。GBDT 也是 Boosting 算法的一种,但是和 AdaBoost 算法不同(AdaBoost 算法上一篇文章已经介绍);区别如下:AdaBoost 算法是利用前一轮的弱学习器的误差来更新样本权重值,然后一轮一轮的迭代;GBDT 也是迭代,但是 GBDT 要求弱学习器必须是 CART 模型,而且 GBDT 在模型训练的时候,是要求模型预测的样本损失尽可能的小。

2020-06-16

java 实现深度学习逻辑demo

java 实现深度学习逻辑demo,一个输入层,一个输出层,单隐层。代码注释详细,神经网络各层节点,神经网络各节点误差,各层节点权重,各层节点权重动量,动量系数,学习系数

2020-06-02

NaiveBayes-java实现朴素贝叶斯算法,多分类附带训练集

P(X|Y) = P(X,Y)/P(Y) (条件概率)->P(X,Y) = P(X|Y)P(Y)->P(X,Y) = P(Y|X)P(X)->P(X|Y) = P(Y|X)P(X)/P(Y), p(yi|X) = P(yi)p(X|yi)/P(X) 其中P(X)为常数 p(yi|X) = P(yi)p(X|yi) p(yi|X)->某特征下是某类别的概率 P(yi)-> 先验概率(策略:最大似然估计) 某类别下该特征总数/该类别总数 p(X|yi)->某类别下出现某特征概率 前提:独立同分布

2020-06-02

java实现聚类算法,Kmeans

K-means聚类算法是一种迭代求解的聚类分析算法,其步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本,聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。

2020-06-02

java实现协同过滤算法,并附带测试集

基于java实现协同过滤算法,并附带测试集,假设用户喜欢跟他过去喜欢的物品相似的物品 ,历史上相似的物品在未来也相似 ,给定用户u,找到他过去喜欢的物品的集合R(u). , 把和R(u)相似的物品推荐给u.

2020-06-02

java 实现逻辑回归,附带训练集,详解回归算法-LR

java 实现逻辑回归,附带训练集,详解回归算法-LR,二分类问题,回归问题,监督学习,因变量y和自变量x的关系 ,最小化误差平方和

2020-01-07

hadoop 2.2.2 已编译源码

java 关联hadoop源码 查看底层实现,mapReduce实现 HDFS实现

2018-03-21

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除