自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (9)
  • 问答 (1)
  • 收藏
  • 关注

原创 Spark -- Spark的smote算法,非平衡数据处理示例

向导介绍代码github参考代码修改后代码结果根据我司需求的一个完整代码测试数据完整代码结果介绍  相关的理论,和代码可以参考:https://www.cnblogs.com/little-horse/p/11241168.html,这个参考代码我看了感觉有点偏老和偏复杂,于是找了另外一个版本。  spark的issues:https://issues.apache.org/jira/bro...

2020-03-26 16:47:22 1856 1

原创 SparkML -- LightGBM On Spark 导出pmml示例

向导MAVEN测试数据代码示例,以二分类为例结果MAVEN<dependency> <groupId>org.jpmml</groupId> <artifactId>jpmml-sparkml</artifactId> <version>1.5.0</version><!-- ...

2020-03-23 15:17:04 1062 1

原创 SparkML -- LightGBM On Spark 重要性LightGBMRanker示例

向导MAVEN测试数据代码示例结果MAVEN<dependency> <groupId>com.microsoft.ml.spark</groupId> <artifactId>mmlspark_2.11</artifactId> <version>0.18.0</version>...

2020-03-23 15:10:25 2053 4

原创 SparkML -- LightGBM On Spark 回归LightGBMRegressor示例

向导MAVEN测试数据代码示例结果MAVEN<dependency> <groupId>com.microsoft.ml.spark</groupId> <artifactId>mmlspark_2.11</artifactId> <version>0.18.0</version>...

2020-03-23 15:05:54 1642 3

原创 SparkML -- LightGBM On Spark 二分类LightGBMClassifier示例

向导MAVEN测试数据代码示例结果MAVEN<dependency> <groupId>com.microsoft.ml.spark</groupId> <artifactId>mmlspark_2.11</artifactId> <version>0.18.0</version>...

2020-03-23 15:03:35 2863 14

原创 SparkML -- LightGBM On Spark

向导介绍MML介绍  LightGBM是使用基于树的学习算法的梯度增强框架。它被设计为分布式且高效的,具有以下优点:训练速度更快,效率更高。降低内存使用率。更好的准确性。支持并行和GPU学习。能够处理大规模数据  LightGBM比XGBoost快将近10倍,内存占用率大约为XGBoost的1/6,并且准确率也有提升。官网地址:https://lightgbm.readthed...

2020-03-23 14:32:08 2485

原创 SpringBoot -- 通过简单的修改配置修改连接的数据库

向导背景方案SpringBoot篇单数据源情况1.通过spring.profile.active控制2.通过指定的配置参数决定数据源多数据源情况Spring篇背景  项目要求,开发环境使用postgres数据库,给客户部署时使用oracle,而只需要修改一个配置来完成。方案对于单数据源,保证容器中只有一个DataSource。对于多数据源,保证需要灵活变化的那个DataSource容器...

2020-03-22 11:58:03 5280

原创 Spark -- 对DataFrame增加一列索引列(自增id列)

向导Spark DataFrame 添加自增id利用RDD的 zipWithIndex算子使用SparkSQL的functionSpark DataFrame 添加自增id  在用Spark 处理数据的时候,经常需要给全量数据增加一列自增ID序号,在存入数据库的时候,自增ID也常常是一个很关键的要素。在使用mmlspark的LightGBMRanker时也需要指定一列int/long类型的id...

2020-03-17 15:44:24 6198 1

原创 EasyExcel -- easyexcel的下载和自定义单元格合并

向导1. 介绍2.需求3.代码3.1 pom3.2 Controller3.3 ExcelUtil代码3.4 BizMergeStrategy代码3.5 ExcelDto代码3.6 RowRangeDto代码1. 介绍  EastExcel是Alibaba的开源工具,比POI更加快速高效,使用起来也简单。  官网地址为:https://alibaba-easyexcel.github.io/...

2020-03-16 23:02:17 20083 39

Elasticsearch V6.3.2 CDC 组件

Elasticsearch V6.3.2 CDC 组件

2023-03-15

HeimaCodeUtil 代码生成器

非常好用的代码生成器,支持多种代码模板生成,包括前端页面。支持以下模板: 1.SSM+dubbox+angularJS(服务层+WEB层) 2.SSH2+easyUI架构; 3.SSH2+angularJS+bootstrap架构 4.SpringBoot+StringDataJPA微服务 的代码自动生成,还可以自定义模板结构 支持oracle+mysql多数据库。 绝对真实,4个模板。

2019-10-18

用户画像全面剖析,心血实战价值万金!47页PPT干货解密

本资源是ppt的pdf版本,包含47页,讲解还算详细,大致都讲到了,对了解用户画像是有很大帮助的。

2018-12-29

hadoop-bin winutils 2.6.4,x64版本

此版本是Hadoop-2.6.4的winutils工具,直接将bin中文件覆盖即可在win下使用hadoop,此版本是在64位系统编译,win10、8、7皆可以使用,欢迎下载。

2018-12-28

hadoop-bin winutils 3.0.0,x64版本

此版本是Hadoop-3.0.0的winutils工具,直接将bin中文件覆盖即可在win下使用hadoop,此版本是在64位系统编译,win10、8、7皆可以使用,欢迎下载

2018-12-28

hadoop-bin winutils 2.6.3,x64版本

此版本是Hadoop-2.6.3的winutils工具,直接将bin中文件覆盖即可在win下使用hadoop,此版本是在64位系统编译,win10、8、7皆可以使用,欢迎下载

2018-12-28

hadoop-bin winutils 2.6.0,x64版本

此版本是Hadoop-2.6.0的winutils工具,直接将bin中文件覆盖即可在win下使用hadoop,此版本是在64位系统编译,win10、8、7皆可以使用,欢迎下载。

2018-12-28

hadoop-bin winutils 2.8.3,x64

此版本是Hadoop-2.8.3的winutils工具,直接将bin中文件覆盖即可在win下使用hadoop,此版本是在64位系统编译,win10、8、7皆可以使用,欢迎下载。

2018-12-28

hadoop-bin winutils 2.8.1,x64

此版本是Hadoop-2.8.1的winutils工具,直接将bin中文件覆盖即可在win下使用hadoop,此版本是在64位系统编译,win10、8、7皆可以使用,欢迎下载。

2018-12-27

hadoop-bin winutils 2.7.1,x64

此版本是Hadoop-2.7.1的winutils工具,直接将bin中文件覆盖即可在win下使用hadoop,此版本是在64位系统编译,win10、8、7皆可以使用,欢迎下载。

2018-12-27

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除