自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 资源 (1)
  • 收藏
  • 关注

原创 Spark ML LR 用 setWeightCol 解决数据不平衡

前言 如题,记录在Spark ML LR中如何解决数据不平衡。参考:Dealing with unbalanced datasets in Spark MLlib 1、数据不平衡 指label == 1和label == 0 的数据比例的很多,如80%和20%,这样导致模型的结果的准确率也不平衡,不准确。 2、setWeightCol 主要代码 val labelCol = "label" de...

2019-12-06 16:42:21 1379 1

flink.tar.gz

flink

2024-07-20

hudi-spark3.2-bundle-2.12-0.13.0.jar hudi sql 保存 extraMetadata

hudi-spark3.2-bundle-2.12-0.13.0.jar hudi sql 保存 extraMetadata

2024-06-13

QQ截图工具独立版-不需要安装QQ

不安装QQ、不登录QQ即可使用QQ截图工具 使用方法:1、下载文件之后先解压; 2、运行Init.bat 3、桌面会有一个图标,双击运行可以启动QQ截图; 4、在右下角拖盘有可以设置的地方

2024-02-18

flink-sql-connector-hbase-2.2-1.15.4.jar

flink 读写 hbase 添加参数 hbase.conf.dir,支持参数自定义hbase-site.xml

2023-12-08

Spark SQL增量查询Hudi表-Spark3.1.2-jar包

通过修改源码,支持set方式增量查询Hudi包

2022-11-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除