自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 资源 (5)
  • 收藏
  • 关注

转载 解决分类样本不平衡问题

样本不平衡会导致出现以下的问题: (1)少数类所包含的信息很有限,难以确定少数类数据的分布,即难以在内部挖掘规律,造成少数类的识别率低; (2)很多分类算法采用分治法,样本空间的逐渐划分会导致数据碎片问题,这样只能在各个独立的子空间中寻找数据的规律,对于少数类来说每个子空间中包含了很少的数据信息,一些跨空间的数据规律就不能被挖掘出来。 (3)不恰当的归纳偏置系统在存在不确定时往往倾向于把样本分

2017-04-09 16:18:37 8619 1

原创 kafka+spark streaming例子入门

启动Kafka Server:bin/zookeeper-server-start.sh config/zookeeper.propertiesbin/kafka-server-start.sh config/server/properties创建topicbin/kafka-topics.sh --create --zookeeper localhost:2181 --replicatio

2017-04-07 09:44:41 869

spark mllib特征使用案例讲解

讲述了spark 中提供的spark 相关特征操作

2018-11-30

jv m理解以及调优

jvm讲解以及常用g c方法以及调优

2018-11-30

基于 Spark 的矩阵分解推荐算法

基于 Spark 的矩阵分解推荐算法

2017-11-13

计算机毕业设计开题报告+任务书+外文翻译+论文模板

计算机学生毕业设计模板,里面包含毕业设计,开题报告,外文翻译,工作总结,文献综述的模板!

2015-03-11

mysql软件下载

如果需要就下载吧。支持64位操作系统。如果想要操作简便可以下载另一个navicat第三方软件哦

2015-03-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除