![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据处理与分析
knowfarhhy
开始恢复 写一些学习记录
展开
-
解决分类样本不平衡问题
样本不平衡会导致出现以下的问题: (1)少数类所包含的信息很有限,难以确定少数类数据的分布,即难以在内部挖掘规律,造成少数类的识别率低; (2)很多分类算法采用分治法,样本空间的逐渐划分会导致数据碎片问题,这样只能在各个独立的子空间中寻找数据的规律,对于少数类来说每个子空间中包含了很少的数据信息,一些跨空间的数据规律就不能被挖掘出来。 (3)不恰当的归纳偏置系统在存在不确定时往往倾向于把样本分转载 2017-04-09 16:18:37 · 8692 阅读 · 1 评论 -
redis基础介绍及其常见问题
为什么分布式一定要有Redis?考虑到绝大部分写业务的程序员,在实际开发中使用 Redis 的时候,只会 Set Value 和 Get Value 两个操作,对 Redis 整体缺乏一个认知。所以我斗胆以 Redis 为题材,对 Redis 常见问题做一个总结,希望能够弥补大家的知识盲点。本文围绕以下几点进行阐述:为什么使用 Redis使用 Redis 有什么缺点单线程的 Re...转载 2018-07-21 11:12:17 · 810 阅读 · 0 评论 -
Datax大致的一个流程,持续完善!
原创 2019-06-11 20:56:37 · 643 阅读 · 0 评论