- 博客(1)
- 资源 (8)
- 收藏
- 关注
原创 文本分类问题的增量学习 PassiveAggressiveClassifier在线主动攻击型分类算法 大数据
实际解决机器学习问题过程中,我们会遇到一些“大数据”问题,比如有上百万条数据,上千上万维特征,此时数据存储已经达到10G这种级别。如果是文本分类分体,你还需要提取文本特征,这时候如果把数据load到内存,那占用内存就太大了,如何解决:1. 对数据进行降维?2. 使用流式或类似流式处理?3. 上大机器,高内存的,或者用spark集群。本文将要介绍的是一种增量学算法PassiveAggressiveC...
2017-12-27 16:47:00 6682 1
自适应确定DBSCAN算法参数的算法研究_李文杰.pdf
传统DBSCAN算法需要人为确定Eps和MinPts参数,参数的选择直接决定了聚类结果的合理性,因此提出一种新的自适应确定DBSCAN算法参数算法,该算法基于参数寻优策略,通过利用数据集自身分布特性生成候选Eps和MinPts参数,自动寻找聚类结果的簇数变化稳定区间,并将该区间中密度阈值最少时所对应的Eps和MinPts参数作为最优参数。实验结果表明,该算法能够实现聚类过程的全自动化并且能够选择合理的Eps和MinPts参数,得到了高准确度聚类结果。
2020-04-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人