1 说明
数据分类是一种机器学习和数据挖掘任务,被广泛应用在生物信息、模式识别、机器人等领域。目前,众多算法相继被提出:人工神经网络、贝叶斯、决策树、支持向量机等。当然了,虽然数据分类已经被广泛的研究,但仍然存在着问题。
问题1:传统的技术都是基于数据的物理特征(相似性、距离、分布)来达到分类的任务,但在实际中,无论数据样本之间的物理差异如何,我们都能够识别数据的组织结构(organizational structure),这个特征对分类任务会有很大的帮助,所以就出现这样一个问题:怎样利用计算机实现对数据组织结构特征的使用?
问题2:传统的分类算法平等的对待每一个样本,要对数据集有一个正确的理解就不能忽略每个样本个体的重要性。
编程区:
链接: 复杂网络|基于复杂网络的新型分类器.
文献区:
链接: 复杂网络半监督的社区划分算法.