clustering
文章平均质量分 50
Ben_Fu
对推荐系统、机器学习、自然语言处理领域有浓厚兴趣,北京大学计算机博士毕业。github搜索BinFuPKU。目前在一家大模型公司负责大语言模型微调对齐和安全研究和落地。
展开
-
Cluster: EM
EM聚类算法(survey)最近项目需要对Cluster进行一个survey,需要利用cluster进行feature selection,觉得EM聚类也算是一个比较经典算法。原创 2015-10-12 18:57:32 · 936 阅读 · 0 评论 -
Cluster: FarthestFirst
顾名思义,每一次取最远的那个点,那么farthest在cluster如何使用的呢? 我们知道在层次聚类特别是凝聚类中每次合并的是最近两个cluster,假设这里的cost是指当前所有聚类中最大的那个半径,那么如何设计一个近似算法并证明其cost与最优k-cluster的cost比值满足一定界限。原创 2015-10-14 10:56:19 · 3153 阅读 · 0 评论 -
Cluster: ROCK & CLOPE
在实际问题中我们经常会碰都一些类别类型的数据,比如电子商务中交易型数据,在这些数据上进行聚类我们无法采用基于距离的空间几何做法,有人便说可以采用相似度来做,比如jaccard系数、互信息等,确实可以如此,这里针对类别型数据讨论两种聚类算法。原创 2015-10-14 19:44:04 · 903 阅读 · 0 评论