假设一个集合有N篇文章

最新推荐文章于 2020-12-20 14:39:01 发布

zdy0_2004

最新推荐文章于 2020-12-20 14:39:01 发布

阅读量547

点赞数

分类专栏：机器学习文章标签：机器学习

机器学习专栏收录该内容

193 篇文章 20 订阅

订阅专栏

聚类在数据挖掘领域有很多算法，到底哪个算法效果比较好，根据实际情况应该如何选择哪个算法，是数据分析应该要考虑的问题，简单来说也就是聚类效果评估。

假设一个集合有N篇文章

那么这个集合的集合对就有

C (2 N) = N ( N - 1 ) 2

个集合对

TP：同一类的文章被分到同一个簇
TN：不同类的文章被分到不同簇
FP：不同类的文章被分到同一个簇
FN：同一类的文章被分到不同簇

Rand Index 度量的正确的百分比:

R I = T P + T N T P + F P + F N + T N

T P + F P = C (2 6) + C (2 6) + C (2 6) = 40

T P = C (2 5) + C (2 4) + C (2 3) + C (2 2) = 20

因此，

F P = 40 - 20 = 20

同理,

F N + T N = (1 6) \times (1 6) + (1 6) \times (1 5) + C (1 6) \times C (1 5) = 96

F N = C (1 5) \times C (1 3) ＋ C (1 1) \times C (1 2) ＋ C (1 1) \times C (1 4) ＋ C (1 1) \times C (1 3) = 24

F P = 96 - 24 = 72

	同簇
同类	TP = 20
不同类	FP = 20

R I = 20 + 72 20 + 20 + 24 + 72 \approx 0.68

P r e c i s i o n ＝ T P T P + F P

R e c a l l ＝ T P T P + F N

$β > 1$
$F β ＝ ( β 2 + 1 ) \times R e c a l l \times P r e c i s i o n β 2 \times P r e c i s i o n + R e c a l l$

P r e c i s i o n ＝ 20 20 + 20 ＝ 0.5

R e c a l l ＝ 20 20 + 24 \approx 0.455

F 1 ＝ 2 \times 0.455 \times 0.5 0.455 + 0.5 \approx 0.48

业精于勤荒于嬉，行成于思而毁于随

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

zdy0_2004

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Java 并发集合：CopyOnWrite 写时复制集合介绍

栗筝i的博客

07-02

5345

写时复制（Copy-on-Write，简称COW）是一种计算机程序设计领域的优化策略。其核心思想是：如果有多个调用者同时请求相同资源（如内存或磁盘上的数据存储），他们会共同获取相同的指针指向相同的资源，直到某个调用者试图修改资源的内容时，系统才会真正复制一份专用副本给该调用者，而其他调用者所见到的最初的资源仍然保持不变。这一过程对其他的调用者都是透明的。当对容器进行写操作（这里的写可以理解为 “增、删、改”）时，为了避免读写操作同时进行而导致的线程安全问题。

NLP：N-Gram(gram窗口分段再统计)基于概率统计语言模型的简介(包括马尔可夫假设概述)、使用方法、案例应用之详细攻略

近期请国内外头部出版社可尽快私信博主！——心比天高，仗剑走天涯，保持热爱，奔赴向梦想！低调，谦虚，自律，反思，成长，还算是比较正能量的博主，公益免费传播……内心特别想在AI界做出一些可以推进历史进程影响力的东西(兴趣使然，有点小情怀，也有点使命感呀)…

01-08

1357

NLP：N-Gram(gram窗口分段再统计)基于概率统计语言模型的简介(包括马尔可夫假设概述)、案例应用之详细攻略目录 N-Gram的简介 N-Gram的使用方法 N-Gram的简介 1、N-Gram(窗口分段再统计)的概述—基于概率统计的语言模型：马尔科夫假设，文本稀疏性/不能长期记忆/泛化能力差/效率高/仍是基础主流背景 20世纪60年代晚期，IBM的研究员Fred Jelinek贾里尼克及其团队在语音识别任务中进行研究N-gram统计语言模型并应用。Jeline

参与评论您还未登录，请先登录后发表或查看评论

【BZOJ2839】集合计数【容斥原理】【二项式反演】

weixin_30511107的博客

08-04

156

题意：一个有nn个元素的集合有2n2n个不同子集（包含空集），现在要在这2N2N个集合中取出若干集合（至少一个），使得它们的交集的元素个数为kk，求取法的方案数，答案模109+7109+7。题解：我们先考虑有多少种取法，使得这些集合的交的大小至少为kk。答案记为α(k)α(k)。显然α(k)=Ckn×(22n−k−1)α(k)=Cnk×(22n−k−1)，相当...

bzoj2839集合计数容斥原理

老臣

10-01

342

题意：一个有N个元素的集合有2^N个不同子集（包含空集），现在要在这2^N个集合中取出若干集合（至少一个），使得它们的交集的元素个数为K，求取法的方案数，答案模1000000007。明显容斥啦。应该是选择k个-选择k+1个+选择k+2….. 那么我们设f[i]表示已经选择k个作为交集，剩下n-k个如何选择的方案。那么明显有f[i]=2^{2^(n-i)}-1,由于已经选择了k个，剩下n

容斥原理集合计数

蒟蒻QTY

10-18

1112

问题 J: 集合计数时间限制: 1 Sec 内存限制: 128 MB 题目描述一个有N个元素的集合有2^N个不同子集（包含空集），现在要在这2^N个集合中取出若干集合（至少一个），使得它们的交集的元素个数为K，求取法的方案数，答案模1000000007。（是质数喔~）输入一行两个整数N,K 输出一行为答案。样例输入 3 2 样例输出 6 提示【样例说明】

BZOJ2839:集合计数(容斥,组合数学)

weixin_34370347的博客

12-19

217

Description 一个有N个元素的集合有2^N个不同子集（包含空集），现在要在这2^N个集合中取出若干集合（至少一个），使得它们的交集的元素个数为K，求取法的方案数，答案模1000000007。（是质数喔~） Input 一行两个整数N,K Output 一行为答案。 Sample Input 3 2 Sample Output 6 HIN...

[BZOJ2839]集合计数

weixin_33982670的博客

07-05

992

集合计数题目描述一个有N个元素的集合有2^N个不同子集（包含空集），现在要在这2^N个集合中取出若干集合（至少一个），使得它们的交集的元素个数为K，求取法的方案数，答案模1000000007。（是质数喔~）输入格式一行两个整数N,K 输出格式一行为答案。 ...

python创建一个空集合的方法_Python创建一个空的dataframe,并循环赋值的方法

weixin_39678103的博客

12-02

4883

Python创建一个空的dataframe,并循环赋值的方法如下所示：# 创建一个空的 DataFramedf_empty = pd.DataFrame()#或者df_empty = pd.DataFrame(columns=['A', 'B', 'C', 'D'])#添加数据a为一个新的dataframedf_empty = df_empty.append(a)以上这篇Python创建一个空的d...

离散数学：n元素上的各种关系数目推导

热门推荐

zsdoujiang的博客

03-29

3万+

离散数学n元素上的各种关系数目写在开头关系的解释写在开头本着熟悉知识+经验分享的精神而作，如果有任何疑问可以联系博主，相互学习。文章材料部分（图像）来自互联网，如有侵权请联系博主删除！关系的解释假设有集合A，这里的关系指的是从A到 ...

python求n项和_python 输入一个数n,求n个数求乘或求和的实例

weixin_39621060的博客

12-20

6668

python 输入一个数n,求n个数求乘或求和的实例求和try:while True:n=input()s=1for x in raw_input().split():s=s+int(x)print sexcept EOFError:exit()求乘try:while True:n=input()s=1for x in raw_input().split():s=s*int(x)print sex...

子集选取 1

08-08

算法提高子集选取时间限制：1.0s 内存限制：256.0MB 问题描述　　一个有N个元素的集合有2^N个不同子集（包含空集），现在要在这2^N个

【bzoj2839】【集合计数】容斥原理+线性求阶乘逆元小技巧

LinnBlanc的博客

10-22

645

（上不了p站我要死了，侵权度娘背锅） Description 一个有N个元素的集合有2^N个不同子集（包含空集），现在要在这2^N个集合中取出若干集合（至少一个），使得它们的交集的元素个数为K，求取法的方案数，答案模1000000007。（是质数喔~） Input 一行两个整数N,K Output 一行为答案。 Sample Input 3 2

BZOJ 2839: 集合计数解题报告

weixin_30409849的博客

02-28

BZOJ 2839: 集合计数 Description 一个有$N$个元素的集合有$2^N$个不同子集（包含空集），现在要在这$2^N$个集合中取出若干集合（至少一个），使得它们的交集的元素个数为$K$，求取法的方案数，答案模$1000000007$。 Input 一行两个整数$N,K$ Output 一行为答案。 HINK 对于$100\%$的数据，\(1≤N≤10...

集合计数 count

MintGreen

04-28

860

题意简述：一个有n个元素的集合有2n2^n个不同子集（包含空集），现在要在这2n2^n个集合中取出若干集合（至少一个），使得它们的交集的元素个数为KK，求取法的方案数，答案模1000000007。(1≤N≤1000000,0≤K≤N)(1≤N≤1000000,0≤K≤N) 题解：任意选kk个最终交集，有CknC_n^k种取法，现在考虑已经固定了交集的kk个元素，那么剩下的n−kn-k个元素选出的集

集合计数

brucehb的专栏

01-02

481

给出N个固定集合{1，N},{2,N-1},{3,N-2},...,{N-1,2},{N,1}.求出有多少个集合满足：第一个元素是A的倍数且第二个元素是B的倍数。提示：对于第二组测试数据，集合分别是：{1,10},{2,9},{3,8},{4,7},{5,6},{6,5},{7,4},{8,3},{9,2},{10,1}.满足条件的是第2个和第8个。 Input 第1行：1个整数T

Bzoj 2839 集合计数题解

weixin_33912445的博客

10-16

142

2839: 集合计数 Time Limit:10 SecMemory Limit:128 MBSubmit:495Solved:271[Submit][Status][Discuss] Description 一个有N个元素的集合有2^N个不同子集（包含空集），现在要在这2^N个集合中取出若干集合（至少一个），使得它们的交集的元素个数为K，求取法的方案数，答案...

n个集合的容斥原理

weixin_41170664的博客

07-28

1万+

我们知道两个集合的容斥关系 A ∪ B = A + B - A∩B。三个集合又有怎样的关系呢 A∪B∪C = A+B+C - (A∩B+A∩C+B∩C) + A∩B∩C 三个集合的容斥原理关系这里不做推导过程可以看图自行推导从上面的两个例子中不难发现几个集合的并集等于集合的并集等于 = ①总体先相加→②减去任意两两相交的和→③加上任意三个相交的和。接下来猜...

读取附件中的文件（utf-8编码），统计并输出文章的前 n 行里共有多少字符（标点符号及换行符按字符统计），以及有多少个不重复的字符？帮我写一个Python代码