artical weekly

1. Human Factors in Data Science

the paper reviewed that human factors in data generation and management, processing and mining,application. human acts four roles in DS stack, including data Generators, Data Consumers, Data Processors, and Data Scientists.
given some use case to express the human factors in data science.
where is the evaluation?

2. Mining Maximal Cliques from an uncertain gragh ICDE 2015

uncertain gragh 指的是probalility distribution on a set of deterministic gragh
1)find a-maximal Cliques in an uncertain gragh,given maximal clique definition:a-极大团:M是a-极大团且加入任意一个顶点都不行成a-极大团
2) present matching upper and lower bounds for the largest number of maximal clliques within a gragh
3) present an algorithm to enumerate maximal clique
极大团问题是21个NP完全问题之一
极大团:团内两两顶点相连,再加入任意一个顶点都不形成团。uncertain gragh 上极大团的概率:每条边概率乘积(都要出现)
基本方法1:depth-first-search DFS with backtracking
给定一个顶点集(团),不断扩展,直到没有顶点可以加进来(字典序)
方法2:基本方法1+剪枝策略
Pruning strategy1:满足与现有团的所有顶点均连接的条件的顶点才考虑是否可也加进来,追踪这种顶点才more effective
Pruning strategy2:加入边的概率值会影响团的概率,要确保它满足a-极大团
Pruning strategy3:checking cost?
Enum-Uncertain-MC(C,q,I,X)算法
在这里插入图片描述
C:团的顶点集,max©:团的字典序最大的顶点。q:团现在的概率,I:加入后仍为a-极大团且<max©的顶点集合,X:加入后仍为a-极大团且>max©的顶点集合
1-3到无法增加时,(I,X为空集),得到一个a-极大团
4-10深度优先的方法加入顶点(更新参数及I,X,递归调用)直到得到一个团(with backtracking)
在这里插入图片描述
GenerateI():更新I集合
1:刚刚新增点
在这里插入图片描述
以m为顶点的边的另一个顶点的集合
2-4:更新I集合的顶点,删除I集合中与m不邻近的点
5-11:更新I集合的顶点的概率值(此概率值为增加对应的顶点后应增加的概率值),
本文证明了图中最大团的个数的上下限、算法的正确性、runtime
亮点:严谨的证明和详细的实验,通过观察,为算法提供剪枝策略

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值