![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文笔记和算法
风景不在对岸wj
这个作者很懒,什么都没留下…
展开
-
三元闭包与强弱联系
美国斯坦福大学教授Granovetter的The strength of weak ties论文提出了弱联结理论, 该理论认为:弱联结比强连接更能穿越不同的社会群体,因此能触及更多的人,穿过更大的社会距离。Granovetter发现多数人是通过私人关系介绍找到现在工作的,值得注意的是,这里的私人关系往往只是熟人(acquaintances),而非亲密朋友(close friends)。问题:为什么是转载 2015-10-21 17:26:40 · 1390 阅读 · 0 评论 -
学习笔记:聚类算法Kmeans/K-均值算法
前记 Kmeans是最简单的聚类算法之一,但是运用十分广泛,最近看到别人找实习笔试时有考到Kmeans,故复习一下顺手整理成一篇笔记。Kmeans的目标是:把n 个样本点划分到k 个类簇中,使得每个点都属于离它最近的质心对应的类簇,以之作为聚类的标准。质心,是指一个类簇内部所有样本点的均值。算法描述?12转载 2015-12-08 21:14:53 · 1099 阅读 · 0 评论 -
安装mysql
**安装程序并配置**1.下载到两个压缩文件:mysql-5.6.24-win32.rar和Navicat_V11.0.10_XiTongZhiJia.rar 全部解压之后放到C:\Program Files文件夹下,开始进行配置环境变量: 2.打开计算机——系统属性——高级系统设置,点击环境变量,进入环境变量设置菜单。 选中系统变量中的“path”,在path值开头处输入: C:\Prog原创 2016-02-27 16:15:04 · 454 阅读 · 0 评论 -
计算机会议排名等级
附件是计算机领域的学术会议等级排名情况,分为A+, A, B, C, L 共5个档次。其中A+属于顶级会议,基本是这个领域全世界大牛们参与和关注最多的会议。国内的研究者能在其中发表论文的话,是很值得骄傲的成就。A类也是非常好的会议了,尤其是一些热门的研究方向,A类的会议投稿多录用率低,部分A类会议影响力逐步逼近A+类会议。B类的会议分两种,一种称为盛会级,参与的人多,发表的论文也多,论转载 2016-05-16 16:27:46 · 19204 阅读 · 1 评论 -
TF-IDF及其算法
概念 TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜寻引擎应用,作为文转载 2016-05-19 18:42:57 · 587 阅读 · 0 评论 -
微博背后的那些算法
微博背后的那些算法原文地址引言微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作:原创、转发、回复、阅读、关注、@等。其中,前四个是针对短博文,最后的关注和@则针对的是用户之间的关系,关注某个人就意味着你成为他的粉丝,而他成为你的好友;@某个人意味着你想要他看到你的微博信息。微博被人们认为是“自媒体”,即普通大众分享与本身相关的“新闻”的途径。最近,有些转载 2016-10-24 10:00:11 · 1850 阅读 · 0 评论 -
shapley值法初学入门详细介绍
一、什么是shapley值法?shapley值法是指所得与自己的贡献相等,是一种分配方式。普遍用于经济活动中的利益合理分配等问题。最早由美国洛杉矶加州大学教授罗伊德·夏普利(Lloyd Shapley)提出。shapley值法的提出给合作博弈在理论上的重要突破及其以后的发展带来了重大影响。简单的来说就是使分配问题更加的合理,用于为分配问题提供一种合理的方式。例如,价值链利益分配问题转载 2016-10-31 20:11:46 · 49329 阅读 · 4 评论 -
聚类系数(clustering coefficient)计算
转自http://blog.csdn.net/pennyliang/article/details/6838956Clustering coefficient的定义有两种;全局的和局部的。全局的算法基于triplet。triplet分为开放的triplet(open triplet)和封闭的triplet(closed triplet)两种(A triplet is three nod转载 2016-10-31 22:18:01 · 57280 阅读 · 2 评论 -
看看大牛们是怎样获得英文综述(reviews)的?(干细胞论坛)
对于做实验的童鞋来说,平时看综述必不可少,可是如何获得自己想要的却并不是一件容易的事情,这里整理并推荐几种行之有效的方法:; [) I. S1 E' B& J, u- H5 f4 F3 A& Z* O( L1. http://www.annualreviews.org/,这是一个顶级的杂志群:Annual Reviews——出版社成立于1932年,是一家致力于向全球科学家提供高度概括、实用转载 2016-11-01 19:51:13 · 10052 阅读 · 0 评论 -
KNN与K-Means的区别
KNN(K-Nearest Neighbor)介绍Wikipedia上的 KNN词条 中有一个比较经典的图如下:KNN的算法过程是是这样的:从上图中我们可以看到,图中的数据集是良好的数据,即都打好了label,一类是蓝色的正方形,一类是红色的三角形,那个绿色的圆形是我们待分类的数据。如果K=3,那么离绿色点最近的有2个红色三角形和1个蓝色的正方形,这3个点投转载 2015-12-07 21:29:14 · 614 阅读 · 0 评论 -
此博文包含图片教你怎么看聚类分析的树状图
今天一群友在圈子里面贴了一个树状图,问怎么看,怎么划分,分几类?简单讲一下:有下面这样的一个树状图现在我们开始切了从右往左看,开始出现了2条横线,在此竖着切一刀,每一条线的左侧为1类这样我们把样本划分为2类第一类:中国第二类:其他国家或者地区继续往左走,在出现第三条横线的时候,竖着切一刀这样我们就把样本划分为3类转载 2015-12-07 10:15:18 · 9444 阅读 · 0 评论 -
社团划分——Fast Unfolding算法
社团划分——Fast Unfolding算法转载 2015-09-24 11:14:32 · 3948 阅读 · 1 评论 -
复杂网络入门读物
综合类专著中目前最全面的当属Newman的《网络引论》[1],最简洁的则是Dorogovtsev的《复杂网络讲义》[2]。2006年普林斯顿大学出过一本三巨头的专著,名字也很大气,叫做《网络结构与动力学》[3],但是不要有太高期望,因为这只是早期经典文献的一个汇编。Watts以前写过两本书,一本叫《六度》[4],一本叫《小世界》[5],Barabási写过一本名为《连接》[6]的小书,这些都可以看作转载 2015-11-22 10:09:18 · 3009 阅读 · 0 评论 -
《复杂网络理论及应用》
1 基本概念1.1.1 聚类系数:某个顶点 i , 与之相连的三角形数量/与之相连的三元组的数量。 1.1.2 度及度的分布 完全随机网络的度的分布近似为Poisson分布。其中,Poisson分布近似的可以认为是二项分布nà∞,p很小, np ~λ时的近似,泊松分布的均值λ~np。这样的网络也称为均匀网络。 幂律分布,度的分布ln ( P(k) ) ~ -r ln转载 2015-11-22 10:18:59 · 16483 阅读 · 0 评论 -
SNS背后的科学(1)从六度分隔到无尺度网络
SNS背后的科学(1)从六度分隔到无尺度网络 SocialBeta | 2010-05-11 14:00 此系列Blog连载于我的Blog和SocialBeta。欢迎各位关注SNS,社会化媒体的同学交流和指正。 0.前言 一次偶然机会,我了解到SNS在国外是一门科学。再读过一些相关书籍后,我认识到,对于SNS的产品设计师绝对有必要了解SNS的一些基本知识——这就如同为一个漂亮姑娘设计衣服转载 2015-11-17 21:49:38 · 1696 阅读 · 0 评论 -
基本Kmeans算法介绍及其实现
1.基本Kmeans算法[1][cpp] view plaincopy选择K个点作为初始质心 repeat 将每个点指派到最近的质心,形成K个簇 重新计算每个簇的质心 until 簇不发生变化或达到最大迭代次数 时间复杂度:O(tKmn),其中,t为迭代次数,K为簇的数目,m为记录数,n为维数 空间复杂度:O((m+K)n),其中,K为簇的数目,m为记录数,n为维转载 2015-11-01 10:32:51 · 532 阅读 · 0 评论 -
图的幂律度分布 power-law degree distributios
讲的一篇图论文中说到,“The natural graphs commonly found in the real-world have highly skewed power-law degree distributios ……”,开始只是了解个大概,后来经查才知道。power-law degree distributios原来是一种描述网络图中结点度的分布,中文可叫做“幂律度分布”。维基百科词条转载 2015-11-17 21:23:27 · 6353 阅读 · 0 评论 -
邻接矩阵存储的无向图深度优先(DFS)广度优先(BFS)遍历
图的两种存储方式:邻接矩阵和邻接表; 两种遍历方式:深度优先和广度优先;首先以一个结构体存储一个图:struct MGraph{ int vertex[maxvertex]; //存顶点 int arc[maxvertex][maxvertex]; //存边(邻接矩阵) int vertexnum,arcnum; //顶点数和边数};其次是转载 2015-11-19 09:55:03 · 3753 阅读 · 0 评论 -
最短路径算法--Dijkstra算法,Bellmanford算法,Floyd算法,Johnson算法
大数据技术虫最短路径算法在交通地图上,两地点之间的路径通常标有长度,我们可以用加权有向来描述地图上的交通网。加权有向图中每条路径都有一个路径权值,大小为该路径上所有边的权值之和。本节将重点讨论顶点之间最短路径问题。在实际问题中,路径权值还可以表示其它类型的开销,例如两地之间行程所需要的时间;两任务切换所需代价等。本节讨论的最短路径具有方向转载 2015-12-07 10:04:30 · 15580 阅读 · 0 评论 -
如何查找和阅读综述性的文章
转自http://blog.sina.com.cn/s/blog_4ded56360100wlwo.html查找 综述类文献 的方法有三种:第一种:直接用内容关键字+“overview、survey”这样的词,在各大数据库、google中直接搜索。这种方法的优点是简单。缺点有二:第一,有时搜索的内容比较多,容易陷入文献之海;第二,有些综述类的文献并没有overvie转载 2016-12-09 13:07:19 · 23411 阅读 · 0 评论