- 博客(19)
- 收藏
- 关注
转载 中科院分词ICTCLAS5.0 配置错误处理
转载自:http://gdhapple.blog.163.com/blog/static/12685791720122832029133/2012-03-08 15:48:15| 分类: Java | 标签:ictclas 错误 unsatisfiedlinkerror ctclas_init([b)z ictclas.log 错误一:
2013-10-29 17:20:48 7759 4
转载 Poisson 分布
转载自:http://episte.math.ntu.edu.tw/articles/sm/sm_16_07_1/index.html这个来自台大的网站蛮多有意思的内容,要是能翻译成简体就更好了~写的很清楚,适合放在教科书上。曹亮吉 二項分布是離散型機率模型中最有名的一個,其次是 Poisson 分
2013-10-17 01:32:07 1634
转载 使用PDFBox处理PDF文档
转载自:http://www.cnblogs.com/hejycpu/archive/2009/01/19/1378380.html前面的介绍文本是转载的,实际上和一本书上的内容大致相同(除了代码)。1、使用PDFBox处理PDF文档PDF全称Portable Document Format,是Adobe公司开发的电子文件格式。这种文件格式与操作系统平台无关
2013-10-16 14:25:29 2469 1
转载 Python3.x自定义比较函数
转载自:http://blog.csdn.net/greatpresident/article/details/8435259分类: Python2012-12-25 23:28 417人阅读 评论(0) 收藏 举报目录(?)[+]在Python3.x的世界里,cmp函数没有了。那么sorted,min,max等需要比较函数作为参数的函数该如何用呢?
2013-10-14 21:02:09 2241
转载 大数据能做什么
技术角度的大数据。原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 、作者信息和本声明。否则将追究法律责任。http://slaytanic.blog.51cto.com/2057708/1142958Hadoop和大数据是这两年最火的词儿们之一,越来越多的公司对这个东西感兴趣,但是我接触到的大多数公司里的人,无论是技术人员还是老板。都不知道怎么能把这些东
2013-10-13 11:11:05 1097
转载 为什么Hadoop是用Java实现的?
来自知乎:http://www.zhihu.com/question/198660389 个回答赞同14反对,不会显示你的姓名周亮,关注程序,也关注秩序,思考算法,也思考…Alan Yeung、知乎用户、王涛 等人赞同Hadoop的创始人是Doug Cutting, 同时也是著名的基于Jav
2013-10-12 12:32:01 6877
转载 linux grep命令
转自:http://www.cnblogs.com/end/archive/2012/02/21/2360965.html1.作用Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹 配的行打印出来。grep全称是Global Regular Expression Print,表示全局正则表达式版本,它的使用权限是所有用户。2.格式gre
2013-10-12 01:29:52 1245
转载 word2vec的学习思路
转载自:http://www.douban.com/note/298095260/夜里坐在椅子上发着呆,想着到底接下来学点什么比较合适,大脑里把知识列举了一遍,却突然间把之前一直没有想通的word2vec明白了一些。大致说一下该算法的学习顺序所及参考文献。不会Latex的人只能截图了…..1. 多层神经网络
2013-10-10 11:30:19 3178
转载 用中文把玩Google开源的Deep-Learning项目word2vec
转载自:http://www.cnblogs.com/wowarsenal/p/3293586.htmlgoogle最近新开放出word2vec项目,该项目使用deep-learning技术将term表示为向量,由此计算term之间的相似度,对term聚类等,该项目也支持phrase的自动识别,以及与term等同的计算。word2vec项目首页:https://code
2013-10-10 11:27:28 17327 3
转载 利用word2vec对关键词进行聚类
转载自:http://blog.csdn.net/zhaoxinfan/article/details/11069485继上次提取关键词之后,项目组长又要求我对关键词进行聚类。说实话,我不太明白对关键词聚类跟新闻推荐有什么联系,不过他说什么我照做就是了。按照一般的思路,可以用新闻ID向量来表示某个关键词,这就像广告推荐系统里面用用户访问类别向量来表示用户一样,然后就可以用kmean
2013-10-10 11:07:39 41194 5
转载 链接分析算法之:SALSA算法
转载自:http://blog.csdn.net/hguisu/article/details/8016916 SALSA算法的初衷希望能够结合PageRank和HITS算法两者的主要特点,既可以利用HITS算法与查询相关的特点,也可以采纳PageRank的“随机游走模型”,这是SALSA算法提出的背景。由此可见,SALSA算法融合了PageRank和HITS算法的基本思想,
2013-10-07 20:21:12 1720
转载 链接分析算法之:Hilltop算法
转载自:http://blog.csdn.net/hguisu/article/details/8021036 Hilltop算法是由Krishna Baharat 在2000年左右研究的,于2001年申请专利,但是有很多人以为Hilltop算法是由谷歌研究的。只不过是Krishna Baharat 后来加入了Google成为了一名核心工程师,然后授权给Google使用的。
2013-10-07 20:18:37 969
转载 搜索引起的链接分析-计算网页的重要性
转载自:http://blog.csdn.net/hguisu/article/details/79957031. 链接分析 搜索引擎在查找能够满足用户请求的网页时,主要考虑两方面的因素: 网页和查询的相关性:是用户发出的查询与网页内容的内容相似性得分。 网页的重要性:通过链接分析方法计算获得的得分。 搜
2013-10-07 20:17:43 1082
转载 PageRank算法
转载自:http://blog.csdn.net/hguisu/article/details/79961851. PageRank算法概述 PageRank,即网页排名,又称网页级别、Google左侧排名或佩奇排名。 是Google创始人拉里·佩奇和谢尔盖·布林于1997年构建早期的搜索系统原型时提出的链接分析算法,自从Google在商业上获
2013-10-07 20:16:15 994
转载 链接分析算法之:主题敏感PageRank
转载自:http://blog.csdn.net/hguisu/article/details/8005192 前面的讨论提到。PageRank忽略了主题相关性,导致结果的相关性和主题性降低,对于不同的用户,甚至有很大的差别。例如,当搜索“苹果”时,一个数码爱好者可能是想要看 iphone 的信息,一个果农可能是想看苹果的价格走势和种植技巧,而一个小朋友可能在找苹果的简笔画。
2013-10-07 20:14:02 1119
转载 链接分析算法之:HITS算法
转载自:http://blog.csdn.net/hguisu/article/details/8013489 HITS(HITS(Hyperlink - Induced Topic Search) ) 算法是由康奈尔大学( Cornell University ) 的Jon Kleinberg 博士于1997 年首先提出的,为IBM 公司阿尔马登研究中心( IBM Almaden
2013-10-07 20:09:49 1423
转载 python常用50个模块
转载自:http://blog.csdn.net/pfanaya/article/details/7567077Python具有强大的扩展能力,我列出了50个很棒的Python模块,包含几乎所有的需要:比如Databases,GUIs,Images, Sound, OS interaction, Web,以及其他。推荐收藏。 Graphical interface wxPython
2013-10-06 01:17:14 20249 2
转载 windows下python安装Numpy和Scipy模块
转载自:http://blog.csdn.net/pfanaya/article/details/7451815http://sourceforge.net/projects/numpy/files/NumPyhttp://sourceforge.net/projects/scipy/files/Scipy下载和你Python版本相应对的exe文件安装即可。
2013-10-06 01:16:14 4741
转载 Python下科学计算包numpy和SciPy的安装
转载自:http://blog.sina.com.cn/s/blog_62dfdc740101aoo6.htmlPython下大多数工具包的安装都很简单,只需要执行 “python setup.py install”命令即可。然而,由于SciPy和numpy这两个科学计算包的依赖关系较多,安装过程较为复杂。网上教程较为混乱,而且照着做基本都不能用。在仔细研读各个包里的README和IN
2013-10-06 01:13:43 16399 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人