自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

转载 中科院分词ICTCLAS5.0 配置错误处理

转载自:http://gdhapple.blog.163.com/blog/static/12685791720122832029133/2012-03-08 15:48:15|  分类: Java |  标签:ictclas  错误  unsatisfiedlinkerror  ctclas_init([b)z  ictclas.log  错误一:

2013-10-29 17:20:48 7759 4

转载 Poisson 分布

转载自:http://episte.math.ntu.edu.tw/articles/sm/sm_16_07_1/index.html这个来自台大的网站蛮多有意思的内容,要是能翻译成简体就更好了~写的很清楚,适合放在教科书上。曹亮吉   二項分布是離散型機率模型中最有名的一個,其次是 Poisson 分

2013-10-17 01:32:07 1634

转载 使用PDFBox处理PDF文档

转载自:http://www.cnblogs.com/hejycpu/archive/2009/01/19/1378380.html前面的介绍文本是转载的,实际上和一本书上的内容大致相同(除了代码)。1、使用PDFBox处理PDF文档PDF全称Portable Document Format,是Adobe公司开发的电子文件格式。这种文件格式与操作系统平台无关

2013-10-16 14:25:29 2469 1

转载 Python3.x自定义比较函数

转载自:http://blog.csdn.net/greatpresident/article/details/8435259分类: Python2012-12-25 23:28 417人阅读 评论(0) 收藏 举报目录(?)[+]在Python3.x的世界里,cmp函数没有了。那么sorted,min,max等需要比较函数作为参数的函数该如何用呢?

2013-10-14 21:02:09 2241

转载 大数据能做什么

技术角度的大数据。原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 、作者信息和本声明。否则将追究法律责任。http://slaytanic.blog.51cto.com/2057708/1142958Hadoop和大数据是这两年最火的词儿们之一,越来越多的公司对这个东西感兴趣,但是我接触到的大多数公司里的人,无论是技术人员还是老板。都不知道怎么能把这些东

2013-10-13 11:11:05 1097

转载 为什么Hadoop是用Java实现的?

来自知乎:http://www.zhihu.com/question/198660389 个回答赞同14反对,不会显示你的姓名周亮,关注程序,也关注秩序,思考算法,也思考…Alan Yeung、知乎用户、王涛 等人赞同Hadoop的创始人是Doug Cutting, 同时也是著名的基于Jav

2013-10-12 12:32:01 6877

转载 linux grep命令

转自:http://www.cnblogs.com/end/archive/2012/02/21/2360965.html1.作用Linux系统中grep命令是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹 配的行打印出来。grep全称是Global Regular Expression Print,表示全局正则表达式版本,它的使用权限是所有用户。2.格式gre

2013-10-12 01:29:52 1245

转载 word2vec的学习思路

转载自:http://www.douban.com/note/298095260/夜里坐在椅子上发着呆,想着到底接下来学点什么比较合适,大脑里把知识列举了一遍,却突然间把之前一直没有想通的word2vec明白了一些。大致说一下该算法的学习顺序所及参考文献。不会Latex的人只能截图了…..1. 多层神经网络 

2013-10-10 11:30:19 3178

转载 用中文把玩Google开源的Deep-Learning项目word2vec

转载自:http://www.cnblogs.com/wowarsenal/p/3293586.htmlgoogle最近新开放出word2vec项目,该项目使用deep-learning技术将term表示为向量,由此计算term之间的相似度,对term聚类等,该项目也支持phrase的自动识别,以及与term等同的计算。word2vec项目首页:https://code

2013-10-10 11:27:28 17327 3

转载 利用word2vec对关键词进行聚类

转载自:http://blog.csdn.net/zhaoxinfan/article/details/11069485继上次提取关键词之后,项目组长又要求我对关键词进行聚类。说实话,我不太明白对关键词聚类跟新闻推荐有什么联系,不过他说什么我照做就是了。按照一般的思路,可以用新闻ID向量来表示某个关键词,这就像广告推荐系统里面用用户访问类别向量来表示用户一样,然后就可以用kmean

2013-10-10 11:07:39 41194 5

转载 链接分析算法之:SALSA算法

转载自:http://blog.csdn.net/hguisu/article/details/8016916        SALSA算法的初衷希望能够结合PageRank和HITS算法两者的主要特点,既可以利用HITS算法与查询相关的特点,也可以采纳PageRank的“随机游走模型”,这是SALSA算法提出的背景。由此可见,SALSA算法融合了PageRank和HITS算法的基本思想,

2013-10-07 20:21:12 1720

转载 链接分析算法之:Hilltop算法

转载自:http://blog.csdn.net/hguisu/article/details/8021036       Hilltop算法是由Krishna Baharat 在2000年左右研究的,于2001年申请专利,但是有很多人以为Hilltop算法是由谷歌研究的。只不过是Krishna Baharat 后来加入了Google成为了一名核心工程师,然后授权给Google使用的。

2013-10-07 20:18:37 969

转载 搜索引起的链接分析-计算网页的重要性

转载自:http://blog.csdn.net/hguisu/article/details/79957031. 链接分析       搜索引擎在查找能够满足用户请求的网页时,主要考虑两方面的因素:        网页和查询的相关性:是用户发出的查询与网页内容的内容相似性得分。        网页的重要性:通过链接分析方法计算获得的得分。        搜

2013-10-07 20:17:43 1082

转载 PageRank算法

转载自:http://blog.csdn.net/hguisu/article/details/79961851. PageRank算法概述         PageRank,即网页排名,又称网页级别、Google左侧排名或佩奇排名。        是Google创始人拉里·佩奇和谢尔盖·布林于1997年构建早期的搜索系统原型时提出的链接分析算法,自从Google在商业上获

2013-10-07 20:16:15 994

转载 链接分析算法之:主题敏感PageRank

转载自:http://blog.csdn.net/hguisu/article/details/8005192        前面的讨论提到。PageRank忽略了主题相关性,导致结果的相关性和主题性降低,对于不同的用户,甚至有很大的差别。例如,当搜索“苹果”时,一个数码爱好者可能是想要看 iphone 的信息,一个果农可能是想看苹果的价格走势和种植技巧,而一个小朋友可能在找苹果的简笔画。

2013-10-07 20:14:02 1119

转载 链接分析算法之:HITS算法

转载自:http://blog.csdn.net/hguisu/article/details/8013489    HITS(HITS(Hyperlink - Induced Topic Search) ) 算法是由康奈尔大学( Cornell University ) 的Jon Kleinberg 博士于1997 年首先提出的,为IBM 公司阿尔马登研究中心( IBM Almaden

2013-10-07 20:09:49 1423

转载 python常用50个模块

转载自:http://blog.csdn.net/pfanaya/article/details/7567077Python具有强大的扩展能力,我列出了50个很棒的Python模块,包含几乎所有的需要:比如Databases,GUIs,Images, Sound, OS interaction, Web,以及其他。推荐收藏。 Graphical interface wxPython

2013-10-06 01:17:14 20249 2

转载 windows下python安装Numpy和Scipy模块

转载自:http://blog.csdn.net/pfanaya/article/details/7451815http://sourceforge.net/projects/numpy/files/NumPyhttp://sourceforge.net/projects/scipy/files/Scipy下载和你Python版本相应对的exe文件安装即可。

2013-10-06 01:16:14 4741

转载 Python下科学计算包numpy和SciPy的安装

转载自:http://blog.sina.com.cn/s/blog_62dfdc740101aoo6.htmlPython下大多数工具包的安装都很简单,只需要执行 “python setup.py install”命令即可。然而,由于SciPy和numpy这两个科学计算包的依赖关系较多,安装过程较为复杂。网上教程较为混乱,而且照着做基本都不能用。在仔细研读各个包里的README和IN

2013-10-06 01:13:43 16399 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除