- 博客(15)
- 资源 (41)
- 收藏
- 关注
原创 LdaGibbsSampler.java lda代码
/* * (C) Copyright 2005, Gregor Heinrich (gregor :: arbylon : net) (This file is * part of the org.knowceans experimental software packages.) *//* * LdaGibbsSampler is free software; you can redi
2013-05-22 13:38:26 3949 1
原创 建议的程序员学习LDA算法的步骤
一开始直接就下了Blei的原始的那篇论文来看,但是看了个开头就被Dirichlet分布和几个数学公式打倒,然后因为专心在写项目中的具体的代码,也就先放下了。但是因为发现完全忘记了本科学的概率和统计的内容,只好回头去看大学时候概率论的教材,发现早不知道借给谁了,于是上网买了本,花了几天时间大致回顾了一遍概率论的知识,什么贝叶斯全概率公式,正态分布,二项分布之类的。后来晚上没事儿的时候,去水木的A
2013-05-22 11:30:14 5414 3
原创 二十一世纪最性感的职业:数据科学家
性感事物方面的权威《哈佛商业评论》宣布,“数据科学家”是二十一世纪最性感的职业。所谓性感,既代表着难以名状的诱惑,又说明了大家都不知道它干的是什么。不管老板懂不懂数据科学家是干什么的,反正最近几年这个岗位的需求数正在快速攀升,Indeed.com的数据可以为证。但是其性感在什么地方?什么是数据科学家?他们是科学家吗?还是工程师?程序员?抑或是一个商业决策与创新者的新血统?Indeed.
2013-05-20 09:44:05 1554
原创 数据新闻的商业模式
数据新闻不过是对一股数十年前就已出现、并且正愈演愈烈的潮流的描述而已。新闻从业者没有意识到的是,这是有关提纯信息的生意,读者希望和每天出现在新闻中的数字发生联系。在该领域,全球各地涌现出一波创业潮。在所有关于数据新闻的兴趣和希望之中,有一个问题最为新闻编辑部关注:它的商业模式是什么?我们不能轻率地预言,也许可以从媒体行业的近况和现状中发现线索。事实是,已有很多新闻机构从
2013-05-20 09:43:31 1374
原创 手绘月薪万元生活 学区房让IT屌丝杯具一生
转自:http://house.qq.com/a/20130517/002338.htm#p=1以下是文件内容:25岁毕业,拿一万块钱月薪30岁,涨到一万五,期间无女盆友,吃10块钱盖饭,跟同学合租,挤2块钱地铁上下班,存钱25万31岁,啃老找父母要了35万块钱,买了50平米老房子一处,贷款90万,20年,月供6500。35岁0个月,认识
2013-05-18 10:20:03 2323 4
原创 解读传说中计算π的超牛的C程序
在我上大学的时候就流传着这样一个超牛的C程序,只用三行代码就能计算π到小数点后800位,还有的地方开玩笑说是外星人写的,的确是牛的不得了。那个时候大家一起研究都搞不懂,昨天看了一篇文章解释这段代码,今天自己试验了很久,终于弄明白了,所以记下来和大家一起交流。这段C代码是这样的:#include "stdio.h"long a=10000, b, c=2800, d, e, f[2801
2013-05-18 09:13:06 2602
原创 NLP常用工具
各种工具包的有效利用可以使研究者事半功倍。以下是NLP版版友们提供整理的NLP研究工具包。同时欢迎大家提供更多更好用的工具包,造福国内的NLP研究。*NLP Toolbox CLT http://complingone.georgetown.edu/~linguist/compling.html GATE http://gate.ac.uk/ Natural La
2013-05-17 14:45:50 5123
原创 自然语言处理(NLP)网上资源整理
最近把一些在网上见到的自然语言处理的资源整理了一下,包括论文列表、软件资源和一些实验室主页、个人主页等,希望能对NLP研究者有所帮助,由于个人视野有限,目前只整理了这些,以后会持续更新。在此也感谢这些资源的提供者和维护者。转载请标明出处(http://blog.csdn.net/xuh5156/article/details/7437475)论文、博客1. Goog
2013-05-17 14:28:09 3622
原创 搜索背后的奥秘——浅谈语义主题计算
摘要:两篇文档是否相关往往不只决定于字面上的词语重复,还取决于文字背后的语义关联。对语义关联的挖掘,可以让我们的搜索更加智能化。本文着重介绍了一个语义挖掘的利器:主题模型。主题模型是对文字隐含主题进行建模的方法。它克服了传统信息检索中文档相似度计算方法的缺点,并且能够在海量互联网数据中自动寻找出文字间的语义主题。近些年来各大互联网公司都开始了这方面的探索和尝试。就让我们看一下究竟吧。关键词
2013-05-17 12:41:53 1600
原创 字符串匹配算法总结
我想说一句“我日,我讨厌KMP!”。KMP虽然经典,但是理解起来极其复杂,好不容易理解好了,便起码来巨麻烦!老子就是今天图书馆在写了几个小时才勉强写了一个有bug的、效率不高的KMP,特别是计算next数组的部分。其实,比KMP算法速度快的算法大把大把,而且理解起来更简单,为何非要抓住KMP呢?笔试出现字符串模式匹配时直接上sunday算法,既简单又高效,何乐而不为?说实话,想
2013-05-16 16:13:53 1866
原创 linux下C实现线程池的源代码
ThreadPoolThreadPool头文件:/**//** * threadpool.h * * This file declares the functionality associated with * your implementation of a threadpool. * 线程池的实现 */#ifndef __threadpool_h__
2013-05-14 18:40:31 2957
原创 linux c++线程池的实现
线程池的原理大家都知道,直接上代码了^_^Thread.h[cpp] view plaincopyprint?#ifndef __THREAD_H #define __THREAD_H #include #include #include using namespace std; /** * 执行任务的类,设置任务数据并
2013-05-14 18:37:10 7708 1
原创 2013年第1季度中国互联网创业&融资分析报告
今天09:00~13:20,36氪将在国家会议中心的“全球移动互联网大会(GMIC)”3楼F厅,与长城会联合主办“开发者星球”会场,届时,36氪将对《中国互联网创业及融资分析报告》做详细解读,敬请参会同仁到场指教。36 氪发布了《2013年第1季度中国互联网创业&融资分析报告》。报告根据36氪+ 的数据以及外部收集的行业数据整理发布,从创业热点 & 地图、融资 & 并购、死亡地图、行业竞争
2013-05-08 11:20:44 2092
原创 Eclipse搭建J2EE+PHP+C/C++平台(使用CDT和PDT)
废柴是学习J2EE出身的,最近又希望能自学下PHP和C++。因为在做J2EE的时候eclipse用的很熟练,所以就希望能只使用eclipse就能完成J2EE和PHP还有C/C++的开发环境。然而实际上eclipse确实能做到这一点。不过存在一个问题,如果单独下载ECLIPSE的三个版本IDE的话,就相当于要在硬盘里放置3个eclipse,这无疑是一种浪费。于是废柴就在研究了一下如何
2013-05-06 22:41:15 4707
原创 做一个商业网站要多少钱?
经常看到有人问:做一个商业网站要多少钱? 有人说要几十万!有人说要几万! 有人说要几千! 还有人说要几百! 到底哪个是真的?徽剑的回答就是这些都是真的。我们来看下: 1) 最简单的建设方式:买一个虚拟主机空间,弄一套现成的程序,再买个域名,这就只要几百块。这是最简单的投入。 2) 复杂点的建设方式:买一个虚拟主机空间或者VPS虚拟服务器,弄一套现成的程序,稍
2013-05-03 16:34:06 2961 1
OpenRS— 开放式遥感数据处理与服务平台资料
2009-06-19
TinyXML解析xml文档
2008-12-29
Web+Services发布与调用(axis,xfire).doc
2008-12-27
COM+ Services.doc
2008-08-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人