自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 资源 (41)
  • 收藏
  • 关注

原创 LdaGibbsSampler.java lda代码

/* * (C) Copyright 2005, Gregor Heinrich (gregor :: arbylon : net) (This file is * part of the org.knowceans experimental software packages.) *//* * LdaGibbsSampler is free software; you can redi

2013-05-22 13:38:26 3949 1

原创 建议的程序员学习LDA算法的步骤

一开始直接就下了Blei的原始的那篇论文来看,但是看了个开头就被Dirichlet分布和几个数学公式打倒,然后因为专心在写项目中的具体的代码,也就先放下了。但是因为发现完全忘记了本科学的概率和统计的内容,只好回头去看大学时候概率论的教材,发现早不知道借给谁了,于是上网买了本,花了几天时间大致回顾了一遍概率论的知识,什么贝叶斯全概率公式,正态分布,二项分布之类的。后来晚上没事儿的时候,去水木的A

2013-05-22 11:30:14 5414 3

原创 二十一世纪最性感的职业:数据科学家

性感事物方面的权威《哈佛商业评论》宣布,“数据科学家”是二十一世纪最性感的职业。所谓性感,既代表着难以名状的诱惑,又说明了大家都不知道它干的是什么。不管老板懂不懂数据科学家是干什么的,反正最近几年这个岗位的需求数正在快速攀升,Indeed.com的数据可以为证。但是其性感在什么地方?什么是数据科学家?他们是科学家吗?还是工程师?程序员?抑或是一个商业决策与创新者的新血统?Indeed.

2013-05-20 09:44:05 1554

原创 数据新闻的商业模式

数据新闻不过是对一股数十年前就已出现、并且正愈演愈烈的潮流的描述而已。新闻从业者没有意识到的是,这是有关提纯信息的生意,读者希望和每天出现在新闻中的数字发生联系。在该领域,全球各地涌现出一波创业潮。在所有关于数据新闻的兴趣和希望之中,有一个问题最为新闻编辑部关注:它的商业模式是什么?我们不能轻率地预言,也许可以从媒体行业的近况和现状中发现线索。事实是,已有很多新闻机构从

2013-05-20 09:43:31 1374

原创 手绘月薪万元生活 学区房让IT屌丝杯具一生

转自:http://house.qq.com/a/20130517/002338.htm#p=1以下是文件内容:25岁毕业,拿一万块钱月薪30岁,涨到一万五,期间无女盆友,吃10块钱盖饭,跟同学合租,挤2块钱地铁上下班,存钱25万31岁,啃老找父母要了35万块钱,买了50平米老房子一处,贷款90万,20年,月供6500。35岁0个月,认识

2013-05-18 10:20:03 2323 4

原创 解读传说中计算π的超牛的C程序

在我上大学的时候就流传着这样一个超牛的C程序,只用三行代码就能计算π到小数点后800位,还有的地方开玩笑说是外星人写的,的确是牛的不得了。那个时候大家一起研究都搞不懂,昨天看了一篇文章解释这段代码,今天自己试验了很久,终于弄明白了,所以记下来和大家一起交流。这段C代码是这样的:#include "stdio.h"long a=10000, b, c=2800, d, e, f[2801

2013-05-18 09:13:06 2602

原创 NLP常用工具

各种工具包的有效利用可以使研究者事半功倍。以下是NLP版版友们提供整理的NLP研究工具包。同时欢迎大家提供更多更好用的工具包,造福国内的NLP研究。*NLP Toolbox  CLT http://complingone.georgetown.edu/~linguist/compling.html  GATE http://gate.ac.uk/  Natural La

2013-05-17 14:45:50 5123

原创 自然语言处理(NLP)网上资源整理

最近把一些在网上见到的自然语言处理的资源整理了一下,包括论文列表、软件资源和一些实验室主页、个人主页等,希望能对NLP研究者有所帮助,由于个人视野有限,目前只整理了这些,以后会持续更新。在此也感谢这些资源的提供者和维护者。转载请标明出处(http://blog.csdn.net/xuh5156/article/details/7437475)论文、博客1.       Goog

2013-05-17 14:28:09 3622

原创 搜索背后的奥秘——浅谈语义主题计算

摘要:两篇文档是否相关往往不只决定于字面上的词语重复,还取决于文字背后的语义关联。对语义关联的挖掘,可以让我们的搜索更加智能化。本文着重介绍了一个语义挖掘的利器:主题模型。主题模型是对文字隐含主题进行建模的方法。它克服了传统信息检索中文档相似度计算方法的缺点,并且能够在海量互联网数据中自动寻找出文字间的语义主题。近些年来各大互联网公司都开始了这方面的探索和尝试。就让我们看一下究竟吧。关键词

2013-05-17 12:41:53 1600

原创 字符串匹配算法总结

我想说一句“我日,我讨厌KMP!”。KMP虽然经典,但是理解起来极其复杂,好不容易理解好了,便起码来巨麻烦!老子就是今天图书馆在写了几个小时才勉强写了一个有bug的、效率不高的KMP,特别是计算next数组的部分。其实,比KMP算法速度快的算法大把大把,而且理解起来更简单,为何非要抓住KMP呢?笔试出现字符串模式匹配时直接上sunday算法,既简单又高效,何乐而不为?说实话,想

2013-05-16 16:13:53 1866

原创 linux下C实现线程池的源代码

ThreadPoolThreadPool头文件:/**//** * threadpool.h * * This file declares the functionality associated with * your implementation of a threadpool. * 线程池的实现 */#ifndef __threadpool_h__

2013-05-14 18:40:31 2957

原创 linux c++线程池的实现

线程池的原理大家都知道,直接上代码了^_^Thread.h[cpp] view plaincopyprint?#ifndef __THREAD_H   #define __THREAD_H     #include    #include    #include      using namespace std;    /**  * 执行任务的类,设置任务数据并

2013-05-14 18:37:10 7708 1

原创 2013年第1季度中国互联网创业&融资分析报告

今天09:00~13:20,36氪将在国家会议中心的“全球移动互联网大会(GMIC)”3楼F厅,与长城会联合主办“开发者星球”会场,届时,36氪将对《中国互联网创业及融资分析报告》做详细解读,敬请参会同仁到场指教。36 氪发布了《2013年第1季度中国互联网创业&融资分析报告》。报告根据36氪+ 的数据以及外部收集的行业数据整理发布,从创业热点 & 地图、融资 & 并购、死亡地图、行业竞争

2013-05-08 11:20:44 2092

原创 Eclipse搭建J2EE+PHP+C/C++平台(使用CDT和PDT)

废柴是学习J2EE出身的,最近又希望能自学下PHP和C++。因为在做J2EE的时候eclipse用的很熟练,所以就希望能只使用eclipse就能完成J2EE和PHP还有C/C++的开发环境。然而实际上eclipse确实能做到这一点。不过存在一个问题,如果单独下载ECLIPSE的三个版本IDE的话,就相当于要在硬盘里放置3个eclipse,这无疑是一种浪费。于是废柴就在研究了一下如何

2013-05-06 22:41:15 4707

原创 做一个商业网站要多少钱?

经常看到有人问:做一个商业网站要多少钱?  有人说要几十万!有人说要几万!  有人说要几千!  还有人说要几百!    到底哪个是真的?徽剑的回答就是这些都是真的。我们来看下:    1) 最简单的建设方式:买一个虚拟主机空间,弄一套现成的程序,再买个域名,这就只要几百块。这是最简单的投入。  2) 复杂点的建设方式:买一个虚拟主机空间或者VPS虚拟服务器,弄一套现成的程序,稍

2013-05-03 16:34:06 2961 1

条件随机场资料

条件随机场资料

2012-07-25

用于非监督中文分词算法的中文分词词库

用于非监督中文分词算法的中文分词词库

2012-01-16

10万中文人名语料库

10万中文人名语料库 10万中文人名语料库 10万中文人名语料库

2012-01-11

CRF++工具包(Linux&Windows版本)0.53

CRF++工具包(Linux&Windows版本)0.53

2011-11-29

GoogleEarthPluginSetup.exe

GoogleEarthPluginSetup.exe GoogleEarthPluginSetup.exe

2011-07-19

面向真三维地学建模的海量虚拟八叉树模型研究.pdf

面向真三维地学建模的海量虚拟八叉树模型研究.pdf

2011-07-14

vc助手 forvc6.0 vs2005vs2008

vc助手 forvc6.0 vs2005vs2008 vc助手 forvc6.0 vs2005vs2008

2010-04-08

QT 完全手册 qt编程资料

QT完全手册 QT完全手册 QT完全手册

2010-01-12

qt class diagram

qt class diagram qt类图,编程必须.

2010-01-12

MPI并行程序设计.pdf

MPI并行程序设计.pdf MPI并行程序设计.pdf MPI并行程序设计.pdf

2009-10-26

消息传递并行编程环境MPI.pdf

消息传递并行编程环境MPI.pdf 消息传递并行编程环境MPI.pdf

2009-10-26

并行计算基础 pdf

并行计算基础 并行计算基础 并行计算基础

2009-10-26

并行计算与并行计算机

并行计算与并行计算机 并行计算与并行计算机

2009-10-26

GDAL库学习笔记.pdf

GDAL库学习笔记.pdf GDAL库学习笔记.pdf GDAL库学习笔记.pdf

2009-09-27

qt-vc+环境搭建

qt-vc+环境搭建 qt-vc+环境搭建 qt-vc+环境搭建

2009-09-22

简单插件架构.rar

简单插件架构.rar 简单插件架构.rar 简单插件架构.rar

2009-07-29

OpenRS— 开放式遥感数据处理与服务平台资料

OpenRS的最终目标是搭建一个基本的遥感图像数据处理与应用的框架,实现最常用的图像读写、显示、漫游,以及其他基本的图像处理分析功能以及摄影测量中的传感器成像模型、地理坐标管理等,在此基础上,做成一个开放的社区,为实验室以及国内外研究人员共同开发应用。参与此开放社区的研究人员可以只关注其感兴趣的特定区域,而不用考虑和实现软件其它功能,大量减少重复劳动,可以大大提高研究速度和质量.

2009-06-19

MFC序列化资料文档

MFC序列化资料文档 MFC序列化资料文档 MFC序列化资料文档

2009-04-07

Oracle官方文档CHM合集-OCI程序员手册.rar

Oracle官方文档CHM合集-OCI程序员手册.rar Oracle官方文档CHM合集-OCI程序员手册.rar

2009-03-17

oracle 的OCI编程资料

oracle 的OCI编程资料 oracle 的OCI编程资料

2009-03-17

vc界面类编程.rar

vc界面类编程.rar 不错的东西 我免费

2009-03-11

com入门简单代码,非常不错啊

com入门的简单代码,可以很快上手,用的语言用vc++,c#,vs2005

2009-03-04

tinyxml xml 解析

tinyxml xml 解析 tinyxml xml 解析

2009-03-03

IIS6安装包修正版.rar

IIS6安装包修正版.rar IIS6安装包修正版.rar

2009-02-04

PL/SQL语言开发教程

PL/SQL 教程 oracle 数据库 PL/SQL 教程 oracle 数据库

2009-01-19

TinyXML解析xml文档

TinyXML是目前非常流行的一款基于DOM模型的XML解析器,简单易用且小巧玲珑,非常适合存储简单数据,配置文件,对象序列化等数据量不是很大的操作,尤其适用于游戏开发,在Nebula2,CEGUI等开源项目中都有使用。

2008-12-29

Eclipse开发WebService.pdf

Eclipse开发WebService.pdf Eclipse开发WebService.pdf

2008-12-27

Web+Services发布与调用(axis,xfire).doc

Web+Services发布与调用(axis,xfire).doc Web+Services发布与调用(axis,xfire).doc

2008-12-27

C++调用Java++web+service帮助文档

C++调用Java++web+service帮助文档 C++调用Java++web+service帮助文档

2008-12-27

c++笔试面试宝典2009版

c++笔试面试宝典2009版 c++笔试面试宝典2009版

2008-11-16

小菜 编程 成长记 .pdf

小菜编程成长记.pdf 小菜编程成长记.pdf 小菜编程成长记.pdf

2008-11-16

仿QQ登陆界面 仿QQ登陆界面

仿QQ登陆界面 仿QQ登陆界面 仿QQ登陆界面 仿QQ登陆界面

2008-11-14

inno setup安装程序

inno setup安装程序 用于将程序制作成软件.简单,易用.

2008-11-04

Visual Source Safe的使用

Visual Source Safe的使用 Visual Source Safe的使用

2008-10-27

vc++创建向导对话框

vc++,向导对话框,c++,vc6.0. 不错的资料啊.

2008-09-26

xhtml.chm(新一代html语言)

xhtml.chm(新一代html语言),标准的html语言。

2008-09-12

Web Services

Web Services资料,参考.net.asp.net

2008-09-03

COM+ Services.doc

COM+ provides many important enterprise services to configured components such as, • Object Pooling • Database connection Pooling • Thread Pooling • Fine Grained Security • Transactions • Messaging

2008-08-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除