自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (7)
  • 收藏
  • 关注

原创 2012-10月微软面试题

一面:1、有两个有序链表(数值有序)。一个链表是递增的,一个链表是递减的。现在将两个链表合并成一个链表,并保证最后的链表是递增的。2、有一颗二叉树,结点的结构体如下:strcut node{   int value;   node * left;//左孩子   node * right;//右孩子   node * other;//同一层右侧的结点。}node

2012-10-23 11:00:59 1681

原创 Perl实现将将.txt中内容写入到excel中

在处理存于txt中的大数据时,查看非常不方便,可以考虑写入到excel中。以下是一个简单的用perl实现的写入excel的程序。#写文件到excel#输入:待写入到excel表中的.txt文件#输出:excel文件,注意要用绝对路径#####################################################use strict;use Win32;u

2012-07-17 15:06:34 1706

原创 腾讯实习生面试题

给定一亿的QQ号,找出其中的情侣号对。其中情侣号的设置是这样的:相应位置的数字0-0,1-9,2-8……两个数字的和为10。实现思路:1、首先随机给出一亿个QQ号2、读取这一亿个QQ号,将QQ压入map中3、取出一个QQ号,计算与它匹配的情侣号。4、在map中查找是否有这个情侣号。如果有将二者压入到另一个map里,否则返回3。5、压入另一个map里的目的是避免重复输出同

2012-04-15 22:09:08 459

原创 词频统计MultiMap起效

终于找到可以写博客的题材了。近期在做一个社交媒体事件文摘的活儿,借用本实验室的一个文摘系统。系统是面向特定领域,用它做微博语言的文摘效果不理想。考虑到再写一个文摘系统比较麻烦,就想在此基础上进行改进。系统里有domain dic这个词典,如果对当前话题的语料分词,词频较高的词可作为domian dic。对语料的分词用的是stanford的分词系统,ctb和pku两种训练语料做中和。最后选择用m

2012-04-12 00:21:34 509

微博影响力计算与应用

想做微博影响力的还是落后了,人家捷足先登了~不过可以在公式上修改一下,也可以加入人的因素~

2011-12-13

carrot2 聚类工具简介

carrot2是开源的用于聚类搜索和文档聚类的工具,可用于google,yahoo等大型搜索引擎

2011-11-03

计算社会科学中文版

这是计算社会科学中文版,翻译得还不错。希望对你有用

2011-11-02

新浪微博爬虫软件

软件是基于新浪微博应用平台开发的软件,包里还有详细的安装配置说明。可抽取用户需要的数据

2011-10-11

不错的桌面便签,漂亮,简约

在网上搜到的一个很漂亮的桌面便签,送给所有用xp系统的小盆友们~

2011-05-16

CRF的深入学习资料

这是深入学习CRF的学习资源,外文的,挺不错的~希望对你有用。

2011-04-25

CRF的入门学习资料

CRF是当前中文分词中最流行的一个,这是CRF的入门资料,英文

2011-04-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除