- 博客(4)
- 收藏
- 关注
转载 万万没想到研二下学期要为当程序员做准备——在线编程笔试题篇
1 ''' 2 Created on 2016年4月1日 3 4 @author: betterSN 5 6 蘑菇街2016实习生招聘大数据工程师笔试题:给定9个数字,分别代表书写1-9的每个数字需要用的墨水量,并且给出总墨水量,请求出能书写出的最大数字为多少 7 即 输入:总墨水两vol 8 书写1-9分别用的墨水两(a1,a2,....
2016-04-01 14:19:00 129
转载 文本分类:特征选择统计量
在文本分类中,用于特征选择的统计量主要有这些: 特征频度(term frequency,tf) 原理是:低频的往往对分类影响不大,从而可以被排除掉。同时,不是所以高频都是影响大的,比如在文本中分布均匀的高频的贡献是不大的。 应用: 主要用在文本标引时直接删除某些低频特征 2. 文本频度(document frequency,df) 原理是:稀有词条可能是噪声...
2015-03-20 11:50:00 272
转载 language model —— basic model 语言模型之基础模型
一、发展 起源:统计语言模型起源于 Ponte 和 Croft 在 1998年的 SIGIR上发表的论文 应用:语言模型的应用很多: corsslingual retrieval distributed IR expert finding passage retrieval web search genomics retrieval 基因组学检索 topic track...
2015-03-20 11:30:00 442
转载 祝贺落户!
一直想坚持用博客,曾经也试图开始,申请了几个,试用了几个。今天突发奇想再次启用,但发现竟然不记得我注册是哪一个了?? 突然浮现博客园,一百度果然有这个博客,一登录竟然没有注册过!! SO,果断选择这个了,纪念一下哈哈 转载于:https://www.cnblogs.com/betterSN/p/4310916.html...
2015-03-03 14:43:00 114
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人