- 博客(7)
- 资源 (1)
- 收藏
- 关注
原创 "文本分类入门"摘要
特征提取实际上有两大类方法。一类称为特征选择(Term Selection),指的是从原有的特征(那许多有用无用混在一起的词汇)中提取出少量的,具有代表性的特征,但特征的类型没有变化(原来是一堆词,特征提取后仍是一堆词,数量大大减少了而已)。另一类称为特征抽取(Term Extraction)的方法则有所不同,它从原有的特征中重构出新的特征(原来是一堆词,重构后变成了别的,例如LSI将其转为矩阵,
2014-06-26 17:15:28 3028
转载 HTTP 协议详解
相关文章:HTTP 协议之压缩 当今web程序的开发技术真是百家争鸣,ASP.NET, PHP, JSP,Perl, AJAX 等等。 无论Web技术在未来如何发展,理解Web程序之间通信的基本协议相当重要, 因为它让我们理解了Web应用程序的内部工作. 本文将对HTTP协议进行详细的实例讲解,内容较多,希望大家耐心看。也希望对大家的开发工作或者测试工作有所帮助。使用Fiddler工具非
2014-06-18 17:10:48 534
转载 auto_ptr and scoped_ptr
scoped_ptr的用法与auto_ptr几乎一样,大多数情况下它可以与auto_ptr相互替换,它也可以从一个auto_ptr获得指针的管理权(同时auto_ptr失去管理权)。scoped_ptr也具有auto_ptr同样的"缺陷"--不能用作容器的元素,但原因不同:auto_ptr是因为它的转移语义,而scoped_ptr则是因为不支持拷贝和赋值,不符合容器对元素类型的要求。scoped_
2014-06-13 15:44:27 776
转载 招回率和正确率
召回率和准确率是数据挖掘中预测、互联网中的搜索引擎等经常涉及的两个概念和指标。 召回率:Recall,又称“查全率”——还是查全率好记,也更能体现其实质意义。 准确率:Precision,又称“精度”、“正确率”。 以检索为例,可以把搜索情况用下图表示: 相关 不相关 检索到 A B 未检索到
2014-06-12 11:26:38 998
转载 linux中 likely与unlikely
看内核时总遇到if(likely( )){}或是if(unlikely( ))这样的语句,最初不解其意,现在有所了解,所以也想介绍一下。 likely() 与 unlikely()是内核(我看的是2.6.22.6版本,2.6的版本应该都有)中定义的两个宏。位于/include/linux/compiler.h中, 具体定义如下: #define likely(x) __builtin_e
2014-06-11 17:29:31 529
转载 BM25算法
BM25 is a bag-of-words retrieval function that ranks a set of documents based on the query terms appearing in each document, regardless of the inter-relationship between the query terms within a docum
2014-06-10 10:38:24 9138
saunders-jeffery.pdf
2020-06-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人