- 博客(3)
- 收藏
- 关注
转载 Lucene学习总结之一:全文检索的基本原理
目录(?)[-]一总论二索引里面究竟存些什么三如何创建索引第一步一些要索引的原文档Document第二步将原文档传给分词组件Tokenizer第三步将得到的词元Token传给语言处理组件Linguistic Processor第四步将得到的词Term传给索引组件Indexer三如何对索引进行搜索第一步用户输入查询语句第二步对查询语句进行词法分析语法分析及语言处理第三步搜
2016-10-23 00:35:33 155
原创 MachineLearning--Knn
Knn (k-Nearest Neighbor) 一、算法描述一种常用的监督学习方法,其工作机制非常简单:给定测试样本,基于某种距离的度量方式(欧氏距离、闵氏距离、曼哈顿距离等)找出训练集中与该样本距离最近的前k个训练样本,并依据k个“邻居”的样本信息进行预测。属于懒惰学习方法[1]。[1]:懒惰学习(lazy learning)训练阶段仅仅保存样本,训练时间开销为0,待新样本得到后再进行处理
2016-05-30 11:35:32 518
转载 #!/usr/bin/Python 的意义
#!/usr/bin/Python 的意义脚本语言的第一行,指出,你想要你的这个文件中的代码用什么可执行程序去运行它,就这么简单#!/usr/bin/Python告诉操作系统执行这个脚本的时候,调用/usr/bin下的python解释器;#!/usr/bin/env python这种用法是为了防止操作系统用户没有将python装在默认的/usr/bin路径里。当系统看到这一行的时候,首先会到env设
2016-05-24 10:33:01 367
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人