- 博客(5)
- 资源 (2)
- 收藏
- 关注
原创 Elasticsearch之中文分词器插件ik
本文基于6.x版本 一、下载 ik分词器的一些使用介绍:https://github.com/medcl/elasticsearch-analysis-ik ik分词器GitHub下载:https://github.com/medcl/elasticsearch-analysis-ik/releases 选择与Elasticsearch版本对应的分词器下载。 二、安装 # 在Ela...
2018-08-30 17:37:11 294
原创 mahout 推荐系统 训练数据与评分
推荐系统引擎是一个工具,一种回答问题的手段,“对用户来讲什么是最好的推荐?”。最好的推荐系统是心理学的范畴,有人在你做事情之前知道确切的知道你还没有看过的、或者没有任何现象说明你喜欢的一些item,以及你对这些item的喜欢程度。大部分的推荐引擎通过给item评价打分来实现。所以,评价推荐引擎的一种方式是评价它的评估偏好值的质量 — 评价评估偏好和实际偏好的匹配度。 推荐引擎可以通过设置一部分真...
2018-08-25 20:13:05 940
原创 mahout 推荐系统 之 评估查全率与查准率
从更全面的看待推荐系统:通过偏好值来生成推荐结果并非绝对必要。给出一个从优到劣排序的推荐结果在很多场景就够用了,而不用必须包含估计的偏好值;而事实上,有时候精确的列表顺序也不是那么必要,有几个好的结果就可以了。 从这种普遍的视角,可以运用经典的信息检索(information retrieval)度量标准来评估推荐系统:查准率(precision)、查全率(recall) 一个评估查全率与查准...
2018-08-25 19:10:21 618
原创 mahout 推荐系统 之 hello world
前言:推荐系统的输入是必要的 ,这些数据是推荐的基础。因为非常熟悉的推荐系统引擎将item(物品)推荐给user(用户),很容易的认为偏好(Preference)是user和item之间的联系。偏好包含了一个user ID和一个item ID,通常情况下,一个数值代表了user对item偏好的强度。Mahout中ID都是数值,实际上是整数(lang型)。偏好值可以是任何值,值越大代表这正向偏好 越...
2018-08-25 18:46:37 2516
原创 Maven项目读取resources目录下文件
项目结构图: 注意:取到的是编译后的路径,而不是src/main/resources的路径。 一、获取File private static void getFileFromResources() { URL url = App.class.getClassLoader() .getResource("myfile/TestFi...
2018-08-25 17:24:39 2848
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人