文章目录 每天一遍,学习不厌 推荐引擎 自然语言处理(NLP) 文本分词 词干提取 词性还原 词袋模型(句子的标准建模方法) 词频(TF) 文档频率(DF) 逆文档频率(IDF) 词频-逆文档频率(TF-IDF) 文本分类(主题识别) 性别识别 每天一遍,学习不厌 推荐引擎 推荐引擎涉及两件事:召回,排序。召回就是把你的需要的召回回来,在对所有的进行排序。 推荐引擎意在把最需要的推荐给用户。 推荐引擎有两种: 1,基于用户的协同过滤(user base cf)用户画像, 找到相似用户。(聚类,找到用户属于的类别。或者根据用户特征整理得到相似用户) 2基于项目(内容)的协同过滤。(找相似的电影,找到与用户喜爱的电影相似的电影。找到用户喜欢的相似用品) 在不同的机器学习场景中通常需要分析相似样本。而统计相似样本的方式可以基于欧氏距离分数,也可基于皮氏距离分数。 欧氏距离分数 欧 氏 距