推荐系统
马行处
改变思维方式,从产品,项目本身开始
展开
-
pandas 处理数据的多方式(1)
持续更新中原创 2021-03-31 14:45:15 · 173 阅读 · 0 评论 -
用余弦算法做相似度匹配
前面写了一个用simhash 做算法相似度匹配。我觉得俩个算法都可以,但是一定要实践证明算法的稳定性,和模型的准确度。因为开发比较急,所以没有去验证关键词加simhash 的具体准确情况,但是依据我来看会很不错。后期我们上线的是余弦算法的相似度匹配。余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性"。参考网上demo:def similarity(s1, s2): try:原创 2020-05-09 18:24:24 · 1372 阅读 · 4 评论 -
文章推荐系统(1)
用ItemCF和userCF用户行为数据简介积极行为:用户明确表示对物品喜好的行为。评分、喜欢、不喜欢。包括:collect、share、like、attention(关注)隐形行为:不能明确反应用户喜好的行为。比如页面浏览。view、buy、post(f发布)最后会有思维导图来决定业务流程。欢迎关注。...原创 2020-04-22 14:34:44 · 364 阅读 · 0 评论