书蕴——基于书评的人工智能推荐系统

书蕴是一个利用书评进行智能推荐的系统,通过协同过滤算法和word2vec自然语言处理技术,从豆瓣读书获取数据,进行文本预处理,训练模型,生成标签,并实现推荐功能。
摘要由CSDN通过智能技术生成

书蕴——基于书评的智能推荐系统

前言

计算机设计大赛在即,和冬瑜、承意组队参加人工智能组,报的题目的:书蕴——基于书评的智能书籍推荐系统。
主体上是去做一个web系统,系统的核心功能是书籍收藏与书籍推荐。根据用户收藏书籍的书评(划重点了),来为用户推荐书籍

创新点

  • 基于书籍标签协同过滤算法
  • 基于word2vec方法的自然语言处理
  • 标签抽取(这个名词还没想好)

思路

  1. 数据获取
  2. 数据文本预处理
  3. 训练word2vec模型
  4. 使用word2vec模型迭代获取标签
  5. 协同过滤算法对标签处理,实现推荐
  6. web系统

数据获取篇

主要是冬瑜写的python爬虫,来源是豆瓣读书,目前效率较为低下,正在尽力找到有效的方案

数据文本预处理

  • 去除html标签与换行
  • 去除停用词
  • 分词
  • 保存为文本

具体内容记录在另一篇博客:[书蕴笔记-0]文本预处理

训练word2vec模型

主要使用python的gensim包下的word2vec训练模型,模型以每本书的所有书评为主体。
之后可能考虑用一类书的书评整体训练模型。

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值