- 博客(2)
- 资源 (1)
- 收藏
- 关注
原创 微博评论情感分析-百度自然语言处理API使用教程
最近在做微博的评论情感分析,本来想用Tensorflow的RNN来实现,但网上一直找不到好的训练集,在CSDN上买的几万条的微博情感标注集效果也不好,模型对训练集的准确率很高,但放到实际预测中效果很差。在暂时没有时间自己做标注的情况下,只能先考虑一些现有的工具了,之前用过百度AI的自然语言处理,凑合能用,个人感觉他们的训练集应该量是比较大的,能适应的场景比较多。实际使用后还没有发现很离谱的打标...
2019-04-16 19:46:44 5417 19
原创 IT之家爬虫
近期需求监控某产品发布后舆情,对多个网络新闻社区的评论进行监控,抓取相关的媒体新闻和用户评论。本篇记录对于IT之家关键字搜索的爬虫。涉及库如下:import requestsimport lxml.htmlimport timeimport pandas as pdimport refrom bs4 import BeautifulSoupIT之家通过post方式获取新...
2019-04-04 10:49:13 520 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人