qq_29818017-CSDN博客

翻译 rake-nltk总结

RAKE是快速自动关键字提取算法(Rapid Automatic Keyword Extraction algorithm)的简称，是一种独立于域的关键字提取算法，它通过分析文字出现的频率及其与文本中其他词的共现来尝试确定文本主体中的关键短语。from rake_nltk import Rake# Uses stopwords for english from NLTK, and all...

2018-09-17 10:38:58 2952

原创使用scrapy下载pdf文件失败

爬取的网站：https://www.sciencedirect.com/journal/expert-systems-with-applications/vol/29/issue/4通过xpath分析出了网站上pdf的所有pdf的url，然后通过filepipeline这个管道类想保存到本地，然后虽然所有的pdf都已经保存下来了，但是pdf文件打不开，求大佬解答一下为什么?...

2018-04-14 17:06:28 1273 4

原创编写爬虫使用百度翻译遇到这种情况

#_*_coding:utf-8_*_import requestsurl = "http://fanyi.baidu.com/v2transapi"data = {"from":"zh","to":"en","query":"你好世界","transtype":"translang","simple_means_fla

2018-03-19 14:52:13 1047 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

翻译 rake-nltk总结

原创 使用scrapy下载pdf文件失败

原创 编写爬虫使用百度翻译遇到这种情况

空空如也

空空如也

原创使用scrapy下载pdf文件失败

原创编写爬虫使用百度翻译遇到这种情况