- 博客(3)
- 收藏
- 关注
翻译 rake-nltk总结
RAKE是快速自动关键字提取算法(Rapid Automatic Keyword Extraction algorithm)的简称,是一种独立于域的关键字提取算法,它通过分析文字出现的频率及其与文本中其他词的共现来尝试确定文本主体中的关键短语。from rake_nltk import Rake# Uses stopwords for english from NLTK, and all...
2018-09-17 10:38:58 2952
原创 使用scrapy下载pdf文件失败
爬取的网站:https://www.sciencedirect.com/journal/expert-systems-with-applications/vol/29/issue/4通过xpath分析出了网站上pdf的所有pdf的url,然后通过filepipeline这个管道类想保存到本地,然后虽然所有的pdf都已经保存下来了,但是pdf文件打不开,求大佬解答一下为什么?...
2018-04-14 17:06:28 1273 4
原创 编写爬虫使用百度翻译遇到这种情况
#_*_coding:utf-8_*_import requestsurl = "http://fanyi.baidu.com/v2transapi"data = {"from":"zh","to":"en","query":"你好世界","transtype":"translang","simple_means_fla
2018-03-19 14:52:13 1047 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人