自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

翻译 rake-nltk总结

RAKE是快速自动关键字提取算法(Rapid Automatic Keyword Extraction algorithm)的简称,是一种独立于域的关键字提取算法,它通过分析文字出现的频率及其与文本中其他词的共现来尝试确定文本主体中的关键短语。from rake_nltk import Rake# Uses stopwords for english from NLTK, and all...

2018-09-17 10:38:58 2952

原创 使用scrapy下载pdf文件失败

爬取的网站:https://www.sciencedirect.com/journal/expert-systems-with-applications/vol/29/issue/4通过xpath分析出了网站上pdf的所有pdf的url,然后通过filepipeline这个管道类想保存到本地,然后虽然所有的pdf都已经保存下来了,但是pdf文件打不开,求大佬解答一下为什么?...

2018-04-14 17:06:28 1273 4

原创 编写爬虫使用百度翻译遇到这种情况

#_*_coding:utf-8_*_import requestsurl = "http://fanyi.baidu.com/v2transapi"data = {"from":"zh","to":"en","query":"你好世界","transtype":"translang","simple_means_fla

2018-03-19 14:52:13 1047 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除