- 博客(3)
- 资源 (9)
- 收藏
- 关注
原创 下载NLTK模块和自带的文本库
pip install nltk,下载nltk模块。下载nltk自带的文本库,建议全部下载,因为你永远不知道你以后会用到哪个
2019-03-28 22:22:02 326
原创 Python 抓取HTML上的DOC文件时,解析器不指定xml,不能打印
今天在用Python爬取HTML上的一个doc文件时,由于在BeautifulSoup函数里面没有指定解析器,所以打印不出doc文件里面的内容显示说系统默认使用最佳的解析器lxml,而文件上需要用xml解析器才能打印,就去官网看了下,原来在使用BeautifulSoup时,如果不指定解析器的话,默认使用lxml,所以文件打印不出来,只要在BeautifulSoup(markup,xml)加...
2019-03-28 14:50:19 230
原创 下载并安装Twisted
访问Twisted Matrix网站(http://twistedmatrix.com),点击DOWNLOAD打开cmd,输入上面标记部分,会自动下载安装完成如果在安装的过程中出现了这个错误:在使用pip install scrapy命令安装scrapy框架时,Twisted出现安装错误。如下:building 'twisted.test.raiser' extensionerr...
2019-03-25 15:37:56 19322 4
携程机票python爬取脚本优化版本
2019-04-24
携程机票python爬取脚本
2019-04-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人