自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

转载 Windows下python的安装包的网址

网址:https://www.lfd.uci.edu/~gohlke/pythonlibs/转载于:https://www.cnblogs.com/lin1318/p/9114975.html

2018-05-31 09:45:00 160

转载 用paython爬取知乎,伯乐在线,拉勾网完整版

在main.pyfrom scrapy.cmdline import executeimport sysimport ossys.path.append(os.path.dirname(os.path.abspath(__file__)))# execute(["scrapy", "crawl", "jobbole"])# execute(["scra...

2018-04-16 11:34:00 263

转载 用python拉勾网的完整版

这是在爬取伯乐在线的基础之上的,所以就没重复代码。在lagou.pyimport scrapyfrom scrapy.linkextractors import LinkExtractorfrom scrapy.spiders import CrawlSpider, Rulefrom ArticleSpider.utils.common import get_md...

2018-04-16 11:19:00 260

转载 python 爬取知乎完整版

由于在爬取知乎是在伯乐在线之后的,需要参考前面的代码,有相同的部分就没有再加入。在zhihu.py 中import scrapyimport refrom urllib import parsefrom selenium import webdriverfrom scrapy.http import Requestfrom scrapy.loader im...

2018-04-16 11:08:00 572

转载 JDK 环境变量配置

(1)新建->变量名"JAVA_HOME",变量值"D:\Program Files\Java\jdk1.8.0_161"(即JDK的安装路径)(2)编辑->变量名"Path",在原变量值的最后面加上“;%JAVA_HOME%\bin;%JAVA_HOME%\jre\bin”(3)新建->变量名“CLASSPATH”,变量值“.;%JAVA_HOME%\lib;%J...

2018-04-16 10:52:00 99

转载 python 爬取伯乐在线完整版

在jobbole.pyimport scrapyimport reimport datetimefrom urllib import parsefrom scrapy.http import Requestfrom ArticleSpider.items import JobBoleArticleItemfrom ArticleSpider.utils.c...

2018-03-29 11:20:00 138

转载 模拟登录知乎selenium在python中

from selenium import webdriverfrom scrapy.selector import Selectorbrowser = webdriver.Chrome(executable_path="D:/Temp/chromedriver.exe")# browser.get("https://www.zhihu.com/signup?next=...

2018-03-17 16:22:00 72

转载 python用css方法爬取伯乐在线

1.css的用法2.css的用法 #通过css选择器提取字段 # front_image_url = response.meta.get("front_image_url", "") #文章封面图 # title = response.css(".entry-header h1::text").extract()[0] ...

2018-03-16 16:44:00 416

转载 python用xpath方法爬取伯乐在线

1.xpath的用法2.提取信息(1)在命令行中可以测试response.xpath("//p[@class='entry-meta-hide-on-mobile']/text()").extract()[0].strip().replace("·","")(2)在pycharm中运行import scrapyimport rec...

2018-03-16 16:21:00 143

转载 用python爬取伯乐在线的准备

1.在pycharm选择编译器2.创建项目。3。出现“No module named” 'win32api'4.配置main新建一个main,from scrapy.cmdline import executeimport sysimport ossys.path.append(os.path.dirname(os.path.abspath...

2018-03-16 14:25:00 90

转载 虚拟环境管理python

1.virtualenv 的安装2.virtualenv 的新建3.进入虚拟环境4.退出虚拟环境5.安装virtualenvwrapper(虚拟环境管理包)还需要在环境变量中的系统变量:新建WORKON_HOME,变量值:D:\envs(可以任意指定一个盘)6.安装一些库request7.安装scrapy遇到错误 buildi...

2018-03-16 10:41:00 50

转载 CentOS 7 镜像和ubuntu镜像

CentOS7镜像:http://mirrors.nwsuaf.edu.cn/centos/7/isos/x86_64/CentOS-7-x86_64-DVD-1708.isoubuntu镜像:http://mirrors.ustc.edu.cn/ubuntu-releases/16.04.4/ubuntu-16.04.4-desktop-amd64.iso转载于:https:/...

2018-03-13 14:49:00 508

转载 启动VMware Workstation出现问题W32 Authconnectionlaunch :回复错误 Process creation failed

1.出现这个问题,在控制面板中卸载程序,可以修复,最好是卸载重新安装。一般就是在安装时,有没有安装好的步骤。转载于:https://www.cnblogs.com/lin1318/p/8551916.html...

2018-03-13 10:49:00 1218

转载 vmware安装问题:Microsoft Runtime DLL安装程序未能完成安装

1.在输入%temp%2.找到{ADC3121A-3EBA-4016-AF64-00B8FE017080}~setup结尾是~setup(在打开运行时不要管了安装界面,看一下当时的时间,很容易找到的,关闭找不到)3.打开该文件夹选择安装程序即可正常安装。转载于:https://www.cnblogs.com/lin1318/p/8549349.html...

2018-03-12 15:05:00 179

转载 scrapy item loader机制

from scrapy.loader import ItemLoader #继在jobbole中导入模块item_loader=ItemLoader(item=JobBoleArticleItem(),response=response) #JobBoleArticleItem需要与items.py中的类名一致item_loader.add_css("title",".en...

2018-01-25 21:01:00 80

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除