![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
拓展
jingwenliu
这个作者很懒,什么都没留下…
展开
-
tuozhan_all2(拓展_all_2)
from urllib import request, parsefrom urllib.error import HTTPError, URLError# 保存cookiefrom http import cookiejarclass session(object): def __init__(self): cookie_object = cookiejar.C...原创 2018-08-14 22:24:32 · 142 阅读 · 0 评论 -
tuozhan_all(拓展__all)
from urllib import request, parsefrom urllib.error import HTTPError, URLError#a. get(url, headers=None)def get(url, headers=None): return urlrequests(url, headers=headers)def post(url, form...原创 2018-08-13 22:56:55 · 147 阅读 · 0 评论 -
58同城——爬取步骤
以下这几个文件的构造:scrapy_ljw scrapy_ljw spiders a58tc.py items.py pipelines.py settings.py mysql_save.py run_58.pya58tc.py# -*- coding: ...原创 2018-08-27 23:36:39 · 3145 阅读 · 0 评论 -
Scrapy的文件结构 以及 几个文件之间的联系
(!!!————本篇博客以 ” 伯乐在线 “ 网站为例————!!!)Scrapy的文件结构1. items.py ———(是定义scrapy内部数据的文件 )# (1) items.py 里的类都是继承 scrapy.item,如:# (2) 这个类里边所有的属性都等于scrapy.Field() class BoleItem(scrapy.Item): ...原创 2018-08-25 01:08:13 · 1376 阅读 · 0 评论