a185934139-CSDN博客

原创 bilibili获取up主基本信息

-- coding: utf-8 --import scrapy import json from scrapy_project.items import BilibiliItemclass BilibiliSpider(scrapy.Spider): name = ‘bilibili’ allowed_domains = [‘bilibili.com’] ...

2018-08-23 21:08:55 3138

原创豆瓣聚会的数据爬取代码

豆瓣： from bs4 import BeautifulSoupimport requestsfrom day05.mysqlhelper import MysqlHelperurl = 'https://beijing.douban.com/events/week-party'response = requests.get(url)helper = MysqlHelper...

2018-08-23 09:37:19 168

原创豆瓣网的爬取和练习代码

豆瓣： from selenium import webdriverimport timeimport requestsfrom lxml import etreeimport base64# 操作浏览器driver = webdriver.Chrome()url = 'https://accounts.douban.com/login?alias=&redir=...

2018-08-23 09:35:36 518

原创妹子图和喜马拉雅的爬虫代码

妹子图： import requestsfrom urllib import request,parsefrom lxml import etreeimport ospath = 'D:/Python/meizi'os.chdir(path)def meizi(page_all,queue): i = 1 if i <= page_all: ...

2018-08-23 09:34:24 399

原创腾讯和头条的爬虫代码

腾讯： import requests,reimport requestsimport jsonimport pymysqlclass mysql_conn(object): # 魔术方法, 初始化, 构造函数 def __init__(self): self.db = pymysql.connect(host='127.0.0.1',user ...

2018-08-23 09:33:11 214

原创雪球网

import requestsimport jsonimport pymysqlclass mysql_conn(object): # 魔术方法, 初始化, 构造函数 def __init__(self): self.db = pymysql.connect(host='127.0.0.1',user = 'root',password = '123456...

2018-08-23 09:32:04 3401

原创作业2 ：人人网登录，百度通过代理登录，封装代码

from urllib import request,parseimport jsonfrom http import cookiejar# 实例化cookie_object = cookiejar.CookieJar()handler = request.HTTPCookieProcessor(cookie_object)opener = request.build_opene...

2018-08-14 22:32:38 206

Cookies是属于Session对象的一种，但有不同，Cookies不会占服务器资源，是存在客服端内存或者一个cookie的文本文件中；而“Session”则会占用服务器资源。所以，尽量不要使用Session，而使用Cookies。Session的数据会因为用户万一不小心关闭了浏览器而丢失，Cookies则不会。Cookies还有着时效性，可设定失效的时间，而且Cookies里存在的信息不...

2018-08-13 19:55:42 142

a185934139的博客