作业
文章平均质量分 77
a185934139
这个作者很懒,什么都没留下…
展开
-
作业2 :人人网登录,百度通过代理登录,封装代码
from urllib import request,parseimport jsonfrom http import cookiejar# 实例化cookie_object = cookiejar.CookieJar()handler = request.HTTPCookieProcessor(cookie_object)opener = request.build_opene...原创 2018-08-14 22:32:38 · 203 阅读 · 0 评论 -
Session与Cookie区别
Cookies是属于Session对象的一种,但有不同,Cookies不会占服务器资源,是存在客服端内存或者一个cookie的文本文件中;而“Session”则会占用服务器资源。所以,尽量不要使用Session,而使用Cookies。Session的数据会因为用户万一不小心关闭了浏览器而丢失,Cookies则不会。Cookies还有着时效性,可设定失效的时间,而且Cookies里存在的信息不...原创 2018-08-13 19:55:42 · 138 阅读 · 0 评论 -
雪球网
import requestsimport jsonimport pymysqlclass mysql_conn(object): # 魔术方法, 初始化, 构造函数 def __init__(self): self.db = pymysql.connect(host='127.0.0.1',user = 'root',password = '123456...原创 2018-08-23 09:32:04 · 3386 阅读 · 0 评论 -
腾讯和头条的爬虫代码
腾讯: import requests,reimport requestsimport jsonimport pymysqlclass mysql_conn(object): # 魔术方法, 初始化, 构造函数 def __init__(self): self.db = pymysql.connect(host='127.0.0.1',user ...原创 2018-08-23 09:33:11 · 212 阅读 · 0 评论 -
妹子图和喜马拉雅的爬虫代码
妹子图: import requestsfrom urllib import request,parsefrom lxml import etreeimport ospath = 'D:/Python/meizi'os.chdir(path)def meizi(page_all,queue): i = 1 if i <= page_all: ...原创 2018-08-23 09:34:24 · 397 阅读 · 0 评论 -
豆瓣网的爬取和练习代码
豆瓣: from selenium import webdriverimport timeimport requestsfrom lxml import etreeimport base64# 操作浏览器driver = webdriver.Chrome()url = 'https://accounts.douban.com/login?alias=&redir=...原创 2018-08-23 09:35:36 · 516 阅读 · 0 评论 -
豆瓣聚会的数据爬取代码
豆瓣: from bs4 import BeautifulSoupimport requestsfrom day05.mysqlhelper import MysqlHelperurl = 'https://beijing.douban.com/events/week-party'response = requests.get(url)helper = MysqlHelper...原创 2018-08-23 09:37:19 · 167 阅读 · 0 评论 -
bilibili获取up主基本信息
-- coding: utf-8 --import scrapy import json from scrapy_project.items import BilibiliItemclass BilibiliSpider(scrapy.Spider): name = ‘bilibili’ allowed_domains = [‘bilibili.com’] ...原创 2018-08-23 21:08:55 · 3134 阅读 · 0 评论