自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 xpath匹配 爬取房源信息(我爱我家)

# requests包 import requests # xpath包 from lxml import etree # 本地mysql包(mysql_def包下mysql_conn函数) from mysql_def import mysql_conn # 定义url,含分页 %d base_url='https://bj.5i5j.com/zufang/changpingqu/n%d/'...

2018-08-27 20:27:39 935

原创 selenium 模仿浏览器登录获取数据

#导包 selenium webdriver from selenium import webdriver import time option_chrome=webdriver.ChromeOptions() option_chrome.add_argument('--headless') driver=webdriver.Chrome(chrome_options=option_...

2018-08-27 20:23:37 603

原创 下载音频到本地 (ximalaya)

import requests import json from urllib import request # 代理ip池 proxy = { 'http': 'http://alice:123456@120.78.166.84:6666', 'https': 'http://alice:123456@120.78.166.84:6666', } headers={ ...

2018-08-27 20:22:26 3037

原创 selenium 模拟登录 突破图片验证码(豆瓣网)

from selenium import webdriver import time import requests from lxml import etree import base64 # 请求浏览器 driver=webdriver.Chrome() # 定义登录界面 url url ='https://accounts.douban.com/login?alias=&redi...

2018-08-21 23:45:54 681

原创 雪球网 存入mysql

import requests import json from mysq1 import mysql_conn # 代理池 proxy = { 'http': 'http://alice:123456@120.78.166.84:6666', 'https': 'http://alice:123456@120.78.166.84:6666', } # 定义max_id 和pag...

2018-08-16 23:50:20 254

原创 今日头条 街拍

import re import requests import json from urllib import request # 导入os包,建文件夹使用 import os # 定义headers头 headers={ 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, li...

2018-08-16 23:44:24 276

原创 get post 请求封装(含cookiejar)

from urllib import request,parse # 导入urllib.error包中 HTTPError,URLError 模块 异常捕获 from urllib.error import HTTPError,URLError # 导入 cookiejar 保存cookie from http import cookiejar class session(object):...

2018-08-15 00:09:07 269

原创 人人网登录(通过cookiejar)

from fengzhuang_all import post,get from urllib import request,parse import json # 保存cookie from http import cookiejar # 通过对象保存cookie cookie_object = cookiejar.CookieJar() # handler 对应着一个操作 handler ...

2018-08-14 23:02:38 2461

原创 有道翻译(模拟)

import time import random from fengzhuang_all import post import json # 将md5加密进行函数封装 def md5_my(sign_str): # md5加密模块 import hashlib # 创建md5对象 使用hashlib.md5()方法 md5_o=hashlib.md5() ...

2018-08-14 21:17:51 291

原创 cookie与session的区别

Cookie实际上是一小段的文本信息。客户端请求服务器,如果服务器需要记录该用户状态,就使用response向客户端浏览器颁发一个Cookie。客户端会把Cookie保存起来。   当浏览器再请求该网站时,浏览器把请求的网址连同该Cookie一同提交给服务器。服务器检查该Cookie,以此来辨认用户状态。服务器还可以根据需要修改Cookie的内容。   1、cookie的内容主要包括:名字,值...

2018-08-13 23:04:23 108

原创 get post 请求 函数封装

# 导包 from urllib import request,parse # 导入urllib.error包中 HTTPError,URLError 模块 异常捕获 from urllib.error import HTTPError,URLError # 再次封装 如果是get请求直接调用 get(url,headers=None) ###headers可不写 # a.get(url,...

2018-08-13 23:01:16 214

原创 get请求 函数封装

# 导包 from urllib import request # 导入urllib.error包中 HTTPError,URLError 模块 异常捕获 from urllib.error import HTTPError,URLError #1. 传入url #2. user_agent #3. headers #4. 定义Request #5. urlopen #6. 返回byte数...

2018-08-13 23:00:11 497

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除