自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 xpath匹配 爬取房源信息(我爱我家)

# requests包import requests# xpath包from lxml import etree# 本地mysql包(mysql_def包下mysql_conn函数)from mysql_def import mysql_conn# 定义url,含分页 %dbase_url='https://bj.5i5j.com/zufang/changpingqu/n%d/'...

2018-08-27 20:27:39 926

原创 selenium 模仿浏览器登录获取数据

#导包 selenium webdriverfrom selenium import webdriverimport timeoption_chrome=webdriver.ChromeOptions()option_chrome.add_argument('--headless')driver=webdriver.Chrome(chrome_options=option_...

2018-08-27 20:23:37 592

原创 下载音频到本地 (ximalaya)

import requestsimport jsonfrom urllib import request# 代理ip池proxy = { 'http': 'http://alice:123456@120.78.166.84:6666', 'https': 'http://alice:123456@120.78.166.84:6666',}headers={ ...

2018-08-27 20:22:26 3018

原创 selenium 模拟登录 突破图片验证码(豆瓣网)

from selenium import webdriverimport timeimport requestsfrom lxml import etreeimport base64# 请求浏览器driver=webdriver.Chrome()# 定义登录界面 urlurl ='https://accounts.douban.com/login?alias=&redi...

2018-08-21 23:45:54 667

原创 雪球网 存入mysql

import requestsimport jsonfrom mysq1 import mysql_conn# 代理池proxy = { 'http': 'http://alice:123456@120.78.166.84:6666', 'https': 'http://alice:123456@120.78.166.84:6666',}# 定义max_id 和pag...

2018-08-16 23:50:20 249

原创 今日头条 街拍

import reimport requestsimport jsonfrom urllib import request# 导入os包,建文件夹使用import os# 定义headers头headers={ 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, li...

2018-08-16 23:44:24 267

原创 get post 请求封装(含cookiejar)

from urllib import request,parse# 导入urllib.error包中 HTTPError,URLError 模块 异常捕获from urllib.error import HTTPError,URLError# 导入 cookiejar 保存cookiefrom http import cookiejarclass session(object):...

2018-08-15 00:09:07 261

原创 人人网登录(通过cookiejar)

from fengzhuang_all import post,getfrom urllib import request,parseimport json# 保存cookiefrom http import cookiejar# 通过对象保存cookiecookie_object = cookiejar.CookieJar()# handler 对应着一个操作handler ...

2018-08-14 23:02:38 2445

原创 有道翻译(模拟)

import timeimport randomfrom fengzhuang_all import postimport json# 将md5加密进行函数封装def md5_my(sign_str): # md5加密模块 import hashlib # 创建md5对象 使用hashlib.md5()方法 md5_o=hashlib.md5() ...

2018-08-14 21:17:51 282

原创 cookie与session的区别

Cookie实际上是一小段的文本信息。客户端请求服务器,如果服务器需要记录该用户状态,就使用response向客户端浏览器颁发一个Cookie。客户端会把Cookie保存起来。  当浏览器再请求该网站时,浏览器把请求的网址连同该Cookie一同提交给服务器。服务器检查该Cookie,以此来辨认用户状态。服务器还可以根据需要修改Cookie的内容。  1、cookie的内容主要包括:名字,值...

2018-08-13 23:04:23 101

原创 get post 请求 函数封装

# 导包from urllib import request,parse# 导入urllib.error包中 HTTPError,URLError 模块 异常捕获from urllib.error import HTTPError,URLError# 再次封装 如果是get请求直接调用 get(url,headers=None) ###headers可不写# a.get(url,...

2018-08-13 23:01:16 203

原创 get请求 函数封装

# 导包from urllib import request# 导入urllib.error包中 HTTPError,URLError 模块 异常捕获from urllib.error import HTTPError,URLError#1. 传入url#2. user_agent#3. headers#4. 定义Request#5. urlopen#6. 返回byte数...

2018-08-13 23:00:11 489

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除