自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 收藏
  • 关注

原创 Frida 重启失败问题(Unable to start: Could not listen on address 127.0.0.1, port 27042: Error binding to a)

Unable to start: Could not listen on address 127.0.0.1, port 27042: Error binding to address 127.0.0.1:27042: Address already in use

2021-12-17 14:59:23 7346 1

原创 使用卷积神经网络矫正图像方向

旋转验证码识别

2021-12-15 14:45:10 999 1

原创 docker容器获取宿主机ip地址

import paramikos = paramiko.SSHClient()s.load_system_host_keys()# 密码列表list1 = ['521999']for password in list1: try: s.set_missing_host_key_policy(paramiko.AutoAddPolicy()) # ...

2020-03-02 14:25:50 10904 2

原创 selenium+headless模式webdriver=true修改

self.browser.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", { "source": """ Object.defineProperty(navigator, 'webdriver', {webdriver:undefined}); """ ...

2020-03-02 14:21:48 1737 3

原创 测试学习系列-------selenium

因为本人现在所做的工作是Python爬虫,并且所有的框架就是selenium,所以对selenium的了解就先不在博客上写出,日后有时间在补充。

2020-03-02 14:10:03 153

原创 selenium禁止加载图片(headless无头模式,有界面模式通用)

self.options.add_argument('blink-settings=imagesEnabled=false')无头模式测试截图有界面截图

2020-02-21 16:52:15 2305

原创 Chrome+selenium+headless报错无法加载插件

selenium+headless加载插件代码self.options.add_argument('--headless')# 加载插件self.options.add_extension(r"G:\插件\SwitchyOmega_Chromium.crx") 报错selenium.common.exceptions.WebDriverException: Message...

2020-02-19 10:15:43 2066 1

原创 json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0)

该错是由于文件连续读了两遍即两个fp.read()导致的

2019-12-30 17:49:44 485 2

原创 mitmproxy中间人-强大的抓包及修改工具

import mitmproxy.httpclass QH(object): def request(self, flow: mitmproxy.http.HTTPFlow): # 发出请求之前做的操作 if 'xxx' in flow.request.url: # flow.request.url请求的url ...

2019-11-14 15:40:15 1661

原创 多线程爬虫

记得前几个月刚毕业面试由于一直依赖框架,有一次面试让我写多线程爬虫竟然没写出来,后悔不已,今天突然想起来,并且刚好打开博客,便记录一个利用futures线程池库的多线程爬虫,技术有限,不足请评论指出。import timefrom queue import Queuefrom concurrent.futures import ThreadPoolExecutor, as_complet...

2019-11-14 15:23:55 210

原创 Xposed-----Hook神器

最近在搞Android app逆向,需要对函数进行Hook以便了解到函数的输入与输出,由于自己刚刚接触xposed所以记录一下学习经验,有错误或者不妥之处请告诉我,大家共同进步。使用Android Studio创建一个Android项目。项目目录 在AndroidManifest.xml中写入 <application android:allowBack...

2019-11-14 14:44:43 669

原创 写入文件是正常显示中文,不显示ASCII

with open('Totonto Sun.json', 'a+',encoding="utf-8") as f: json.dump(result,f,ensure_ascii=False)ensure_ascii=False输出真正的中文需要指定ensure_ascii=False不指定时默认为ASCII...

2019-08-27 16:05:42 384

转载 多线程,多进程的选择

https://zhuanlan.zhihu.com/p/24283040

2019-05-29 14:36:25 141

原创 生成十三位时间戳

# /PycharmProjects/carspider# -*- coding: utf-8 -*-# @Time : 18-12-17 下午2:25# @Author : hqian# @File : 13位时间戳.py# @Software: PyCharmimport timeimport sysreload(sys)sys.setdefaultenco...

2019-05-17 17:58:13 1459

原创 爬虫521错误

请求网页返回521错误很大概率是一种js反爬.这种网站正常网页打开通过抓包工具可以观察到室友两次请求的,第一次返回一段js代码,第二次才是正常的结果,所以我们需要把第一次返回的js执行出来,比如网站:http://www.cbrc.gov.cn/chinese/newListDoc/111005/1.html就是一个返回521的典型网站通过观察js可以用python进行...

2019-05-17 17:49:34 3172

原创 xpath获取块元素下<br>下的所有信息

目标网址:https://www.sec.gov/cgi-bin/browse-edgar?action=getcurrent如图所示需要取到黄色部分源码如果使用//text()并不能取到br下面的内容all_time_list_1 = response.etree.xpath('//div[starts-with(@style,"margin-left")]//table...

2019-05-13 17:47:25 3134

原创 MongoDB基本操作

# /PycharmProjects/carspider# -*- coding: utf-8 -*-# @Time : 19-2-15 下午4:52# @Author : hqian# @File : 本地mongodb练习.py# @Software: PyCharmimport sysimport pymongoreload(sys)sys.setdefau...

2019-03-08 10:34:04 181

原创 ubantu 查看cpu占用等

sudo apt install htop

2018-12-10 15:11:30 240

转载 pyspider捕获各种状态码(设置其它状态码也不报错,正常执行回调.)

def on_start(self): self.crawl('http://httpbin.org/status/404', self.callback) @catch_status_code_error def callback(self, response): 通常来说只有状态码为200才是正常并执行回调,这个参数可以设置其它状态码也不报错,正常执行回调.这个实例遇...

2018-11-27 10:06:55 826

原创 pandas 操作mongdb excel

# -*- encoding: utf-8 -*-import pymongoimport pandas as pd# 链接mongdbclient = pymongo.MongoClient('localhost', 27017)# 数据库名字db = client['research']# 表名pk10 = db['highway_name']# 从excel中读数...

2018-11-21 13:48:26 234

原创 抽取email的正则表达式

([1-9]\d{5}[12]\d{3}(0[1-9]|1[012])(0[1-9]|[12][0-9]|3[01])\d{3}[0-9xX])$ 

2018-11-19 10:09:32 598

原创 身份证号正则表达式

([1-9]\d{5}[12]\d{3}(0[1-9]|1[012])(0[1-9]|[12][0-9]|3[01])\d{3}[0-9xX])$ 

2018-11-19 10:08:48 242

原创 IP地址正则表达式

(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d)\.(25[0-5]|2[0-4]\d|[0-1]\d{2}|[1-9]?\d) 

2018-11-19 10:07:40 174

原创 生成日期(2018-11-19)

from datetime import date, timedeltaprint (date.today() + timedelta(days = -1)).strftime("%Y-%m-%d")print (date.today() + timedelta(days = 0)).strftime("%Y-%m-%d") 输出        2018-11-18    ...

2018-11-19 10:06:10 325

原创 爬取奥迪官网

from pyspider.libs.base_handler import *from lxml import etreeimport refrom datetime import datetimeimport randomimport pymongodb = client['research']col = db['car_information']col.create_in...

2018-09-30 14:49:37 335

原创 Cookie带时间戳

#!/usr/bin/env python# -*- encoding: utf-8 -*-# Created on 2018-08-28 10:33:19# Project: HMfrom pyspider.libs.base_handler import *import jsonfrom time import timedef get_headers(): retur...

2018-08-28 21:11:49 1569

原创 User_agent池

user_agent = [    'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_6_0) AppleWebKit/537.4 (KHTML, like Gecko) Chrome/22.0.1229.79 Safari/537.4',    'Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_0; en-U...

2018-08-28 21:09:10 866

原创 Pyspider 错误(Exception: HTTP 599)

Exception: HTTP 599: Failed to connect to 127.0.0.1 port 25555: Connection refused这个错误 十有八九是 phantomjs 挂了,重新启动一下phantomjs即可解决

2018-08-28 21:04:23 3153

转载 supervisor安装

supervisor就是用Python开发的一套通用的进程管理程序,能将一个普通的命令行进程变为后台daemon,并监控进程状态,异常退出时能自动重启 Ubantu:    sudo apt-get install supervisorapt-get/yum安装的会自动生成    /etc/init.d/supervisord    和    /etc/supervisord.conf...

2018-08-28 21:02:16 343

转载 Ubuntu安装PhantomJS

sudo apt-get install phantomjssudo apt-get install nodejssudo apt-get install nodejs-legacysudo apt-get install npmsudo npm -g install phantomjs-prebuilt完成后输入phantomjs --version若显示当前版本号,则 ...

2018-08-28 20:13:49 529

原创 Ubuntu16.04下pyspider安装

sudo apt-get install python python-dev python-distribute python-pip libcurl4-openssl-dev libxml-dev libxslt1-dev python-lxmlsudo apt-get install aptitudesudo aptitude install libpq-devsudo apt-g...

2018-08-10 10:50:23 356

转载 类的继承

class AddressBookEntry(object) version = 0.1 def __init__(self,name,phone): self.name = name self.phone = phone def update_phone(self,phone): self.phone = phone    ...

2018-06-04 20:46:19 108

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除