Test_C.-CSDN博客

原创 Python 正则 re 高级用法

https://docs.python.org/zh-cn/3/library/re.htmlhttp://blog.sina.com.cn/s/blog_6dc145220100zoe2.htmlhttps://www.cnblogs.com/dreamer-fish/p/5282679.htmlTable of Contents同时使用 re.I 和 re.S替换时...

2019-03-18 14:46:51 1202

import requestsimport execjsimport reimport jsonurl = "https://www.cnvd.org.cn/"s = requests.session()one_req = s.get(url,verify=False)pp = re.search("cookie=(.*);location",one_req.text,re.S)res2 = execjs.eval(pp.group(1))ck = res2.split(';')[0.

2021-01-22 00:52:28 46949

原创 Ubuntu无界面Linux 使用pyppeteer 报错:pyppeteer.errors.BrowserError: Browser closed unexpectedly:

安装依赖sudo apt-get install gconf-service libasound2 libatk1.0-0 libatk-bridge2.0-0 libc6 libcairo2 libcups2 libdbus-1-3 libexpat1 libfontconfig1 libgcc1 libgconf-2-4 libgdk-pixbuf2.0-0 libglib2.0-0 libgtk-3-0 libnspr4 libpango-1.0-0 libpangocairo-1.0-0 .

2020-06-03 16:54:30 1511

原创 Python 二龙湖爱情故事2020下载

import requestsimport refrom urllib.parse import urljoinimport osimport time# 获取所有ts的urldef one_movie_get_ts(url): s = requests.Session() result = s.get(url) pp = re.search(r'var main = "(.*?)";',result.text,) full_url = urljoin(url.

2020-05-22 15:14:04 1167

原创 Scrapy 后台运行

cd /home/spider/spider_admin/declare_spider/declare_spider/spiders && nohup scrapy crawl gjzscqj -a page=%s -a url=%s -a host=*** -a user=mostchh -a password=*** -a database=spider -a id_time=%s -s DOWNLOAD_DELAY=20 > /home/spider/spider_admin/.

2020-05-18 17:39:02 637

原创 js 破解 cookie获取

import requestsimport reimport execjsurl = 'http://www.gsxt.gov.cn/corp-query-entprise-info-hot-search-list.html?province=100000'headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/8.

2020-05-18 17:30:18 448

原创 js 破解 xxxx登录

aHR0cHM6Ly93d3cudGFwZC5jbi9jbG91ZF9sb2dpbnMvbG9naW4=import requestsimport execjsurl = 'https://www.tapd.cn/cloud_logins/login?ref=https%3A%2F%2Fwww.tapd.cn%2Fmy_worktable%3Fleft_tree%3D1'ph...

2020-04-21 17:07:56 2773

原创 nodejs 启动一个http服务

确保电脑已安装好Node.jsnpm install expressconst express = require('express');const app = express();index = 0;app.get('/', function (req, res) { index += 1; console.log(index); console.lo...

2020-04-17 17:59:15 902

原创 js 破解 XX二手车 cookie参数antipas获取

aHR0cHM6Ly93d3cuZ3VhemkuY29tL2h6Lw==Python 代码:import requestsimport reimport execjsurl = 'https://www.guazi.com/hz/'s = requests.Session()res = s.get(url)res.encoding = res.apparent_en...

2020-04-17 16:51:35 1046 1

原创 Scrapy 获取结束时 [scrapy.statscollectors] 的请求状态

{'downloader/request_bytes': 14072, 'downloader/request_count': 41, 'downloader/request_method_count/GET': 41, 'downloader/response_bytes': 381688, 'downloader/response_count': 41, 'downloader/r...

2020-04-17 15:20:14 1698 1

原创 selenium 实现滑动验证码

https://blog.csdn.net/weixin_38621370/article/details/80812923from selenium import webdriverbrowser = webdriver.Chrome()browser.get('http://www.porters.vip/captcha/sliders.html')hover = brows...

2020-04-08 17:52:49 1118

原创 js逆向 zgrmyh 公开市场业务交易公告

http://www.pbc.gov.cn/zhengcehuobisi/125207/125213/125431/125475/17081/index1.htmlimport uuidimport randomimport requestsimport execjsimport reimport timeimport pymysqlfrom lxml import e...

2020-03-18 23:08:54 2191

原创谷歌学术搜索

https://ac.scmor.com/window = {};hn='ac.scmor.com';var base64DecodeChars = new Array(-1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, ...

2020-03-14 16:19:19 443

原创 xx同城-二手车字体反爬

https://sz.58.com/dazhong/pve_5864_0_3/?&PGTID=0d30001d-0000-4f84-37be-63c81c93e54b&ClickID=58#mainCon保存字体文件import base64str = 'AAEAAAALAIAAAwAwR1NVQiCLJXoAAAE4AAAAVE9TLzL4XQjtAAABjAAAA...

2020-03-09 14:03:49 311

原创 Python pip 设置豆瓣源

在 root 文件下创建一个 .pip 文件夹, 进入文件夹创建一个 pip.conf 的文件[global]index-url = http://pypi.douban.com/simpletrusted-host = pypi.douban.comtimeout = 120

2019-12-20 09:22:38 282

原创 js破解八月x 登录破解

import execjsimport requestsdef login(username,password): login_url = 'http://so.techhg.com/login' headers = { "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,imag...

2019-12-09 17:15:44 355

原创 Linux 使用 crontab 定时执行 Scrapy

sh 文件[root@mostchh-04 spider]# which scrapy/soft/python3/bin/scrapy#!/bin/bashcd /home/spider/news_spider/news_spider/spiders && /soft/python3/bin/scrapy crawlallecho 111 >> ....

2019-11-18 10:53:57 164

原创 Python scrapy 下载图片

https://blog.csdn.net/weixin_42336574/article/details/80946587https://blog.csdn.net/weixin_42428357/article/details/100050648# -*- coding: utf-8 -*-import scrapyfrom urllib.parse import urljoi...

2019-11-07 10:37:45 210

原创 Python Scrapy 中 scrapy.Request 传参数

# -*- coding: utf-8 -*-# 中国产业竞争情报网# http://www.chinacir.com.cn/hyzx/import scrapyfrom urllib.parse import urljoinclass ZgcyjzqbwSpider(scrapy.Spider): name = 'zgcyjzqbw' allowed_doma...

2019-11-06 17:07:32 441

原创 Scrapy 运行多个爬虫spider文件

https://www.cnblogs.com/yunlongaimeng/p/11526466.html1. 在项目文件夹中新建一个commands文件夹2. 在command的文件夹中新建一个文件 crawlall.py3.在crawlall.py 中写一个command类，该类继承 scrapy.commandsfrom scrapy.commands import Scr...

2019-11-05 09:33:50 780

原创 requests 获取 cookie

import requestsurl = 'https://www.baidu.com'headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.70 Safari/537.36'}s ...

2019-10-30 16:57:49 333

原创 base64 编码转图片

import base64data = { "data" : { "token" : "Mp6Mwmh/Eo5BTGl/QA8olg==", "base64Str" : "data:image/png;base64,/9j/4AAQSkZJRgABAgAAAQABAAD/2wBDAAgGBgcGBQgHBwcJCQgKDBQNDAsLDBkSEw8UHRofHh0aHBwg...

2019-10-16 11:06:24 416

原创 js破解 X金所

https://www.hfax.com/login.html#/?rsrc=https%3A%2F%2Fwww.hfax.com%2Findex.html%23%2F抓包分析搜索参数打断点跟进发现 MD5加密imgToken 参数是请求验证码带着的import base64import requestsimport hashlibdef ...

2019-10-16 10:59:08 1041

原创 js破解 XX帮登录 MD5

https://m.wcbchina.com/login/login.html抓包分析登录XHR 断点找堆栈然后进行打断点发现是 MD5 可以直接用 Python 实现sign 值是时间戳的MD5值import requestsimport hashlibimport timeimport randomdef get_md5(s): ...

2019-10-15 12:00:56 342

原创 Ubuntu 18.04 安装 mysql 没有初始密码

https://www.cnblogs.com/williamjie/p/11126486.htmlsudo cat/etc/mysql/debian.cnfuser 是临时登录名password 是临时密码设置 root 密码:use mysql; update mysql.user set authentication...

2019-10-14 13:58:55 506

原创 js破解 X笔网登录

https://fenbi.com/page/home首先登录抓包直接搜索persistent 因为 password 比较大众断点调试把整个js 复制出来 node.js 调用然后缺什么补什么import requestsimport execjsdef login(phone,pwd): url = 'https:...

2019-10-14 10:13:44 689

原创 js破解 DNS登录

https://www.dns.com先登录找请求参数_token 在页面源码中找password 和 email 的加密参数用 execjs 实现import requestsimport execjsimport redef login(phone,passwd): url = 'https://www.dns.com/login.h...

2019-10-09 17:37:26 548

原创 js破解极X助手登录

https://www.jidaihome.com找到post 请求的 url 进行 XHR 断点没找到需要的内容,点击右侧的堆栈看看然后在进行打断点JavaScript加密库Crypto-JS的使用集成了很多加密解密算法https://github.com/brix/crypto-js 进行下载目录结构然后用 execjs 进行调用 ...

2019-10-08 19:01:11 358

原创 js破解微博登录参数

抓请求包全局搜索会发现很多参数在这个请求里多抓几次包会发现只有 su 和 sp 然后找加密的js代码su base64spPython 实现import requests,time, base64, re, jsonimport execjsclass WeiBo(object): def __init__(self...

2019-09-29 18:12:29 644

原创 js破解楚楚街的登录参数加密

http://seller.chuchujie.com/sqe.php?s=/User/index发起请求找到登录参数找到加密参数import requestsimport hashlibdef test(name,passwd): url = 'http://seller.chuchujie.com/sqe.php?s=/AccountSelle...

2019-09-27 13:02:15 159

原创 js破解登录新榜的参数

https://www.newrank.cn/先登录找请求参数找加密参数能用 Python重写的就用Python重写import randomimport mathimport requestsimport timeimport execjsdef nonce_get(): a = ["0", "1", "2", "3", "4", "...

2019-09-25 16:47:04 875

原创 js破解中国国际航空公司登录

http://et.airchina.com.cn/www/jsp/userManager/myinfo.jsp随便登录一个账号密码,查看请求参数找加密参数点击登录触发抠出js代码var window = {};// window.RSAUtils = {setMaxDigits:undefined};// // window.RSAUtils.setMaxD...

2019-09-19 23:21:55 1173 3

原创 js破解零度代理ip

https://nyloner.cn/proxy找到请求参数发现 token 是个加密值直接搜索 token 发现很简单直接用 Python实现就行查找内容生成js 生成内容(function (global) { // existing version for noConflict() var _Base64 = g...

2019-09-17 14:08:44 1257 2

原创 js破解有道翻译

先找到 POST 请求参数找到 POST 请求后的参数进行搜索找到相应的 js 代码import timeimport requestsimport hashlibdef test(): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) App...

2019-09-16 08:50:49 176

原创 js破解百度翻译

保存为 baidu.jsfunction n(r, o) { for (var t = 0; t < o.length - 2; t += 3) { var a = o.charAt(t + 2); a = a >= "a" ? a.charCodeAt(0) - 87 : Number(a), ...

2019-09-09 11:55:59 257

转载 MySQL 文档

https://dev.mysql.com/doc/refman/8.0/en/delete.html

2019-08-30 16:44:32 275 1

原创 Python pymysql 存数据的时候不指定id

数据库建的表需要设置自动递增

2019-08-27 16:56:45 365

原创 Python 处理 url 编码问题

from urllib import parseurl = 'C:/Users/admin/PycharmProjects/untitled/work/行业资讯网址/imgs/c93625fc60b446939f7bf83623774900.jpg'u= parse.quote(url)print(u)url2 = 'C%3A%2FUsers%2Fadmin%2FPycharmPro...

2019-08-27 14:50:12 296

原创 Python getopt的使用

https://docs.python.org/zh-cn/3.7/library/getopt.htmlgetopt.getopt(args, shortopts, longopts=[])args指的是当前脚本接收的参数，它是一个列表，可以通过sys.argv获得shortopts 是短参数　　啥是短参数啊？　　类似于　这样：python test.py -h # 输出帮助信息l...

2019-08-26 14:44:53 87

原创爬虫游戏基础2 http://glidedsky.com

# -*- coding:utf-8 -*-import reimport requestsdef extract_sums(): url ='http://glidedsky.com/login' h = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537...

2019-08-15 16:58:36 331

空空如也

空空如也