- 博客(7)
- 资源 (2)
- 收藏
- 关注
原创 使用代理IP爬取房价
import requests as req import time import pandas as pd from bs4 import BeautifulSoup from sqlalchemy import create_engine import os global info #domain = "https://sz.esf.fang.com/" city = "house/" ...
2019-04-12 08:43:36 172
转载 pycharm使用收藏(转载)
PyCharm3.0默认快捷键(翻译的) PyCharm Default Keymap 1、编辑(Editing) Ctrl + Space 基本的代码完成(类、方法、属性) Ctrl + Alt + Space 快速导入任意类 Ctrl + Shift + Enter 语句完成 Ctrl + P 参数信息(在方法中调用参数) Ctrl + Q 快速查看文档 F...
2018-10-07 21:11:17 565
原创 cv.imwrite()中文路径乱码处理
遇到的问题:在处理12306验证码 ,识别title文字后通过title重命名title文件名,由于中文,一直显示乱码,最终解决办法: #name:中文路径 cv.imencode('.jpg', img_cv)[1].tofile(name) #正确的解决办法 cv.imwrite(name, img_cv),此方法生成的问件中文都是乱码,试了各种编解码均无效,总重搜索发现是OpenCV自身...
2018-10-07 16:11:35 2761
原创 03-12306验证码文字 识别
将切割后的12306验证码,文字部分传入 函数,函数调用百度文字识别接口,识别12306图片中的文字。 # utf-8 __*__ import base64 import numpy as np import cv2 as cv import urllib.parse import requests import json imgF = 'F:\\python\\data\\title....
2018-09-28 08:30:07 628
原创 02-12306验证码预处理(分割、转存dat、解析dat文件)
import cv2 as cv import numpy as np import os import binascii temp_path = r'F:\python\StockAnalyzer\test\test.avi' #img_path = r'F:\12306' data_path = r'F:\python\data' file_path = r'F:\python\Stock...
2018-09-19 08:59:35 417
原创 01-12306-抓取验证码
# utf-8 __*__ import requests from bs4 import BeautifulSoup import time from PIL import Image from io import BytesIO def getIPPool(ip_url): ''' 从IP网站网站获取动态IP :param ip_url: 获取IP地址的服...
2018-09-06 08:48:54 398
原创 opencv-简单阈值分离图像
import cv2 as cv from matplotlib import pyplot as plt temp_path = r'F:\python\StockAnalyzer\test\test.avi' img_path = r'F:\python\StockAnalyzer\test' img1_path = r'F:\python\StockAnalyzer\test\2018...
2018-09-06 08:36:06 134
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人