自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 资源 (2)
  • 收藏
  • 关注

原创 使用代理IP爬取房价

import requests as req import time import pandas as pd from bs4 import BeautifulSoup from sqlalchemy import create_engine import os global info #domain = "https://sz.esf.fang.com/" city = "house/" ...

2019-04-12 08:43:36 172

转载 pycharm使用收藏(转载)

PyCharm3.0默认快捷键(翻译的) PyCharm Default Keymap 1、编辑(Editing) Ctrl + Space    基本的代码完成(类、方法、属性) Ctrl + Alt + Space  快速导入任意类 Ctrl + Shift + Enter    语句完成 Ctrl + P    参数信息(在方法中调用参数) Ctrl + Q    快速查看文档 F...

2018-10-07 21:11:17 565

原创 cv.imwrite()中文路径乱码处理

遇到的问题:在处理12306验证码 ,识别title文字后通过title重命名title文件名,由于中文,一直显示乱码,最终解决办法: #name:中文路径 cv.imencode('.jpg', img_cv)[1].tofile(name) #正确的解决办法 cv.imwrite(name, img_cv),此方法生成的问件中文都是乱码,试了各种编解码均无效,总重搜索发现是OpenCV自身...

2018-10-07 16:11:35 2761

原创 03-12306验证码文字 识别

将切割后的12306验证码,文字部分传入 函数,函数调用百度文字识别接口,识别12306图片中的文字。 # utf-8 __*__ import base64 import numpy as np import cv2 as cv import urllib.parse import requests import json imgF = 'F:\\python\\data\\title....

2018-09-28 08:30:07 628

原创 02-12306验证码预处理(分割、转存dat、解析dat文件)

import cv2 as cv import numpy as np import os import binascii temp_path = r'F:\python\StockAnalyzer\test\test.avi' #img_path = r'F:\12306' data_path = r'F:\python\data' file_path = r'F:\python\Stock...

2018-09-19 08:59:35 417

原创 01-12306-抓取验证码

  # utf-8 __*__ import requests from bs4 import BeautifulSoup import time from PIL import Image from io import BytesIO def getIPPool(ip_url): ''' 从IP网站网站获取动态IP :param ip_url: 获取IP地址的服...

2018-09-06 08:48:54 398

原创 opencv-简单阈值分离图像

import cv2 as cv from matplotlib import pyplot as plt temp_path = r'F:\python\StockAnalyzer\test\test.avi' img_path = r'F:\python\StockAnalyzer\test' img1_path = r'F:\python\StockAnalyzer\test\2018...

2018-09-06 08:36:06 134

Python程序设计开发宝典

董付国Python开发宝典

2018-12-18

tesseract-ocr 4.0

图片文字的OCR识别有一款开源原件tesseract-ocr,最初是在linux上,当然现在也有windows版本,现在发展到4.0版本。

2018-09-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除