2017年07月_aini4568

转载解决电脑需要切换IP带来的MySQL连接问题

直接上代码：import socket#获取本机电脑名myname = socket.getfqdn(socket.gethostname( ))#获取本机ipmyip = socket.gethostbyname(myname)#判断本机电脑ip地址，根据ip地址去设置网络if '192.168.1.223' in myip: H...

2017-07-29 17:47:00 150

转载 Python UNICODE GBK UTF-8 之间相互转换

Python编码格式检测，可以使用chardet ，例如：　　　　import urllibrawdata = urllib.urlopen('http://www.google.cn/').read()import chardetprint chardet.detect(rawdata)输出结果是： {'confidence': 0....

2017-07-29 10:41:00 152

转载 scrapy 项目实战（一）----爬取雅昌艺术网数据

第一步：创建scrapy项目：　　scrapy startproject Demo第二步：创建一个爬虫　　scrapy genspider demo http://auction.artron.net/result/pmh-0-0-2-0-1/第三步：项目结构：　　第四部：依次粘贴处各个文件的代码：　　1. demo.py 文件验证码　...

2017-07-29 10:40:00 231

转载解决 scrapy 爬虫出现Forbidden by robots.txt

我们在爬取网站的时候，scrapy 默认的是遵循 robots.txt 协议，怎么破解这个文件操作很简单，找到setting 文件直接改成转载于:https://www.cnblogs.com/xuchunlin/p/7247386.html...

2017-07-27 21:08:00 235

转载 scrapy添加请求头

直接在 setting 文件中添加转载于:https://www.cnblogs.com/xuchunlin/p/7247384.html

2017-07-27 21:08:00 154

转载 Python Unicode 转换字符串

estimate_price = "\u00a340\u00a0\u00a0-\u00a060"sold_price = "Sold for \u00a345"转换代码： print type(estimate_price) print type(sold_price)estimate_price = estimate_price.deco...

2017-07-27 21:06:00 194

转载批量修改图像的大小 Python PIL

#-*-coding:utf-8-*-import osimport os.pathfrom PIL import Imageimport timedef ResizeImage(filein, fileout, width, height, type): img = Image.open(filein) out = img.resize((w...

2017-07-27 21:06:00 68

转载 selenium 实现浏览器前进和后退

#coding=utf-8from selenium import webdriverdriver = webdriver.Chrome()driver.get("https://www.baidu.com/")driver.get("http://www.cnblogs.com/xuchunlin/")driver.forward() #前进driver.back() # 后...

2017-07-27 21:04:00 105

转载 Python 算法（2）哈夫曼编码 Huffman Encoding

　　这个问题原始是用来实现一个可变长度的编码问题，但可以总结成这样一个问题，假设我们有很多的叶子节点，每个节点都有一个权值w(可以是任何有意义的数值，比如它出现的概率)，我们要用这些叶子节点构造一棵树，那么每个叶子节点就有一个深度d，我们的目标是使得所有叶子节点的权值与深度的乘积之和$$\Sigma w{i}d{i}$$最小。　　很自然的一个想法就是，对于权值大的叶子节点我们让...

2017-07-27 21:01:00 492

转载利用国内的源安装 Python第三方库

我们需要安装一些Python的第三方库，但是使用 pip install + 第三方库的时候，会出现下载速度慢的问题，当然我们也可以使用国内的源安装。例如：　　sudo pip install --index https://pypi.mirrors.ustc.edu.cn/simple/ + 第三方库这样的话，速度提升的非常的快。转载于:https:...

2017-07-27 21:01:00 184

转载 Python 算法（1）快速排序

快速排序（quickSort）快排的思想：首先任意选取一个数据（通常选用数组的第一个数）作为关键数据，然后将所有比它小的数都放到它前面，所有比它大的数都放到它后面，这个过程称为一趟快速排序。百度百科给的算法：一趟快速排序的算法是：1）设置两个变量i、j，排序开始的时候：i=0，j=N-1；2）以第一个数组元素作为关键数据，赋值给key，即key=A[0]；3）从j...

2017-07-27 21:01:00 43

转载 Python sql注入过滤字符串的非法字符

#coding:utf8#在开发过程中，要对前端传过来的数据进行验证，防止sql注入攻击，其中的一个方案就是过滤用户传过来的非法的字符def sql_filter(sql, max_length=20): dirty_stuff = ["\"", "\\", "/", "*", "'", "=", "-", "#", ";", "<", ">",...

2017-07-26 16:26:00 165

转载 python 多线程爬虫实例

多进程 Multiprocessing 模块Process 类用来描述一个进程对象。创建子进程的时候，只需要传入一个执行函数和函数的参数即可完成 Process 示例的创建。star() 方法启动进程，join() 方法实现进程间的同步，等待所有进程退出。close() 用来阻止多余的进程涌入进程池 Pool 造成进程阻塞。multiprocessing....

2017-07-25 19:20:00 160

转载 tesseract中文语言文件包下载

tesseract中文语言文件包下载tesseract中文语言文件包下载tesseract中文语言文件包下载下载地址是：https://github.com/tesseract-ocr/langdata转载于:https://www.cnblogs.com/xuchunlin/p/7235995.html...

2017-07-25 19:20:00 612

转载爬取 Caused by SSLError(SSLError("bad handshake: Error

在爬虫中遇到如下报错：Traceback (most recent call last): File "C:/Users/xuchunlin/PycharmProjects/A9_25/haiwai__guanwang/11__Gorringes/2__gorringes__no__detail_info.py", line 88, in <module> ...

2017-07-25 19:11:00 1099

转载 Django的ORM中如何判断查询结果是否为空，判断django中的orm为空

result= Booking.objects.filter()#方法一 .exists()if result.exists(): print "QuerySet has Data"else: print "QuerySet is empty"#方法二 .count()==0if result.count() == 0:...

2017-07-20 16:43:00 428

aini4568的博客