自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

转载 解决电脑需要切换IP带来的MySQL连接问题

直接上代码:import socket#获取本机电脑名myname = socket.getfqdn(socket.gethostname( ))#获取本机ipmyip = socket.gethostbyname(myname)#判断本机电脑ip地址,根据ip地址去设置网络if '192.168.1.223' in myip: H...

2017-07-29 17:47:00 150

转载 Python UNICODE GBK UTF-8 之间相互转换

Python编码格式检测,可以使用chardet ,例如:    import urllibrawdata = urllib.urlopen('http://www.google.cn/').read()import chardetprint chardet.detect(rawdata)输出结果是: {'confidence': 0....

2017-07-29 10:41:00 152

转载 scrapy 项目实战(一)----爬取雅昌艺术网数据

第一步:创建scrapy项目:  scrapy startproject Demo第二步:创建一个爬虫  scrapy genspider demo http://auction.artron.net/result/pmh-0-0-2-0-1/第三步:项目结构:  第四部:依次粘贴处各个文件的代码:  1. demo.py 文件验证码 ...

2017-07-29 10:40:00 231

转载 解决 scrapy 爬虫出现Forbidden by robots.txt

我们在爬取网站的时候,scrapy 默认的是遵循 robots.txt 协议,怎么破解这个文件操作很简单,找到setting 文件直接改成转载于:https://www.cnblogs.com/xuchunlin/p/7247386.html...

2017-07-27 21:08:00 235

转载 scrapy添加 请求头

直接在 setting 文件中添加转载于:https://www.cnblogs.com/xuchunlin/p/7247384.html

2017-07-27 21:08:00 154

转载 Python Unicode 转换 字符串

estimate_price = "\u00a340\u00a0\u00a0-\u00a060"sold_price = "Sold for \u00a345"转换代码: print type(estimate_price) print type(sold_price)estimate_price = estimate_price.deco...

2017-07-27 21:06:00 194

转载 批量修改图像的大小 Python PIL

#-*-coding:utf-8-*-import osimport os.pathfrom PIL import Imageimport timedef ResizeImage(filein, fileout, width, height, type): img = Image.open(filein) out = img.resize((w...

2017-07-27 21:06:00 68

转载 selenium 实现浏览器 前进和后退

#coding=utf-8from selenium import webdriverdriver = webdriver.Chrome()driver.get("https://www.baidu.com/")driver.get("http://www.cnblogs.com/xuchunlin/")driver.forward() #前进driver.back() # 后...

2017-07-27 21:04:00 105

转载 Python 算法(2) 哈夫曼编码 Huffman Encoding

  这个问题原始是用来实现一个可变长度的编码问题,但可以总结成这样一个问题,假设我们有很多的叶子节点,每个节点都有一个权值w(可以是任何有意义的数值,比如它出现的概率),我们要用这些叶子节点构造一棵树,那么每个叶子节点就有一个深度d,我们的目标是使得所有叶子节点的权值与深度的乘积之和$$\Sigma w{i}d{i}$$最小。  很自然的一个想法就是,对于权值大的叶子节点我们让...

2017-07-27 21:01:00 492

转载 利用国内的源安装 Python第三方库

我们需要安装一些Python的第三方库,但是使用 pip install + 第三方库 的时候,会出现下载速度慢的问题,当然我们也可以使用国内的源安装。例如:  sudo pip install --index https://pypi.mirrors.ustc.edu.cn/simple/ + 第三方库这样的话,速度提升的非常的快。转载于:https:...

2017-07-27 21:01:00 184

转载 Python 算法(1) 快速排序

快速排序(quickSort)快排的思想:首先任意选取一个数据(通常选用数组的第一个数)作为关键数据,然后将所有比它小的数都放到它前面,所有比它大的数都放到它后面,这个过程称为一趟快速排序。百度百科给的算法:一趟快速排序的算法是:1)设置两个变量i、j,排序开始的时候:i=0,j=N-1;2)以第一个数组元素作为关键数据,赋值给key,即key=A[0];3)从j...

2017-07-27 21:01:00 43

转载 Python sql注入 过滤字符串的非法字符

#coding:utf8#在开发过程中,要对前端传过来的数据进行验证,防止sql注入攻击,其中的一个方案就是过滤用户传过来的非法的字符def sql_filter(sql, max_length=20): dirty_stuff = ["\"", "\\", "/", "*", "'", "=", "-", "#", ";", "<", ">",...

2017-07-26 16:26:00 165

转载 python 多线程爬虫 实例

多进程 Multiprocessing 模块Process 类用来描述一个进程对象。创建子进程的时候,只需要传入一个执行函数和函数的参数即可完成 Process 示例的创建。star() 方法启动进程,join() 方法实现进程间的同步,等待所有进程退出。close() 用来阻止多余的进程涌入进程池 Pool 造成进程阻塞。multiprocessing....

2017-07-25 19:20:00 160

转载 tesseract中文语言文件包 下载

tesseract中文语言文件包 下载tesseract中文语言文件包 下载tesseract中文语言文件包 下载下载地址是:https://github.com/tesseract-ocr/langdata转载于:https://www.cnblogs.com/xuchunlin/p/7235995.html...

2017-07-25 19:20:00 612

转载 爬取 Caused by SSLError(SSLError("bad handshake: Error

在爬虫中遇到如下报错:Traceback (most recent call last): File "C:/Users/xuchunlin/PycharmProjects/A9_25/haiwai__guanwang/11__Gorringes/2__gorringes__no__detail_info.py", line 88, in <module> ...

2017-07-25 19:11:00 1099

转载 Django的ORM中如何判断查询结果是否为空,判断django中的orm为空

result= Booking.objects.filter()#方法一 .exists()if result.exists(): print "QuerySet has Data"else: print "QuerySet is empty"#方法二 .count()==0if result.count() == 0:...

2017-07-20 16:43:00 428

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除