- 博客(29)
- 收藏
- 关注
原创 401,404的布尔值居然是False,又被坑了
>>> import requests>>> res=requests.get('http://news.163.com/16/0413/04/BKGNAB01F0001121M.html')>>> print res,bool(res) False>>> 谨记
2016-04-13 11:01:03 679
原创 json.loads编码问题,mysql的select编码问题
json.loads() 出来的都是unicode编码,unicode和utf8相加会变成unicode编码,所以今天就遇到了问题。。。发个文章纪念一下
2016-04-07 18:16:53 914
原创 python汉字编码的问题
在Idle坏境上测试>>> a='我们'>>> a'\xce\xd2\xc3\xc7'可以发现是gbk编码>>> import sys>>> sys.getdefaultencoding()'ascii'发现默认的运行环境是ascii>>> a.decode('gbk')u'\u6211\u4eec'转成unicode编码
2015-12-29 17:09:52 697
原创 base64加密解密
>>> import base64>>> base64.b64encode('123')'MTIz'>>> base64.encodestring('123')'MTIz\n'>>> base64.decodestring('MTIz')'123'>>> base64.b64decode('MTIz\n')'123'>>> 可以看到b64encode和encodest
2015-12-23 18:26:09 1593
原创 使用从mysql中取数据
import MySQLdbconn=MySQLdb.connect(host="xx",user="xx",passwd="xx",db="xx")cursor=conn.cursor()sql="xx"cursor.execute(sql)data=cursor.fetchall()cursor.close()conn.close()
2015-12-18 23:50:51 4373
原创 continue和pass测试
>>> for i in range(1,10): print i try:int('sdfa') except:pass 123456789>>> for i in range(1,10): print i try:int('sdfa') except:continue 123456789>>> 可以看出pass,
2015-12-18 14:14:34 5735
原创 python获取和更改系统编码
>>> import sys>>> sys.getdefaultencoding()'ascii'>>> sys.setdefaultencoding('utf8')Traceback (most recent call last): File "", line 1, in sys.setdefaultencoding('utf8')AttributeError: 'mo
2015-12-17 22:59:14 4707
原创 因为PPBC的防盗链,尝试用vba的对象来解决,顺便复习一下。。。
由于PPBC的防盗链,从其他网站打开图片链接:http://img.plantphoto.cn/image2/b/351969.jpg你不会看到图片的真是内容,此时需要设置referer当尝试添加referer之后还是没用。后来发现使用的是xmlhttp对象,而xmlhttp设置referer是无效的,于是改用winhttp对象,成功。Sub test()For
2015-12-15 23:59:25 6075
原创 以手机app讲解wireshark的简单使用
一.为什么要使用wireshark爬虫的原理就是通过模拟发送请求来获得服务器的返回,从而抓取所需要的信息。对于pc上的浏览器,可以通过查看源代码,或者查看json文件(使用js加载的)来获得请求。但是对于app这样的软件,我们只能通过wireshark来捕获当我们触发了某个事件,到底是发送了哪些请求。(当然它也可以用来捕捉浏览器的包)二.怎么使用wiresharkWiresha
2015-12-13 22:57:23 35121
原创 通过wireshark,以及python代码收发邮件,了解smtp协议,pop协议工作过程
40返回连接服务器成功41.43发送ehlo命令查询服务器支持命令 返回25044.46请求认证 服务器响应235认证成功47.49发送mail命令发送者邮箱 返回25050.51发送rcpt命令接受者邮箱 返回250发送date命令请求发送57发送成功则返回250(在公司测试未收到这个250返回,提示发送失败,但其实邮件已经发送出去了。)58.59请求断开 返
2015-12-13 13:28:40 28921
原创 time,datetime中字符串,时间对象,和时间戳的转换学习整理
获取当前时间的字符串:datetime:本地时间:datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")utc时间: datetime.datetime.utcnow().strftime("%Y-%m-%d %H:%M:%S")time:本地时间:time.strftime("%Y-%m-%d %H:%M:%S",time.
2015-11-30 20:08:07 33123
原创 css选择器 学习笔记
元素选择器:只有某个元素,如hua,hu类选择器:就是class的值,类名前要加.,如hua.zhiwu.chengxu,hu.lanhua(同时包含zhiwu和chengxu的类)ID选择器:以#开头,id的值是唯一的。如#xiang,#chao属性选择器:如:hua[name="zhixiang"][wife="chao"]hu[name="chao
2015-11-30 17:08:18 28164
原创 python 字典
字典的遍历,默认为键值,如果需要遍历值,需要用values>>> a={'q':{'w':1,'e':2},'a':{'s':8,'d':9}}>>> for i in a:print iqa>>> for i in a.values():print i{'e': 2, 'w': 1}{'s': 8, 'd': 9}>>> for i
2015-11-13 00:18:44 27606
原创 python列表函数append(),extend()只改变对象的值,无返回值
a=[1,2,3]b=[4,5,6]c=a.append('a')print c,ad=a.extend(b)print d,a>>> ================================ RESTART ================================>>> None [1, 2, 3, 'a']None [1, 2, 3, 'a'
2015-11-04 17:01:44 30102 1
原创 用Django制作第一个网页
1.django-admin.py startproject plant 创建名为plant的项目tree一下,可以看到文件夹下都有哪些文件2.如下在第二级plant文件夹下新建一个名为pig.py的文件from django.http import HttpResponsedef Hello(request): return HttpResponse('\He
2015-10-27 22:54:54 29940
原创 学习django框架,记录所遇到的问题以及解决方法
话说Django安装好了,于是兴高采烈的准备自己的学习。输入 django-admin.py startproject plant 但是。。。可以看到未找到命令于是找到django-admin.py文件的位置输入全路径,测试成功于是准备建立软链接(类似于win下的快捷方式)ln -s 源文件 目标文件。 当我们需要在不同的目录,用到相同的文件时,不需要在
2015-10-27 00:06:35 29788
原创 Windows7和Ubuntu15.04互相远程控制(在相同内网)
一、Win7远程控制Ubuntu15.04 1.安装xrdp vnc4server xbase-clients三个包 sudo apt-get install xrdp 会自动安装三个包 2.安装xfce4桌面系统,否则windows进不去远程桌面 sudo apt-get install xubintu-desktop
2015-10-26 19:37:26 29601
原创 搭建Django框架
windows7下:1.下载https://www.djangoproject.com/download/ 由于下载比较慢 百度云的:http://pan.baidu.com/s/1i3HDAdR2.解压,cd到setup.py路径下python setup.py install3.查看是否安装成功:
2015-10-25 23:37:39 27860
原创 Vim命令学习笔记
1.进入:vimtutor 插入模式编辑:i 退出返回正常模式 退出::q!(不保存退出):wq(保存退出)2.移动:hjkl3.删除:x,dw.d$,dd4.撤销:u,ctrl+r
2015-10-22 18:52:43 27467 2
原创 Scrapy框架下载一个意大利网站所有植物图片并重命名归科
先上网址:http://www.plantarium.ru/page/samples/taxon/41302.html 一个意大利的植物网站。刚刚搭建完了Scrapy框架,于是打算拿这个网站来练练手。1.首先scrapy startproject plant 建立一个名为plant的项目2.然后明确自己需要提取的内容:图片的网址,图片的科,图片所示植物的名字所以修改items.p
2015-10-20 20:25:01 29104
原创 python爬取并下载一个俄语植物网站上的图片
网站链接:http://www.plantarium.ru/page/samples/taxon/41302.html网站的图片需要逐级进去,而且打开缓慢容易出错,所以打算把图片下下来便于查找,于是便有了这个小爬虫。# -*- coding: utf-8 -*-import re,os,requests,urllib2,chardet,time,sys #requests,c
2015-10-20 19:44:58 28676 2
原创 学习搭建scrapy,记录遇到的问题
1.windows7下:步骤参照:http://blog.csdn.net/playstudy/article/details/17296473 和:http://www.cnblogs.com/txw1958/archive/2012/07/12/scrapy_installation_introduce.html前面所有都很顺利,但在最后一步安装最新版sc
2015-10-16 15:56:24 27589
原创 西门子PLC,STEP7 v5.5安装以及仿真软件Plcsim v5.4 sp5安装
本经验在xp系统亲测有效。一、编程软件的安装1.下载step7 v5.5编程软件 :http://pan.baidu.com/s/1i3tqnMt2.安装过程中会提示:安装之前请重启windows,此时不要重启。(重启也没用) 正确做法:(1)运行REGEDIT; (2)选择HKEY_LOCAL_MACHINE\SYSTEM\Cu
2015-10-14 20:19:15 58827
原创 python批量下载兰科植物网站的图片,并重命名文件
该程序为下载 http://www.orchidspecies.com/ 兰花网站图片,并以名字命名图片的小爬虫。# -*- coding: utf-8 -*-import re,os,requests,urllib2,chardet,time,sysstdi,stdo,stde=sys.stdin,sys.stdout,sys.stderrreload(sys)sys.std
2015-10-01 10:39:51 29123
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人