![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 63
Orange_Soda
永远18
展开
-
python爬网页乱码
最近搞爬虫网页经常乱码,查了很多终于整出来了。关于解码编码decode和encode首先要搞清楚,字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。decode的作用是将其他编码的字符串转换成unicode编码,如st原创 2015-08-28 12:34:30 · 1583 阅读 · 0 评论 -
getchar()和getch()区别
1. 有个缓冲区影响2. Getch在"conio.h"而getchar在“iostream”3. Getch()不会显示输入数据1. #include"iostream"2. #include"conio.h"3. using namespace std;4. 5. void main(){6.转载 2015-06-20 10:13:04 · 469 阅读 · 0 评论 -
urllib和urllib2常用方法
在写爬虫时常常用法一些方法,这里我简单做一下归纳一部分:访问服务器1.html=urllib2.urlopen("http://www.baidu.com")打开网页,中间包含了一个request请求2.content=html.read()将上面内容打开网页内容读取下来3.request = urllib2.Request(url, values, headers) 发原创 2015-11-04 17:21:56 · 2044 阅读 · 0 评论 -
python正则表达式
Python爬虫入门:正则表达式1.了解正则表达式正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。正则表达式是用来匹配字符串非常强大的工具,在其他编程语言中同样有正则表达式的概念,Python同样不例外,利用了正则表达式,我们想要从返回的页转载 2015-11-04 23:21:57 · 386 阅读 · 0 评论 -
python 正则表达是常用语法理解
#coding=utf-8#文件操作import os#__file__代表的是当前文件完整路径#os.path.dirname(__file__) 返回的是当前文件所在目录dir_path=os.path.dirname(__file__)file_path=os.path.join(dir_path,"xiaolu.html")#print(file_path)#爬虫#在python3.3里面...原创 2018-04-05 11:29:38 · 2326 阅读 · 0 评论 -
异或 混淆算法
一:使用场景 当需求对数据的传输有不高的安全加密,且加密的时间复杂度越低越好,这时我们可以使用简单的混淆算法(我认为混淆算法本质上就是一种简单的加密算法)。 本文所做的算法是python写的异或混淆算法。二:源码#coding=utf-8'''Created on 2018��4��6��@author: ������'''#初始数据,必须是偶数字节array=[0x...原创 2018-04-06 14:01:08 · 3671 阅读 · 0 评论 -
Python 命令行执行脚本时,提示导入的包找不到
在Pydev能正常执行的脚本,在导出后在命令行执行,通常会报自己写的包导入时找不到。一:报错原因在PyDev中,test.py 中导入TestUserCase里面的py文件时,会写:from TestUserCase.Test import Test这在命Pydev中没错,但是在命令行中确出现错误。因为在PyDev中默认路径除了当前文件所在路劲外,还有工程根路径。而在命令行中只有当前文件所在路径。...原创 2018-04-19 10:16:29 · 13032 阅读 · 2 评论 -
爬虫 反爬虫
转载链接:https://www.zhihu.com/question/28168585/answer/74840535来源:知乎爬虫(Spider),反爬虫(Anti-Spider),反反爬虫(Anti-Anti-Spider),这之间的斗争恢宏壮阔...Day 1小莫想要某站上所有的电影,写了标准的爬虫(基于HttpClient库),不断地遍历某站的电影列表页面,根据 Html 分析电影名字存...转载 2018-04-19 16:50:08 · 224 阅读 · 0 评论 -
python *和**在不同场景下不同 的作用
**两个乘号就是乘方,比如2**4,结果就是2的4次方,结果是16一个乘号*,如果操作数是两个数字,就是这两个数字相乘,如2*4,结果为8*如果是字符串、列表、元组与一个整数N相乘,返回一个其所有元素重复N次的同类型对象,比如"str"*3将返回字符串"strstrstr"如果是函数定义中参数前的*表示的是将调用时的多个参数放入元组中,**则表示将调用函数时的关键字参数放入一个字典中如定义以下函数...转载 2018-04-21 10:37:48 · 366 阅读 · 0 评论