自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 编码问题 ISO8859-1的诸多问题

转换为utf8会出现乱码, 网上很多解决方案都不可行所以, 完全没有必要转换目的无非两种, 因为出现乱码肯定是中文问题如果想直接输出在屏幕上, 则直接r.encoding = 'gbk'gbk是Windows的默认编码方式,而且, iso8859-1是和gbk可以互相转化的, 但是, ISO8859-1不能和utf8直接转换,虽然网上说utf8和gbk可以进行互相的转化, 但是经过...

2019-08-29 21:23:39 1329

原创 编码问题

在进行转码的时候, encode 必须保证字符串是Unicode编码的格式, 如果不是, 需要先用decode转为Unicodes.decode('gb2312').encode('utf-8') #decode('字符串的原始编码').encode('要转化成的编码格式') windows下原始编码为gb2312, Linux下是ASCII注意 以上问题只在Python2 中才会...

2019-08-28 07:48:28 113

原创 深度优先, 广度优先

2019-08-27 12:29:06 89

原创 正则

regex = '^b.*'意思是:^ →以b开头, .→任意字符, *→前边的字符可以重复任意多遍即: 以b开头,b后边可以是任意字符,且字符数量不限re.match(pattern,line)第一个参数是符合条件的正则表达式, 第二个参数是待查找的字符串regex = 'h$'表示以h结尾的字符串?表示非贪婪贪婪的意思就是说会一直找到最后一个符合条件的值, 而非贪婪的...

2019-08-27 12:27:51 109

原创 猫眼电影榜单前50爬取

猫眼电影榜单前50爬取import requestsimport jsonfrom lxml import etree#for n in range(0,5):def getOnepage(n): url = 'https://maoyan.com/board/4?offset={}'.format(n*10) header = {'user-agent':'Mozill...

2019-08-26 22:25:49 371

原创 编码错误的处理方法

在写入文件时遇到的编码错误问题解决方法:with open(filename,'a',encoding = 'utf-8') as f: f.write(content)只要转换一下编码就行了

2019-08-26 22:25:00 1250

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除