自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Pop_Rain的博客

机会往往是长期准备和酝酿的,而不能只靠一时的主动与激情

  • 博客(5)
  • 资源 (1)
  • 收藏
  • 关注

原创 BeautifulSoup与正则_简单爬虫python3实现

本文的内容python3自我实现代码见最下方的代码============以下转载自:http://blog.csdn.net/w93223010/article/details/20358683===============本节的内容主要是如何使用一个Python 写的一个 HTML/XML的解析器——BeautifulSoup,用它将上一节生成的result文件(就是抓取保存的网页源码

2017-06-12 22:48:23 3402

转载 python3抓取网页解码问题!

在网页抓取时,经常遇到网页编码问题,以下是自己总结的干货一、几篇文章字符串编码与Python 3编码:http://blog.csdn.net/wangtaoking1/article/details/51326754  python3 和 python2 的编码与解码差别很大吗?:https://www.v2ex.com/t/343040Python 3的bytes/str之别

2017-06-12 16:22:20 3248

转载 查看网页是否压缩gzip+编码方式

一、查看网页是否压缩gzipreq = urllib.request.Request(url)html = urllib.request.urlopen(req)print(html.info().get('Content-Encoding')) #print(html.info())能查看更多信息二、查看网页编码方式在学习Python爬取网页的时候,我们经常会遇到编

2017-06-12 14:20:51 1389

原创 python3去除str中的n、r

1.替换所有str1 = "sdaasdqw\n"ste1 = str1.replace("\n","")print(str1)2.只是去除两头的str1 = "sdaasdqw\n"str1 = str1.strip("\n\r")print(str1)

2017-06-12 13:57:09 2656

原创 从url中提取域名的几种方法

自己用python3实现的方法:import refrom urllib import parse#from urlparse import urlparsetopHostPostfix = ( '.com','.la','.io','.co','.info','.net','.org','.me','.mobi', '.us','.biz','.xxx','.ca','

2017-06-12 11:12:34 10400

BOW图片sift分类代码

BOW图片sift分类代码,基于李飞飞05年LDA论文生成的模型代码

2017-10-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除