自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小白白的爬虫

找到第一份python爬虫的工作

  • 博客(2)
  • 收藏
  • 关注

原创 爬虫之SET(),正则之?!,python23共存

![FIJI水](http://img.blog.csdn.net/20160728150700108)爬虫之SET()我以前不是很明白为什么要用set()而不是定义任意的一个序列呢? 于是书里讲了,无序性,搜索快。 关于set()怎么用的看这里:Python的set() 正则之?!这个符号是用来筛掉你不想要的内容的。 比如:(?!:)就是不要冒号有个帖子讲得很专业:否定式前瞻 BS4之t

2016-07-28 15:08:35 244

原创 7月25日开始学习爬虫

7月25日开始学习爬虫7月25日看了一下cuiqingcai的博客,看到糗事百科的例子的时候发现跟不上了。应该是前面的内容没有2. 消化,随即更改策略。7月26日在网上搜教程,搜到一个偏“服务器/用户逻辑梳理”的教程,大致了解了怎么使用chrome审查工具和一些乱七八糟的东西。还去阅读了beautifulsoup4说明文档,里面讲了bs的解析器啊,各种tag调用方法啊,对html文档的格式可以说

2016-07-27 11:12:12 151 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除