正则
文章平均质量分 70
菜鸟程序熊
本来以为不会再走技术了,没想到,生活就是生活,总是要一棍子又一棍子的把人干躺下,只不过是从头再来。
展开
-
补发爬虫第一战,正则匹配
本来是要准备发小说爬取得姊妹篇——scrapy,不过鉴于本熊是很理解scrapy的各个部分,所以决定暂时将小说爬取后延,不好意思啦,那么接下来,Python爬虫第一战——正则爬取百度贴吧图片 作为写的熊生中第一个爬虫,其实并没有留下什么美好的记忆,讲真,真的不是一段很友好的旅程 正则表达式,一段很特殊的字符串,用来匹配字符串并对对应字符串进行处理。 这里引用一个教程点击打开链接htt原创 2016-12-13 21:36:31 · 783 阅读 · 0 评论 -
爬虫第四战爬取糗事百科搞笑段子
又开始了新的篇章,本熊继续一个Python小白的修行之路,这次要爬取糗事百科主页的段子,恩 。。看起来不错的样子,只是段子不能吃 ,不然,啧啧。。。 相信很多人有去糗百看段子减压的习惯,如果能把这些段子爬下来,以后即便到了一个没网的地方 ,只要文本在手就不会冷场,还是好处多多的。3.2..1...开始爬虫之旅(今天说了两段废话,这习惯得改) 今天的爬虫主要是为了复习下正则,所以相对还原创 2016-12-14 21:54:31 · 709 阅读 · 0 评论