爬虫
文章平均质量分 66
番茄哈哈
大家有什么问题可以提,看到了就会回复,可以一起讨论问题呀,会不定时更新博文,内容不定,时间不定,嘻嘻嘻
展开
-
Python爬虫(二):beautifulsoup库介绍、爬取段子实例
本文主要内容:1.beautifulsoup库安装。2.beautifulsoup库介绍。3.爬取段子实例。1.beautifulsoup库安装。要使用beautifulsoup库,必须要先安装,安装很简单,使用控制台输入pip install beautifulsoup4在使用的时候我们在代码首行输入from bs4 import BeautifulSoup就可以...原创 2018-08-09 10:40:51 · 1446 阅读 · 0 评论 -
Python爬虫(三):正则表达式入门,爬取糗事百科笑话实例
前面我们已经能用beautifulsoup库解析HTML页面并获得我们要的数据,但用beautifulsoup库有很多限制,有时候并不能达到理想的效果(文章中我将给出对比实例)。在这篇文章中我将介绍另外一种解析HTML页面的方法,利用正则表达式。本文主要内容:1.正则表达式介绍。2.利用正则表达式爬取笑话。3.正则表达式爬取结果与beautifulsoup爬取结果对比。1.正则...原创 2018-08-09 15:58:23 · 2849 阅读 · 1 评论 -
Python爬虫(前言):有趣的一个爬虫实例(爬取段子,笑话,情感句子)
这次准备介绍Python爬虫爬取网页数据、解析并应用于实践,打算写几篇文章,从最基础的Python爬虫语法开始介绍爬虫,步步深入,最终实现一个较完整的实例。这一系列文章包括:request库介绍及应用。beautifulsoup库介绍及应用。正则表达式匹配及应用。对话机器人实例。tkinter库制作界面以及Python程序打包成可执行exe文件本篇文章主要给出我最后做出...原创 2018-08-07 17:52:09 · 6394 阅读 · 1 评论 -
Python爬虫(一):爬虫介绍、Requests库介绍及实例
本文主要内容:1.爬虫的相关概念。2.Requsets库安装。3.Requests库介绍。4.爬取网页的通用代码框架。1.爬虫相关概念。网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。(百度百科)网络爬虫就是从网页中...原创 2018-08-08 17:46:55 · 1989 阅读 · 0 评论