妖白的奇幻漂流世界

世界这么大,我要学python

python3 爬虫面对如此多重复的标签,应该怎么爬才能爬到自己需要的信息

我们知道 利用BeautifulSoup解析网页可以根据树以及各个标签来爬去 ,但是有个问题我们不能忽略,比如 1    BeautifulSoup 只要目标信息的旁边或者附近有标签就可以调用 ,,不用管是几层标签(父辈 后代辈 的都可以)。 Soup.html.body.h1 Soup...

2017-11-09 11:10:02

阅读数:3306

评论数:0

python3 BS4 BeautifulSoup 解析的一些解析(迷惑点)

1    BeautifulSoup 只要目标信息的旁边或者附近有标签就可以调用 ,,不用管是几层标签(父辈 后代辈 的都可以)。 Soup.html.body.h1 Soup.body.h1 Soup.html.h1 Soup.h1 索引的效果都是同一个内容。 但是应该把重要的标签包含进去,以免...

2017-11-08 15:38:14

阅读数:909

评论数:0

pandas中字符串和日期的相互转换

原文地址:http://blog.csdn.net/luoganttcc/article/details/77585038?locationNum=8&fps=1 将数字转化成时间格式 from dateutil.parser import parse a...

2017-11-08 09:49:12

阅读数:369

评论数:0

python3中format函数

format是python2.6新增的一个格式化字符串的方法,相对于老版的%格式方法,它有很多优点。 %能实现的format都能实现 并且功能更多,操作更方便 。 优势: 1.不需要理会数据类型的问题,在%方法中%s只能替代字符串类型 2.单个参数可以多次输出,参数顺序可以不相同 3.填充...

2017-11-03 15:25:01

阅读数:2163

评论数:0

python 中re库(正则表达式)的一些困惑解疑

正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。 疑惑1: 首先要明确re库中的普通字符,特殊字符(元字符)以及打印字符。 1普通字符 一般为所有的大写和小写字母字符...

2017-11-03 09:25:15

阅读数:89

评论数:0

python3中的 eval函数

http://blog.csdn.net/zhanh1218/article/details/37562167 原文 eval()函数十分强大,官方demo解释为:将字符串str当成有效的表达式来求值并返回计算结果。 so,结合math当成一个计算器很好用。 可以把...

2017-11-02 11:04:50

阅读数:5073

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭