python爬虫
文章平均质量分 71
lyn21418154
这个作者很懒,什么都没留下…
展开
-
正则表达式之元字符及函数使用
字符匹配普通字符元字符:[ ]:用来指定一个字符集可匹配其中任一个字符import rest="top tip tqp twp"res=r"t[io]p"re.findall(res,st)['top','tip']res=r"t[^io]p"re.findall(res,st)['tpq','twp']^:匹配行首或者除了某个字符集之外s="helllo w原创 2015-10-29 19:06:24 · 499 阅读 · 0 评论 -
正则表达式内置属性及分组
全文在云课堂http://study.163.com/course/courseLearn.htm?courseId=302001#/learn基础上学习得1、re.S:使 .匹配包括换行在内的所有字符 2、re.I :使匹配对大小写不敏感3、re.L:使本地化识别(local-aware)匹配(不介绍)4、re.M:多行匹配,影响^ 和$5、re.X :对原创 2015-10-29 20:53:16 · 404 阅读 · 0 评论 -
BeautifulSoup的使用学习笔记
中文教程:http://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html#id5在ubuntu下运行Beautiful Soup将复杂HTML文档转换成一个复杂的树形结构,每个节点都是Python对象,所有对象可以归纳为4种: Tag , NavigableString ,BeautifulSoup ,原创 2015-10-30 20:48:52 · 388 阅读 · 0 评论