Python
文章平均质量分 65
Panix2n_n
这个作者很懒,什么都没留下…
展开
-
用BeautifulSoup模块解析HTML
一、不要用正则表达式来解析HTML原因:HTML的格式有许多不同的方式,并且仍然被认为有效,但尝试用正则表达式来捕捉所有这些可能的变化,将会非常复杂且容易出错。二、使用BeautifulSoup模块解析HTML1、从HTML创建一个BeautifulSoup对象import bs4, requests #导入模块res = requests.g...原创 2018-05-25 10:42:57 · 231 阅读 · 0 评论 -
Python中断言、抛出异常
断言1、assert a==5,'a need to be 5'即格式为:assert 条件,当条件为False时显示的字符串 2、进行心智正常的检查。3、运行Python时传入 -O 选项,可以禁用断言。抛出异常1、raise Exception('This is the error message.')即格式为:raise Exception('出错信息字符串')2、调用trackback.f...原创 2018-05-15 11:10:57 · 2801 阅读 · 0 评论 -
利用Python从web抓取信息
一、webbrowser模块:打开网页webbrowser.open(' URL') 启动一个新的浏览器,打开指定的URLsys模块中sys.argv变量保存了程序的文件名和命令行参数列表二、requests模块:从Web下载文件 检查Response对象的status_code属性,可以了解对这个网页的请求是否成功。若成功,则该值为requests.code.ok(HTTP协议中‘OK’状态码为...原创 2018-05-16 17:39:08 · 459 阅读 · 0 评论 -
Python 多线程
1、使用threading模块,在单独的线程中执行任务2、向线程的目标函数传递参数print('cat','dog','frog',sep =' & ') #设置输出的间隔符#输出为cat & dao & frog若要在自己的线程中实现以上print调用:常规参数作为一个列表,传递给args关键词参数;关键字参数作为一个字典,传递给kwargs关键词参数。import t...原创 2018-05-24 23:43:08 · 108 阅读 · 0 评论