python
python
黑夜中坚持
这个作者很懒,什么都没留下…
展开
-
爬虫爬取网站数据(urllib、requests、lxml)
简介urllib和requests都可以进行页面爬取操作,通过urllib.urlopen()、requests.get()等方法传入url从而获取url页面等信息.另外可以通过lxml中的etree方法通过xpath解析DOM树.其他的库比如BeautifulSoup和lxml一样都可以用来解析xml/html.使用实例代码(requests+lxml)# -*- coding: UTF-8 -*-import sysreload(sys)sys.setdefaultencoding(..原创 2021-06-02 16:14:58 · 634 阅读 · 1 评论 -
python中heapq的使用
from heapq import heapify, heappop, heapreplace, heappush, nsmallest, nlargest# 创建最小堆heapify(list)# 从最小堆中删除并返回栈顶元素top = heappop(list)# 向最小堆中添加元素heappush(list, val)# 从最小堆中先删除栈顶元素然后向最小堆中添加元素res = heapreplace(list, val)# 先向最小堆中添加元素val,并返回堆顶元素res = h原创 2020-07-24 11:36:46 · 690 阅读 · 0 评论