- 博客(8)
- 收藏
- 关注
转载 2020-09-20
真实案例拿一个最近使用 parse 的真实案例来举例说明。下面是 ovs 一个条流表,现在我需要收集提取一个虚拟机(网口)里有多少流量、多少包流经了这条流表。也就是每个 in_port 对应的 n_bytes、n_packets 的值 。cookie=0x9816da8e872d717d, duration=298506.364s, table=0, n_packets=480, n_bytes=20160, priority=10,ip,in_port="tapbbdf080b-c2" acti.
2020-09-20 23:42:41
72
原创 段子网爬取段子
看了教学本来打算爬取糗事百科 但是搜索发现网站现在用不了:转向段子网思路较为简单:1抓取网页源代码—2re提取标题和内容– 问题一:复制网页源代码写入txt,更改后缀为html发现打开后页面不一样 搜索知道 网页显示还需要其他支撑 问题二:标题和内容数目不对应 检查发现re写的不全,下次应先检查时先看网页显示界面找排版 规律,再看元素规律,类似实现时可...
2020-02-19 00:43:20
197
原创 exl操作基础知识+ 文件合并
xlrd基本操作方法常用单元格中的数据类型 ♦ 0. empty(空的),1 string(text), 2 number, 3 date, 4 boolean, 5 error, 6 blank(空白表格)打开excel文件进行读取data = xlrd.open_workbook(filename)#文件名以及路径,如果路径或者文件名有中文给前面加一个r拜师原生字符。bookxl...
2020-02-16 12:15:55
301
原创 scrapy startproject first_work问题及解决
1.打开cmd (命令窗口 , 或者 git), cd 到所要创建项目的目录下,scrapy startproject first_work2.创建失败,然后pip uninstall scrapy 在Anacoda Prompt重新安装scrapy3.再次创建scrapy时出现from cryptography.hazmat.bindings._openssl import ffi, l...
2020-02-08 11:57:14
228
原创 xpath用法+os
转自https://blog.csdn.net/hou_angela/article/details/80305828模糊查找6.3 text方法find_element_by_xpath("//a[contains(text(),‘新闻’)]") 查找超链接元素的文本内容find_element_by_xpath("//*[text()=‘新闻’]") 查找所有内容为退出二字的元素...
2020-02-07 23:02:41
118
原创 学习基础request请求下载图片后,尝试下载mooc的视频
学习基础request请求下载图片后,尝试下载mooc的视频1.爬取国家地理杂志图片 命名为abcimport requestspath="C:/Users/peppa/Pictures/abc.jpg"url="http://image.ngchina.com.cn/2020/0117/20200117062614480.jpg"r=requests.get(url)try: ...
2020-02-06 21:53:40
210
原创 爬虫爬取中国大学排名
爬虫爬取中国大学排名import requestsimport bs4 #导入bs4库,下文检测网页数据类型会用到from bs4 import BeautifulSoup def getHTMLText(url): #step1 '''获取网页信息的通用框架''' try: r=requests.get(url,timeout=40) r.ra...
2020-02-04 00:37:05
320
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人