weixin_44518422-CSDN博客

转载 2020-09-20

真实案例拿一个最近使用 parse 的真实案例来举例说明。下面是 ovs 一个条流表，现在我需要收集提取一个虚拟机（网口）里有多少流量、多少包流经了这条流表。也就是每个 in_port 对应的 n_bytes、n_packets 的值。cookie=0x9816da8e872d717d, duration=298506.364s, table=0, n_packets=480, n_bytes=20160, priority=10,ip,in_port="tapbbdf080b-c2" acti.

2020-09-20 23:42:41 72

原创 css

2020-09-14 12:02:58 53

原创段子网爬取段子

看了教学本来打算爬取糗事百科但是搜索发现网站现在用不了：转向段子网思路较为简单：1抓取网页源代码—2re提取标题和内容– 问题一：复制网页源代码写入txt,更改后缀为html发现打开后页面不一样搜索知道网页显示还需要其他支撑问题二：标题和内容数目不对应检查发现re写的不全，下次应先检查时先看网页显示界面找排版规律，再看元素规律，类似实现时可...

2020-02-19 00:43:20 197

原创 exl操作基础知识+ 文件合并

xlrd基本操作方法常用单元格中的数据类型　　♦ 0. empty（空的）,1 string（text）, 2 number, 3 date, 4 boolean, 5 error， 6 blank（空白表格）打开excel文件进行读取data = xlrd.open_workbook(filename)#文件名以及路径，如果路径或者文件名有中文给前面加一个r拜师原生字符。bookxl...

2020-02-16 12:15:55 301

原创 scrapy startproject first_work问题及解决

1.打开cmd (命令窗口，或者 git), cd 到所要创建项目的目录下，scrapy startproject first_work2.创建失败，然后pip uninstall scrapy 在Anacoda Prompt重新安装scrapy3.再次创建scrapy时出现from cryptography.hazmat.bindings._openssl import ffi, l...

2020-02-08 11:57:14 228

原创 xpath用法+os

转自https://blog.csdn.net/hou_angela/article/details/80305828模糊查找6.3 text方法find_element_by_xpath("//a[contains(text(),‘新闻’)]") 查找超链接元素的文本内容find_element_by_xpath("//*[text()=‘新闻’]") 查找所有内容为退出二字的元素...

2020-02-07 23:02:41 118

原创学习基础request请求下载图片后，尝试下载mooc的视频

学习基础request请求下载图片后，尝试下载mooc的视频1.爬取国家地理杂志图片命名为abcimport requestspath="C:/Users/peppa/Pictures/abc.jpg"url="http://image.ngchina.com.cn/2020/0117/20200117062614480.jpg"r=requests.get(url)try: ...

2020-02-06 21:53:40 210

原创爬虫爬取中国大学排名

爬虫爬取中国大学排名import requestsimport bs4 #导入bs4库，下文检测网页数据类型会用到from bs4 import BeautifulSoup def getHTMLText(url): #step1 '''获取网页信息的通用框架''' try: r=requests.get(url,timeout=40) r.ra...

2020-02-04 00:37:05 320

weixin_44518422的博客