- 博客(5)
- 收藏
- 关注
原创 使用Xpath解析数据
首先Xpath是在XML文档中搜索内容的一门语言,使用xpath解析数据是靠网页中节点的关系去查找内容。在使用xpath之前需要下载,可以通过 pip install lxml 下载lxml模块,然后导入lxml中的etree来使用xpath。
2023-07-09 16:24:52 63 1
原创 Python爬虫(bs4)
使用bs4进行爬虫时,需要了解HTML基础知识,同时还要下载bs4,在终端中输入 pip install bs4进行下载。find(标签, 属性 = 值):获取一个,当匹配到第一个之后就不再匹配了。find_all(标签, 属性 = 值):获取全部可以匹配的值。bs4就是根据这个基本格式来获取数据。< 标签, 属性 = 值 >
2023-07-06 11:42:24 194 1
原创 用Python实现求最大公约数(三种方法)
用最大数除以最小数,在除数和余数之间进行反复运算,知道余数为零时,除数就是最大公约数。通过取模的方法找到两个数的共同公约数,再将这些公约数进行相乘。先将输入的两个数处于二变成奇数,记入除了几个二。此时减数和差相等,所有21和9得最大公约数为3。120/60 = 2 余数为零。使用更相相减法,使差和减数相等。最后得到的减数乘以除去的2即可。方法三:更相相减法。方法二:欧几里得算法。
2023-07-01 10:56:11 14232 4
原创 Python——正则表达式
4.re.finditer():返回字符串中的所有符合正则表达式的内容,返回值为迭代器。3.re.findall(正则表达式,字符串) 返回值为列表,匹配字符串中所有符合正则表达式的内容。如果匹配成功则放回,如果匹配失败则返回None。2.re.search(正则表达式,被匹配的字符串,匹配方式)1.re.match(正则表达式,被匹配的字符串,匹配方式)re.S:使 . 匹配包括换行在内的所有字符。.:匹配除“\n”之外的任单个字符。re.l :使匹配对大小写不敏感。re.M:多行匹配。
2023-05-25 11:51:16 85 2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人