- 博客(9)
- 收藏
- 关注
原创 Xpath基础内容
4. 选择“class”节点下含有“age=20”的所有“student”节点的所有“name”节点。3.选择“class”节点下含有“age”且“age=20”的所有“student”节点。4. 选择“class”节点下属性“id”值为“ADR02”的所有“student”节点。2.表示选择“class”节点下的所有“student”节点的“name”节点。2. 选择“class”节点下含有“age”节点的所有“student”节点。1. 选择“class”节点下所有的“student”节点的所有节点。
2023-06-14 15:33:27 304
原创 python功能实现笔记
词频统计python实现计数pandas词频统计并排序文件操作操作函数的方法访问方式读写操作python基础读写txt文件操作pandas读写excel文件操作pandas读写 txt/csv 文件操作数据操作列表转字典字典转列表 列表数据去重列表截取字符串操作字符串合并简单合并列表元素合并成字符串 字符串分割截取字符串依据分隔符分割字符串按位截取特殊字符串检索
2022-12-05 14:39:54 425
原创 MYSQL
如果 expr1 是TRUE (expr1 0 and expr1 NULL),则 IF()的返回值为expr2;MySQL 是最流行的关系型数据库管理系统,在 WEB 应用方面 MySQL 是最好的 RDBMS(Relational Database Management System:关系数据库管理系统)应用软件之一。LENGTH返回字符串中数字和字母一个字符长度,utf-8的汉字则是三字符长度。匹配的'哈喽'字符串前只能有一个字符。匹配的'哈喽'字符串后只能有一个字符。
2022-11-25 14:36:05 280
原创 python xpath相关库
etree.tostring是将内容转化为2进制然后以utf-8格式进行解码。lxml库提供了一个etree模块,该模块专门用来解析HTML/XML文档。etree.parse是对本地html文件进行读取。读取并解析html文件。
2022-11-24 19:45:41 322
原创 python re库
匹配分割string maxsplit是允许被分割成几个子串,默认是0最大化字串,如果是1则是从原本字符串中切出一个字串,其他字串整串返回。1. 如果正则表达式中有多个括号时,列表的元素为多个字符组合成的元组,元组中的字符串格式与括号数对应,内容与正则表达式顺序对应。3.当给出的正则表达式不带括号的时候,列表的元素为字符串,此时字符串为整个正则表达式匹配的内容。2.正则表达式中只有一个括号,列表元素为字符串时,则内容和括号中的正则表达式对应。该函数将创建一个正则表达式的对象,可以实现更有效率的复用。
2022-11-24 16:44:58 9669
原创 python requests库
返回的url为http://www.baidu.cpm/s?6.auth:该参数的支持用户认证功能,也就是适合那些需要验证用户名、密码的网站。auth 的参数形式是一个元组。5.timeout:该参数可以传入一个简单的浮点数,它将请求的连接部分和读取部分设为相同的超时时间。3.json:JSON格式的数据,作为request的内容(使用方式和data一致,不再演示)post是请求服务器接受所指定的文档作为所标识的url的新的从属实体。1. params: 字典或者字节序列,作为参数增加到url中。
2022-11-24 10:30:50 683
原创 python基础爬虫篇
headers是头文件,常见的网页一般都需要用headers进行一定程度的伪装,user-agent参数可以被视为必加内容,这是证明你从浏览器发出的请求而非从python中发出的请求,而cookie是用于维持你登录状态的一个参数,如果该网页没有登录状态需要维持,那么也可以选择不加,只添加user-agent参数就好。在这一区域我们只能观察和分析网页的静态内容,但也是我们用于抓取网页内容的重要环节。xx就是我们需要的内容了,反复通过这样的方式获取到各种内容,用一定的数据处理的方式整理一下,存储起来就好了。
2022-11-23 20:02:48 1146 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人