自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 Xpath基础内容

4. 选择“class”节点下含有“age=20”的所有“student”节点的所有“name”节点。3.选择“class”节点下含有“age”且“age=20”的所有“student”节点。4. 选择“class”节点下属性“id”值为“ADR02”的所有“student”节点。2.表示选择“class”节点下的所有“student”节点的“name”节点。2. 选择“class”节点下含有“age”节点的所有“student”节点。1. 选择“class”节点下所有的“student”节点的所有节点。

2023-06-14 15:33:27 304

原创 算法学习-冒泡排序/选择排序/插入排序

【代码】算法学习-冒泡排序/选择排序/插入排序。

2023-04-18 21:25:03 111

原创 python功能实现笔记

词频统计python实现计数pandas词频统计并排序文件操作操作函数的方法访问方式读写操作python基础读写txt文件操作pandas读写excel文件操作pandas读写 txt/csv 文件操作数据操作列表转字典字典转列表 列表数据去重列表截取字符串操作字符串合并简单合并列表元素合并成字符串 字符串分割截取字符串依据分隔符分割字符串按位截取特殊字符串检索

2022-12-05 14:39:54 425

原创 MYSQL

如果 expr1 是TRUE (expr1 0 and expr1 NULL),则 IF()的返回值为expr2;MySQL 是最流行的关系型数据库管理系统,在 WEB 应用方面 MySQL 是最好的 RDBMS(Relational Database Management System:关系数据库管理系统)应用软件之一。LENGTH返回字符串中数字和字母一个字符长度,utf-8的汉字则是三字符长度。匹配的'哈喽'字符串前只能有一个字符。匹配的'哈喽'字符串后只能有一个字符。

2022-11-25 14:36:05 280

原创 python xpath相关库

etree.tostring是将内容转化为2进制然后以utf-8格式进行解码。lxml库提供了一个etree模块,该模块专门用来解析HTML/XML文档。etree.parse是对本地html文件进行读取。读取并解析html文件。

2022-11-24 19:45:41 322

原创 python re库

匹配分割string maxsplit是允许被分割成几个子串,默认是0最大化字串,如果是1则是从原本字符串中切出一个字串,其他字串整串返回。1. 如果正则表达式中有多个括号时,列表的元素为多个字符组合成的元组,元组中的字符串格式与括号数对应,内容与正则表达式顺序对应。3.当给出的正则表达式不带括号的时候,列表的元素为字符串,此时字符串为整个正则表达式匹配的内容。2.正则表达式中只有一个括号,列表元素为字符串时,则内容和括号中的正则表达式对应。该函数将创建一个正则表达式的对象,可以实现更有效率的复用。

2022-11-24 16:44:58 9669

原创 python requests库

返回的url为http://www.baidu.cpm/s?6.auth:该参数的支持用户认证功能,也就是适合那些需要验证用户名、密码的网站。auth 的参数形式是一个元组。5.timeout:该参数可以传入一个简单的浮点数,它将请求的连接部分和读取部分设为相同的超时时间。3.json:JSON格式的数据,作为request的内容(使用方式和data一致,不再演示)post是请求服务器接受所指定的文档作为所标识的url的新的从属实体。1. params: 字典或者字节序列,作为参数增加到url中。

2022-11-24 10:30:50 683

原创 python基础爬虫篇

headers是头文件,常见的网页一般都需要用headers进行一定程度的伪装,user-agent参数可以被视为必加内容,这是证明你从浏览器发出的请求而非从python中发出的请求,而cookie是用于维持你登录状态的一个参数,如果该网页没有登录状态需要维持,那么也可以选择不加,只添加user-agent参数就好。在这一区域我们只能观察和分析网页的静态内容,但也是我们用于抓取网页内容的重要环节。xx就是我们需要的内容了,反复通过这样的方式获取到各种内容,用一定的数据处理的方式整理一下,存储起来就好了。

2022-11-23 20:02:48 1146 1

原创 python 使用fasttext 分词算法 基础使用思路篇

fasttext 基础使用方式

2022-11-23 15:38:34 970 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除