Python
Jabf
这个作者很懒,什么都没留下…
展开
-
正则表达式库(Re)入门-Regular expression
概念 正则表达式(Regular expression) 用来简介表达一组字符串的表达式 正则表达式是有字符和操作符构成的 通用字符串表达框架 针对字符串表达“简介”和“特征”思想的工具 判断某字符串的特征归属 常见用途 表达文本类型的特征(病毒、入侵等) 同时查找或替换一组字符串 匹配字符串的全部或部分 使用 编译:将符合正则表达式语法的字符串转换成正则表达式特征 ‘PN’, ‘PYN’, ‘PYTN’, ‘PYTHN’, ‘PYTHON’ 正则表达式:P(Y|YT|YTH|YTHO)?N r原创 2020-08-03 18:11:50 · 544 阅读 · 0 评论 -
爬虫与信息提取
Python学习笔记爬虫与信息提取二、爬虫之提取1.BeautifulSoup入门1.1 安装1.2 引用1.3 BS4的使用1.4 BS4的基本方法Tag (标签)Name (标签名字)Attributes(标签的属性)NavigableString (标签中的字符串)find_all()1.5 基于BS4库的标签遍历方法下行遍历上行遍历平行遍历1.6 基于BS4库的HTML格式化和编码HTML.prettify()BS4默认utf-8编码2.信息组织与提取2.1 信息标记的三种形式XMLJSONYAML原创 2020-07-31 17:31:14 · 538 阅读 · 0 评论