bs4解析
1. HTML语法规则
bs4 解析比较简单,但是呢,我们需要了解一些基础的前端知识,然后再使用 bs4 去提取,逻辑就会清晰很多,编写难度也会大大降低
HTML(Hyper Text Markup Language)超文本标记语言,是我们编写网页的最基本同时也是最核心的一种语言,其语法规则就是用不同的标签对网页上的内容进行标记,从而使网页显示出不同的展示效果
<h1>数据解析</h1>
上述代码的含义是在页面中显示 “数据解析” 4 个字,但是 “数据解析” 这 4 个字被 “<h1>
” 和 “</h1>
” 标记了,这个时候,浏览器在展示的时候就会让里面的内容,也就是 ”数据解析“ 这 4 个字变大加粗,俗称标题,所以 HTML 的语法就是用类似这样的标签对页面内容进行标记,不同的标签表示出来的效果也是不一样的
h1:一级标题
h2:二级标题
p:段落
font:字体
body:主体
这里只是给小白们简单科普一下,HTML 的标签远不止这些
好的,标签我们明白了,接下来就是属性了
<h1>数据解析</h1>
<h1 align='right'>数据解析</h1>
我们还可以在标签中添加 ” align='right'
" 这样的东西,这又是什么呢?
首先,这两个标签都是 h1 标签,都是一级标题,但是下面这个会显示在右边,也就是说,通过这种形式对 h1 标签添加了说明,这种语法在 HTML 中被称为标签的属性,并且属性