一眼望穿,看破网页
你每天浏览的网站是什么? 它使用了哪种编程语言? 是什么字体? 小编就不信你没有好奇过,告诉你个小技巧。谷歌(Chrome)按F12打开开发者工具(或者在空白处单击右键,点击查看),就可以看到程序员的神奇世界!
想要学习爬虫等等,首先就要了解网页的基础结构,接下来就跟着小编我一起学习吧!
这要从HTML的结构说起。HTML全称超文本标记语言,所谓标记,就是说是它通过很多标签来描述一个网页。你看到很多像以开始,以结束的标志,就是标签。这些标签一般成对出现,标签里面还可以套标签,表示一种层级关系。最外面的html标签是最大的,head、body次之,一层一层下来,最后才是一段文字,一个链接。你可以把它类比成一个人,这个人叫html,有head,有body,body上有hand,hand上面有finger。
我们再来看看html结构:
<!DOCTYPE html>