- 用
if _ _name_ _ == "_ _main_ _" :
来作为整个程序的入口
也可以用这个来测试程序 - 模块 module:用来从逻辑上组织代码,本质上是.py文件,python用import来导入模块
- 安装库:File —setting—Project—project interface—打开的界面右边点击+号,,搜索需要的库,最后点击 install package,就可以增加库。或点击某个库,在点击 - 号就会删除那个库
- 爬虫的本质是什么?
简单来讲就是模仿浏览器来打开网页,那我们应该如何模仿浏览器呢?
HTML是一种标记语言,用标签标记内容并加以解析和区分。浏览器的功能是将获取到的HTML代码进行解析,然后将原始的代码转变成我们直接看到的网站页面。
爬虫基础
最新推荐文章于 2024-07-17 23:50:36 发布