Python 基础知识

1.# -- coding: utf-8 -这是用来说明你的Python源程序文件用使用的编码。缺省情况下你的程序需要使用ascii码来写,但如果在其中写中文的话,python解释器一般会报错,但如果加上你所用的文件编码,python就会自动处理不再报错。

上述格式还可以写成:

coding=utf-8

coding:utf-8

2.爬虫的基本架构
这里写图片描述
其中
URL管理器用来管理已爬和待爬的URL;
网页下载器接收URL后,进行网页下载;
网页解析器对于下载后的网页进行提取信息。
3.BeautifulSoup的简单使用
创建soup对象->搜索节点find_all(所有结点)、find(一个结点)->访问节点(名称,属性(href),文字)
ps:BeautifulSoup(html_doc,’html.parser’,from_encoding=’utf-8’)

阅读更多
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/Gexrior/article/details/53999055
文章标签: python
个人分类: --3.4Python
想对作者说点什么? 我来说一句

python基础知识汇总

2017年11月02日 86KB 下载

Python基础知识培训

2018年04月22日 1.51MB 下载

没有更多推荐了,返回首页

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭