Python 基础知识

原创 2017年01月03日 22:46:48

1.# -- coding: utf-8 -这是用来说明你的Python源程序文件用使用的编码。缺省情况下你的程序需要使用ascii码来写,但如果在其中写中文的话,python解释器一般会报错,但如果加上你所用的文件编码,python就会自动处理不再报错。

上述格式还可以写成:

coding=utf-8

coding:utf-8

2.爬虫的基本架构
这里写图片描述
其中
URL管理器用来管理已爬和待爬的URL;
网页下载器接收URL后,进行网页下载;
网页解析器对于下载后的网页进行提取信息。
3.BeautifulSoup的简单使用
创建soup对象->搜索节点find_all(所有结点)、find(一个结点)->访问节点(名称,属性(href),文字)
ps:BeautifulSoup(html_doc,’html.parser’,from_encoding=’utf-8’)

版权声明:本文为博主原创文章,未经博主允许不得转载。 举报

相关文章推荐

Python编程中常用的12种基础知识总结

原文出处: 王伟的博客    Python编程中常用的12种基础知识总结:正则表达式替换,遍历目录方法,列表按列排序、去重,字典排序,字典、列表、字符串互转,时间对象操作,命令行参数解析(g...

python基础知识

第一章:基础知识 repr 以合法的python表达式的形式来表示值 str 将值转换成合理形式的字符串 input 认为你输入的为合法的字符串(输入必须带引号) raw_input 把所有的输入当...
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)