Python__总结

最新推荐文章于 2024-05-29 20:24:55 发布

奈方时歇

最新推荐文章于 2024-05-29 20:24:55 发布

阅读量136

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/qq_43613144/article/details/89387467

版权

Python 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

学了几个星期的python，也有了一些体会，更多的是它与C之间的关系。
与C不同，python的变量使用之前无需声明。代码块的分隔也仅是靠缩进格式，而不是用花括号。语句结尾可以不使用分号，而是用物理行来作为逻辑行，即一行一语句。
python中大量使用冒号:来表明代码块，如if，while，for和自定义函数后都要加冒号和缩进来划分代码块。其中，while都允许使用else语句当循环条件不满足时运行。另外for与其他语言有本质不同:以自变量依次取一个给定集合内的值带入循环体执行，而非判定条件。
自定义函数大致相同，但是由于变量无需声明，在提高自由度的同时也令可读性大幅降低。默认情况下，函数内的变量作用域仅在该函数内。即函数内外的同名变量是不同的。当需要一致时要使用global x来声明全局变量。就这点而言，比C更严格许多。
在给形参赋默认值时，被赋值的变量需要放在未赋变量之后定义。例如 def max(a=5,b)这种是不可以的。
在使用模块(相当于C中的头文件)的函数，键时，需利用点运算符以区分本模块内使用的标识符。如(sys.argv)或者在声明调用的时候写出需要的标识符名。
dir函数可以列出模块内的所有标识符，import用来声明调用模块，del用来删除。
序列:类似数组的概念，在索引操作符(a[0])的基础上拥有切片操作符(a[1:3])
列表:有序项目的集合，可增删改
元组:不可变的列表

除此之外，Python最重要的应该就是它的爬虫功能了。

爬虫：就是模拟浏览器发送网络请求，接受请求响应，一种按照一定的规则，自动地抓取万维网信息的程序或者脚本。

原则上只要是浏览器(客户端)能做的事情爬虫都可以做。
在此之前我们需要知道python有一个requests模块可以模拟浏览器发送请求获取响应，重重之中
在PyCharm终端输入pip install requests，看一下是否安装这个模块，没有的话它会自动下载安装
爬取网站的步骤
一.分析
请求url
请求方式
请求头
请求参数
在这里插入图片描述请求头
请求参数：即搜索的内容
二.模拟浏览器发送请求获取响应

#导入模块
import requests  

#2.发送请求获取响应
response = requests.get(
  #设置请求地址   url="www.baidu.com",
  #设置请求头     headers = {"User-Agent:Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36"
}
)
#处理响应
with open("01-百度页面获取.html",'w',encodeing='utf-8') as f:
       f.write(response.text)

这是一个基本的框架，其中还有很多的内容，对于一个初学者来说并不简单，尤其是在实际操作过程中会遇到各种各样的问题，现在了解到的只是表面功夫。怎么说呢，还是得多练习。

–加油吧-*-

奈方时歇

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python__总结

学了几个星期的python，也有了一些体会，更多的是它与C之间的关系。与C不同，python的变量使用之前无需声明。代码块的分隔也仅是靠缩进格式，而不是用花括号。语句结尾可以不使用分号，而是用物理行来作为逻辑行，即一行一语句。python中大量使用冒号:来表明代码块，如if，while，for和自定义函数后都要加冒号和缩进来划分代码块。其中，while都允许使用else语句当循环条件不满足时运...
复制链接

扫一扫

专栏目录