Python__总结

学了几个星期的python,也有了一些体会,更多的是它与C之间的关系。
与C不同,python的变量使用之前无需声明。代码块的分隔也仅是靠缩进格式,而不是用花括号。语句结尾可以不使用分号,而是用物理行来作为逻辑行,即一行一语句。
python中大量使用冒号:来表明代码块,如if,while,for和自定义函数后都要加冒号和缩进来划分代码块。其中,while都允许使用else语句当循环条件不满足时运行。另外for与其他语言有本质不同:以自变量依次取一个给定集合内的值带入循环体执行,而非判定条件。
自定义函数大致相同,但是由于变量无需声明,在提高自由度的同时也令可读性大幅降低。默认情况下,函数内的变量作用域仅在该函数内。即函数内外的同名变量是不同的。当需要一致时要使用global x来声明全局变量。就这点而言,比C更严格许多。
在给形参赋默认值时,被赋值的变量需要放在未赋变量之后定义。例如 def max(a=5,b)这种是不可以的。
在使用模块(相当于C中的头文件)的函数,键时,需利用点运算符以区分本模块内使用的标识符。如(sys.argv)或者在声明调用的时候写出需要的标识符名。
dir函数可以列出模块内的所有标识符,import用来声明调用模块,del用来删除。
序列:类似数组的概念,在索引操作符(a[0])的基础上拥有切片操作符(a[1:3])
列表:有序项目的集合,可增删改
元组:不可变的列表

除此之外,Python最重要的应该就是它的爬虫功能了。

爬虫:就是模拟浏览器发送网络请求,接受请求响应,一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。

原则上只要是浏览器(客户端)能做的事情爬虫都可以做。
在此之前我们需要知道python有一个requests模块可以模拟浏览器发送请求获取响应,重重之中
在PyCharm终端输入pip install requests,看一下是否安装这个模块,没有的话它会自动下载安装
爬取网站的步骤
一.分析
请求url
请求方式
请求头
请求参数
在这里插入图片描述请求头在这里插入图片描述
请求参数:即搜索的内容
二.模拟浏览器发送请求获取响应

#导入模块
import requests  

#2.发送请求获取响应
response = requests.get(
  #设置请求地址   url="www.baidu.com",
  #设置请求头     headers = {"User-Agent:Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36"
}
)
#处理响应
with open("01-百度页面获取.html",'w',encodeing='utf-8') as f:
       f.write(response.text)

这是一个基本的框架,其中还有很多的内容,对于一个初学者来说并不简单,尤其是在实际操作过程中会遇到各种各样的问题,现在了解到的只是表面功夫。怎么说呢,还是得多练习。

–加油吧-*-

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值