![b36734bc5bc64d24951d2c92e3e9c58c.png](https://img-blog.csdnimg.cn/img_convert/b36734bc5bc64d24951d2c92e3e9c58c.png)
![a3e7949ffdf81eaad56d73a7bcf4c591.png](https://img-blog.csdnimg.cn/img_convert/a3e7949ffdf81eaad56d73a7bcf4c591.png)
![35f7601c71d862b4fcf4c76eb7e14de1.png](https://img-blog.csdnimg.cn/img_convert/35f7601c71d862b4fcf4c76eb7e14de1.png)
SAST Weekly 是由电子工程系学生科协推出的科技系列推送,内容涵盖信息领域技术科普、研究前沿热点介绍、科技新闻跟进探索等多个方面,帮助同学们增长姿势,开拓眼界,每周更新,欢迎关注!欢迎愿意分享知识的同学投稿至 eesast@mail.tsinghua.edu.cn , 期待你的作品!
![854240f89672af850c30db1f2c44e699.png](https://img-blog.csdnimg.cn/img_convert/854240f89672af850c30db1f2c44e699.png)
![c8e545061e8b2d42cbb0f9a4d69c2936.png](https://img-blog.csdnimg.cn/img_convert/c8e545061e8b2d42cbb0f9a4d69c2936.png)
初识Python
![97099743dbe9492b43beca9b7aab666a.gif](https://img-blog.csdnimg.cn/img_convert/97099743dbe9492b43beca9b7aab666a.gif)
什么是Python呢?
Python是一种跨平台的计算机程序设计语言。是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越多被用于独立的、大型项目的开发。
调查了一波当代大学生后发现,Python通常被用来处理Word、Excel、自动回复消息、处理实验数据、写网站、爬虫等等,可以说Python具有独当一面的强大功能。可通过Python官网 https://www.python.org/downloads/ 下载安装解释器,在Pycharm或VS Code等开发工具中使用Python语言。
初探Python
![97099743dbe9492b43beca9b7aab666a.gif](https://img-blog.csdnimg.cn/img_convert/97099743dbe9492b43beca9b7aab666a.gif)
首先要注意的一点是,与C/C++不同,Python的变量类型都是动态类型,不需要申明数据类型!!这一点简直方便了太多!
了解这一点以及储备一些C/C++基本知识后,我们一起学习Python的基础语法结构叭!
数据结构
01
字符串
学完(学过一点点)程设的你们一定对字符串熟之又熟了,小编在此不再赘述。但需要注意的是在Python中没有“字符”与“字符串”的区别,而且字符串是不可变的!
02
列表
列表是Python中最基本的数据结构。列表中的每个元素都分配一个数字 - 它的位置,或索引。第一个索引是0,第二个索引是1,依此类推。-1表示倒数第一个,-2表示倒数第二个,依此类推。
![c43b8c4612bba32ed700598d9115e981.png](https://img-blog.csdnimg.cn/img_convert/c43b8c4612bba32ed700598d9115e981.png)
列表的基本操作有索引、切片、增删查改、排序等等。
03
元组
元组和列表十分类似,主要不同点在于:列表使用方括号而元组使用圆括号。列表是可变的,元组不可变。
![58c4d62b4258e74834b0c1fdc1ceb4cc.png](https://img-blog.csdnimg.cn/img_convert/58c4d62b4258e74834b0c1fdc1ceb4cc.png)
04
字典
字典是另一种可变容器模型,且可存储任意类型对象。字典的每个键值 key=>value 对用冒号分割,每个键值对之间用逗号分割,整个字典包括在花括号 {} 中 ,格式如下所示:
![042d1b88146579753df178fe6e197c81.png](https://img-blog.csdnimg.cn/img_convert/042d1b88146579753df178fe6e197c81.png)
需要注意的是字典只能通过Key访问value而不能通过value访问Key或者通过编号访问呦!
控制结构
01
条件分支
与C/C++中的if-else结构类似,不同的是多路条件分支,见下图:
![7c88d6dc35196cb3b0d43a68f77b6bbd.png](https://img-blog.csdnimg.cn/img_convert/7c88d6dc35196cb3b0d43a68f77b6bbd.png)
02
循环
Python中的循环语句包括while和for循环(注意没有do...while循环),其中for循环与C/C++有所不同,如下图:
![5df627bcfbf59095ca59e4f1240c9e23.png](https://img-blog.csdnimg.cn/img_convert/5df627bcfbf59095ca59e4f1240c9e23.png)
03
函数
你可以定义一个由自己想要功能的函数,但要注意以下几点:
1. 函数代码块以 def 关键词开头,后接函数标识符名称和圆括号()。
2. 任何传入参数和自变量必须放在圆括号中间。圆括号之间可以用于定义参数。
3. 函数内容以冒号起始,并且缩进。
4. return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回 None。
5. 自己定义的函数不要与内置函数重名。
![7cd8952d52534584806ad083fb6cc956.png](https://img-blog.csdnimg.cn/img_convert/7cd8952d52534584806ad083fb6cc956.png)
![c1ad0a1152fb1a9a365d52d80247a42c.png](https://img-blog.csdnimg.cn/img_convert/c1ad0a1152fb1a9a365d52d80247a42c.png)
学过这些,就可以照猫画虎使用python啦,相信你一定可以的!
再探Python
掌握必备语法之后,我们就可以实战了。下面是小编对用Python爬虫的一些浅显的认识,欢迎大家多多补充!
01
爬虫介绍
爬虫可以模拟浏览器的行为做你想做的事,订制化自己搜索和下载的内容,并实现自动化的操作。与人工搜索比较起来,爬虫具有省时省力的优势。
02
网络爬虫
tips:网页由三大部分组成,分别是HTML(骨架)、Javascript(肌肉)、CSS(皮肤)。
要学习爬虫,我们需要引入第三方模块requests掌握内建模块re的相关用法,有一篇学习笔记供大家参考:
https://www.cnblogs.com/Jalor/p/12363103.html
也可简要参考下图
requests库
![fd5c29e43b8d1f9f7115b84c93044b54.png](https://img-blog.csdnimg.cn/img_convert/fd5c29e43b8d1f9f7115b84c93044b54.png)
re正则表达式
![4453aac4da926d64b768344906f8cd38.png](https://img-blog.csdnimg.cn/img_convert/4453aac4da926d64b768344906f8cd38.png)
![d4abc7c1ff592ede945e925c281f36b3.png](https://img-blog.csdnimg.cn/img_convert/d4abc7c1ff592ede945e925c281f36b3.png)
下图是一个从网站上爬取文字信息的栗子:
首先打开一个我们比较感兴趣的网页,比如说我们非常喜爱中华传统文化,那么我们可以打开下面这个链接https://so.gushiwen.org/authors/authorvsw_b90660e3e492A1.aspx
我们希望提取出诗句的内容,不希望看到其他图片或者无关信息。于是我们按下“F12”,在弹出的茫茫运行程序中开始寻找我们需要的东西。
![a077c27d8563f70fd11b1d39d28c6314.png](https://img-blog.csdnimg.cn/img_convert/a077c27d8563f70fd11b1d39d28c6314.png)
我们会发现我们需要的东西被包裹在"
![7f0124ec91dd3306ec9b1d6be6fe250a.png](https://img-blog.csdnimg.cn/img_convert/7f0124ec91dd3306ec9b1d6be6fe250a.png)
然后我们就把想要的文字提取出来啦!
![59f4f12fed3109c831636e64196df221.png](https://img-blog.csdnimg.cn/img_convert/59f4f12fed3109c831636e64196df221.png)
开不开心!!
![c51714b29dce469376a1914899dde48c.gif](https://img-blog.csdnimg.cn/img_convert/c51714b29dce469376a1914899dde48c.gif)
希望大家都有所收获!
![838a88d092d320a3243a05826f725c8b.png](https://img-blog.csdnimg.cn/img_convert/838a88d092d320a3243a05826f725c8b.png)
![e8a3e9bdeaef92aa30b2268eeb088aeb.png](https://img-blog.csdnimg.cn/img_convert/e8a3e9bdeaef92aa30b2268eeb088aeb.png)
撰稿:魏舒琪
审核:林真如
![0b69c2924851a03a153ea71b5b296787.png](https://img-blog.csdnimg.cn/img_convert/0b69c2924851a03a153ea71b5b296787.png)