python
So4ms
学网安的菜狗,
个人主页so4ms.top
展开
-
Python学习 numpy中矩阵的用法
0X00、mat()函数和array()函数的区别Numpy函数库中存在两种不同的数据类型(矩阵matrix和数组array),都可以用于处理行列表示的数字元素,虽然他们看起来很相似,但是在这两个数据类型上执行相同的数学运算可能得到不同的结果,其中Numpy函数库中的matrix与MATLAB中matrices等价。(1)mat()函数与array()函数生成矩阵所需的数据格式有区别mat()函数中数据可以为字符串以分号(;)分割,或者为列表形式以逗号(,)分割。而array()函数中数据只能为后者形原创 2020-08-11 20:16:21 · 1154 阅读 · 0 评论 -
Python实现邮件及附件发送
0X00感觉在项目中有蛮多地方可以用到邮件自动发送,于是去学了一下python怎样自动发送邮件。0X01 准备想要发送邮件的话得开通自己邮箱的 SMTP 功能,以QQ邮箱为例,进入上方的设置。选择账户打开SMTP服务,然后会得到一个QQ邮箱授权码,在代码中会用到。用到的库有smtplib、email。smtplib用于发送邮件,email用于构建邮件内容。import smtplibfrom email.mime.multipart import MIMEMultipartfrom e原创 2020-07-31 16:18:58 · 1568 阅读 · 0 评论 -
成都双流区链家网租房python数据可视化
0X00数据来源:python爬虫获取链家二手房源信息 上一次我使用python爬取了链家上成都市双流区的一些租房信息,今天我们就来对爬取到的数据进行一些简单的数据可视化处理,学习学习python一些简单的数据处理。0X01 数据展示这些就是我们之前爬取到的数据,我们这次就会对他的规格、面积、单价等信息进行简单的可视化处理。0X02 租房信息规格(饼状图)这里使用的是openpyxl库对excel表进行操作,matplotlib库对数据进行可视化。import openpyxlimport原创 2020-07-30 11:33:17 · 1667 阅读 · 3 评论 -
python爬虫获取链家二手房源信息
0X00 前言本来之前是准备爬取boss直聘的招聘信息,结果boss的反爬还挺恶心,访问页面还得带上cookie,页面的cookie有效时间也只有一分钟,不然只能访问到等待页面,菜鸡落泪0X01 准备工作使用到的标准库lxml、requests、re、requests.exceptions、os和openpyxl、random、time。0X02 分析相比较boss来说,链家的网站对于爬虫友好得多,当然访问的时候还是得带上headers,不然也是会被识别出来是爬虫,从而被拒绝访问。分析一下链原创 2020-07-29 11:31:34 · 1258 阅读 · 0 评论 -
python爬虫获取四川大学2018-2019各省市各专业录取分数线
通过python爬虫在四川大学官网获取四川大学2018-2019各省市各专业录取分数线。由于官网信息中,2015-2017的数据是存放在一个页面,而2018、2019的数据都是单独的页面,相对规律一些,所以我们今天就来获取2018-2019的信息。0X00、准备工作安装标准库lxml、requests、re、requests.exceptions、os和openpyxl。0X01、页面分析首先进去是这样的页面:标题2018年各省(市、区)分专业录取情况统计表(理工)是这样的:而各个省市的原创 2020-07-05 20:28:14 · 1234 阅读 · 0 评论 -
python爬虫小项目练习:爬取笔趣阁首页分类小说数据
为了学习python爬虫,又来到了奇书阁首页,准备爬取首页分类小说的数据,如图:0X00、准备工作安装标准库lxml、requests、re和requests.exceptions、os、openpyxl0X01、页面分析一共有六个小说类别,分别包裹在六个div标签中,上三个类别父标签相同,下三个类别父标签相同。小说类别包裹在h2标签中,下面的每本小说又在li标签中(偷懒忽略了最上面的小说)。0X02、代码实现首先第一个爬取页面的函数get_page,传入参数url,请求该页面,如果返原创 2020-07-04 21:22:32 · 1725 阅读 · 0 评论 -
记第一个python爬虫项目:笔趣阁小说爬取
最近考完试了,开始学习python爬虫,由于一些盗版小说网站几乎没有反爬机制,且网页结构简单,所以选择了小说网站笔趣阁来进行python爬虫的学习。0X00、准备工作安装标准库lxml、requests、re和requests.exceptions0X01、页面分析我们以小说《九星霸体诀》为例,首先查看页面源码,整个页面只有一个<h1>标签,包裹了本章小说的标题,而正文内容全部在一个<div>标签中,每段的间隔则是一个<br>标签,简单的页面结构使得我们的爬取工原创 2020-07-03 14:56:56 · 1181 阅读 · 1 评论