自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 数据结构知识点总结-------绪论部分

数据结构知识点总结-------绪论部分数据数据:数据元素 、数据对象、数据类型 、抽象数据类型(ADT)。’PS: 数据项:最小单位;数据元素:基本单位;ADT三元素:数据关系、数据对象、基本操作集。数据结构的定义:各元素之间的联系。数据结构三要素:逻辑结构、存储结构、运算。逻辑结构:怎么用,与计算机无关。逻辑结构可分为 线性结构和非线性结构。线性结构:数据元素之间一对一的关系。如:线性表、栈、队列、串、数组、广义表。非线性结构:数据元素之间一对多、多对多的关系。如:集合、树、图

2021-03-16 16:51:49 176

原创 基于电影《少年的你》豆瓣影评数据的爬取与分析

目标网站:豆瓣电影目标网址:https://movie.douban.com/subject/30166972/comments?status=P目标数据:(1)评价 (2)日期 (3)评论 (4)评论点赞任务要求:(1)使用urllib或requests库实现该网站网页源代码的获取,并将源代码进行保存;(2)自主选择re、bs4、lxml中的一种解析方法对保存的的源代码读取并进行解析,成功找到目标数据所在的特定标签,进行网页结构的解析;(3)定义函数,将获取的目标数据保存到csv文件中。(

2020-05-26 13:02:58 3722 2

原创 python验证码识别如何连接第三方平台-------cjy

由于OCR库识别成功率较低,这里我们借助超级鹰打码平台。超级鹰平台地址:http://www.chaojiying.com/1.注册账号:关注微信号送1000题分。2.python语言Demo下载import requestsfrom hashlib import md5class Chaojiying_Client(object): def __init__(self, username, password, soft_id): self.username = u

2020-05-11 11:16:25 742

原创 python爬虫之古诗文网中验证码的识别并登录----第三方平台

目标网站:古诗文网目标网址:http://so.gushiwen.org/user/collect.aspx任务要求:(1)通过selenium的方式模拟该网站的登录,并成功输入用户名和密码;(2)保存验证码图片,并使用输入式验证码识别的方式识别验证码的文字,获取后输入到输入框中,(3)验证登录是否成功。由于OCR库识别成功率较低,这里我门借助超级鹰打码平台(自选平台也可)。超级鹰平台地址:http://www.chaojiying.com/ps:注册账号,关注微信号送1000题分连接超

2020-05-11 11:00:40 1436

原创 python模拟登录京东网页

目标网站:京东网首页登录目标网址:https://www.jd.com/任务要求:(1)导入selenium库,并使用该库驱动Chrom浏览器,完成请求;(2)驱动浏览器对象,找到登录按钮,点击;(3)在新页面中选择账号登录。(4)找到用户名和密码输入框,输入相应用户名和密码,点击登录。具体操作可参考我的另一篇博客手把手教你----模拟登录百度首页代码如下:from sele...

2020-04-29 12:05:33 1521

原创 手把手教你----模拟登录百度首页

零基础教你模拟登录百度首页,超简单

2020-04-29 11:52:28 1532

原创 python爬取前程无忧网并保存数据库

目标网站:前程无忧招聘网目标网址:https://search.51job.com/list/120000,000000,0000,00,9,99,Python,2,1.html目标数据:(1)职位名(2)公司名(3)工作地点(4)薪资 (5)发布时间下面展示代码运行此代码的前提是您的数据库中创建一个spiders库。那段代码被我不小心删掉了,嘻嘻。 有需要的话请留言,有时间会补上...

2020-04-20 09:34:27 995 1

原创 python爬取电影票房网并保存csv

目标网站:电影票房网目标网址:http://58921.com/daily/wangpiao目标数据:(1)名次(2)电影名称 (3)日期(4)票房 (5)总场次(6)废场(7)人次(8)上座率(9)票价任务要求(1)使用urllib或requests库实现该网站网页源代码的获取,并将源代码进行保存;(2)自主选择re、bs4、lxml中的一种解析方法对保存的的源代码读取并进行解析,成功...

2020-04-13 15:13:13 2187 2

原创 python使用正则表达式re 爬取前程无忧招聘网数据 并保存为txt或csv中

目标网站:前程无忧招聘网目标网址:https://search.51job.com/list/120000,000000,0000,00,9,99,Python,2,1.html目标数据:(1)职位名(2)公司名(3)工作地点(4)薪资 (5)发布时间任务要求(1)使用urllib或requests库实现该网站网页源代码的获取,并将源代码进行保存;(2)自主选择re、bs4、lxml中...

2020-04-13 15:05:08 2304

原创 python抓取TIOBE指数前20名排行开发语言--lxml

目标网址:https://www.tiobe.com/tiobe-index/TIOBE排行榜是根据互联网上有经验的程序员、课程和第三方厂商的数量,并使用搜索引擎(如Google、Bing、Yahoo!)以及Wikipedia、Amazon、YouTube统计出排名数据,只是反映某个编程语言的热门程度,并不能说明一门编程语言好不好,或者一门语言所编写的代码数量多少。该指数可以用来检阅开发者的编...

2020-04-04 22:48:15 1133

原创 python爬取搜狐最新时政新闻数据

新闻推送—搜狐最新时政新闻数据爬取目标网址:https://www.sohu.com/c/8/1460?spm=smpc.null.side-nav.14.1584869506422WxyU9iK目标数据描述:(1)标题 (2)链接地址from urllib import requestfrom bs4 import BeautifulSoup #模拟浏览器访问url="http...

2020-04-01 20:27:56 1964

原创 python爬取豆瓣电影排行榜数据

电影推荐—豆瓣电影排行榜数据抓取目标网址:https://movie.douban.com/top250?start=目标数据描述:(1)排名(2)电影名字 (3)链接 (4)导演人员 (5)评价 (6)评分 (7)评价人数 (8)评价内容import requestsfrom bs4 import BeautifulSoupimport jsonheaders={'User-...

2020-04-01 20:01:22 4902

原创 python爬取猫眼电影数据--正则表达式

猫眼电影榜单网址:https://maoyan.com/board/4目标数据描述:(1)排名 (2)电影名称 (3)主演 (4)上映时间 (5)评分铛铛 代码来了下面展示一些 内联代码片。// A code blockvar foo = 'bar';import requestsimport re#获取URL信息,输出URL内容def getHTMLText(url):...

2020-04-01 19:03:43 1183

原创 python爬取豆瓣读书数据 正则表达式

豆瓣读书数据抓取:目标网址:https://book.douban.com/目标数据:(1)书名(2)书的链接地址(3)作者(4)发行时间(5)出版社直接上代码啦下面展示一些 内联代码片。import requestsimport re#伪装浏览器头headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:...

2020-04-01 17:38:44 767

原创 python爬虫实例---中国大学排名定向爬虫

目标网址:添加链接描述爬取的过程可以分为三个步骤:步骤1:从网络上获取排名网页内容步骤2:提取网页内容中信息步骤3:展示并输出结果直接上代码啦import requestsfrom bs4 import BeautifulSoupimport bs4#获取URL信息,输出URL内容 def getHTMLText(url): try: #获取网页的...

2020-03-25 20:58:23 281

原创 攻防世界

攻防世界新手题 misc 前5道不得不说,这道题真的是入门级别了。答案就在题目中,复制粘贴就好flag{th1s_!s_a_d4m0_4la9}下载完题目是一张动态图隐约可以看到有个缺少定位符的二维码隐约可以看到有个缺少定位符的二维码利用PS把二维码补全(随意扣一张二维码的定位符就好了)工具扫描得到flag{e7d478cf6b915f50ab1277f78502a2c5}下载...

2019-12-05 22:43:27 987 1

原创 ctf

ctf啾咪 打开是一可爱的小猫咪图片后缀为png,推测与LSB相关,用Stegsolve打开,按左右键调三原色。![一般情况下,将三原色都调成0,BGR排序往上拉,可以看到一段码]将得到的码,在base64下解码...

2019-11-02 22:12:07 756

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除