笔记
文章平均质量分 65
数据艺术家.
Python爬虫,数据分析
展开
-
云服务器搭建XSS-platform、DVWA靶机和Permeate论坛
我发现目前网上的xss-platform的搭建教程都是基于本地搭建的,这样搭建好的xss平台只能在本地使用,无法测试别的网站。而网络上的大部分xss平台又几乎都是收费的,所以写这篇博客记录一下在服务器上搭建xss-platform的过程,并且顺带搭建了DVWA靶机和一个网络安全论坛。这次部署一共有三个系统,分别是xss-platform,dvwa靶机系统和permeate论坛。原创 2024-04-24 21:39:31 · 575 阅读 · 0 评论 -
Python一键修改目录下所有文件的编码格式
【代码】Python一键修改目录下所有文件的编码格式。原创 2024-04-16 15:24:00 · 253 阅读 · 0 评论 -
递归爬漫画
文章目录前言需求找资源找到符合爬虫要求的漫画网前言好吧,我摊牌,写本篇文章的目的是为了蹭1024的徽章。虽然这样说,但读者依旧可以从中学到一些知识,比如,递归在爬虫中的应用,递归是编程中非常重要的内容,很多算法都离不开递归,本篇文章将为你讲解以递归代替循环来实现爬取漫画的所有章节,文章结尾附上全部代码。需求偶然想起初中爱看的一本漫画,名字叫做《偷星九月天》,当初真的是对这本漫画爱不释手,每天都期盼着更新。多年后的今天,想用代码爬下来所有章节重刷第n遍。功能要求:能够将一本漫画的所有章节下载下原创 2020-10-24 22:06:53 · 314 阅读 · 2 评论 -
爬虫获取课后小测验并写入Word文档(完整思路)
文章目录前言爬取流程敲代码前的试探通过试探,总结一下编程思路。思路有了,上代码!后记前言开门见山,直接切入正题,先看最终效果最终效果很理想,但这个过程是非常残酷的。爬取流程敲代码前的试探先实验能否直接得到题目。import requestscourseId = 208420018mHeaders = { 'User-Agent': r'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like G原创 2020-05-25 21:06:12 · 8777 阅读 · 84 评论 -
记一次用Android studio开发一个小型对话机器人app
前言偶然在网上看到一个免费机器人接口,所以生此想法,接口地址:http://api.qingyunke.com/,Android开发比爬虫要繁琐得多,所以本文我将细说接口的调用方法,读者可根据思路去网上找一些免费接口拿来玩,其他代码一带而过,详细源码见文末。成品展示:开发步骤(1)新建项目empty,必要可github托管。(2)先写页面在res->layout目录下新建两...原创 2020-04-09 11:58:05 · 3396 阅读 · 21 评论 -
记一次用Python爬取代理IP并使用(尝试用代理IP制造直播房间访问量)
前言首先说一下代理IP的用法途(代码中会有涉及):代理IP可以用来隐藏你的真实IP,你访问网站是通过代理服务器来做一个中转,所以目标服务器只能看到代理服务器的IP地址,这样就可以让你的IP地址实现隐身的功能准备工作我这边是找到了一个平台:https://www.kuaidaili.com/,先在地址后面加robots.txt查看平台的robots协议(https://www.kuaid...原创 2020-03-31 13:11:08 · 1401 阅读 · 18 评论 -
记一次用Python统计全国女性Size
前言最近闲来无事,又正好在学习Python数据分析统计,于是便萌生一种想法:统计京东购买记录,分析全国女性平均Size准备工作首先查询京东网站,输入查询内容xz,查到87万+商品购买size可以在评论区找到(就摆在那儿,那也太简单了,后面才知道我想多了。。。)先看域名,发现每一个域名的构成都是https://item.jd.com/然后加一串数字.html,经验告诉我,这串数字一...原创 2020-03-27 10:00:18 · 25743 阅读 · 214 评论