自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (1)
  • 收藏
  • 关注

原创 利用python将喜欢的csdn文章保存成pdf

前言:收藏了多年的csdn免费文章,忽然收费或者突然被作者删除了怎么办?文章目录前言:1. 工具1.1需要使用到的模块:1.2 需要安装的工具2. 获得文章内容的html(去除相无关内容)3. 将获得的html转成pdf1. 工具1.1需要使用到的模块:pdfkit,requests,parsel,os,time1.2 需要安装的工具链接:https://pan.baidu.com/s/1e_0_4tpyxIU8lHqJF56BhA提取码:2141直接傻瓜式的默认安装即可2. 获得文

2020-08-15 23:50:29 3107 19

原创 JavaScript基础篇

JavaScript基础篇1.JS引入方式①嵌入式//单行注释/*多行注释* /<script type="text/javascript"> alert("我是嵌入在页面内的JS") </script>②外链式<script type="text/javascript" src="js/1.js"</script>1.js如下:alert("我是外部JS")③行内式<a href="javascript:alert(

2022-04-05 11:00:00 1931

原创 JavaWeb入门学习

JavaWeb入门学习此次总结 思路来源于黑马程序的JavaWeb1.数据库1.1 JDBC入门使用基本流程驱动jar下载链接:https://downloads.mysql.com/archives/c-j/实验操作代码部分package com.itheima.jdbc;/*/ JDBC 入门学习 */import java.sql.Connection;import java.sql.DriverManager;import java.sql.Statement

2022-03-14 18:56:26 959

原创 Windows使用python虚拟环境

Windows使用python虚拟环境文章目录Windows使用python虚拟环境1. 安装依赖包(创建虚拟环境的包)2. 创建虚拟环境3. 使用虚拟环境4. 导出在虚拟环境中安装的包(requirements.txt)5. 退出虚拟环境1. 安装依赖包(创建虚拟环境的包)pip install virtualenv -i "https://pypi.tuna.tsinghua.edu.cn/simple"2. 创建虚拟环境如: 创建一个mrfan包名的虚拟环境virtual

2022-03-12 21:19:04 2021

原创 数据解析——xpath解析

前言:xpath解析在爬虫中是较为常用的一个数据解析方式,以及在scrapy框架学习中也会再次用到,所以多少还是要会的文章目录1.xpath解析原理1.1. 实例化一个etree的对象,且需要将被解析的页面源码数据加载到该对象中1.2 2. 调用etree对象中的xpath方法结合着xpath表达式实现标签的定位和内容的捕获2. 环境安装3. 进行实例化4. xpath 表达式4.1 '/' 用法4.2 属性定位4.3 索引定位4.4 定位后的取操作4.4.1 取文本4.4.2 取属性1.xpath解析

2020-08-18 00:51:26 1174

原创 数据解析——bs4解析

文章目录1. 环境安装1.1 打开系统打开cmd指令输入 pip install bs41.2 出现 Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None) 的解决方案2. 相关方法2.1 比如筛选一个标签如:\ 下的相关方法3. 进行实战(获取一个代理ip网的相关信息)3.1 分析目标在哪个标签3.2 分析可知其在div标签3.3 最后进行目标内容的提取小结:1. 环境安装1.1 打开系统打开cmd

2020-08-15 18:50:45 892

原创 数据解析——正则表达式

前言会获取html数据,但不会简单得到怎么办?这就可以简单教你了!文章目录前言1. 简单了解什么是正则2. 简单了解相关知识2.1. 了解re模块方法2.2. 了解部分正则式2.3. 简单提取相关数据2.3.1 使用关键词搜索2.3.2. 使用正则 ‘.’ 搜索2.3.3 使用非贪婪模式提取相关信息小结:1. 简单了解什么是正则用于文本匹配的使用特定语法书写的式子。类似于Windows中,.txt 用于搜索所有的文本文件(注:在正则式中不再是通配符)2. 简单了解相关知识2.1. 了解re模块

2020-08-15 18:04:05 790

原创 简单爬取小姐姐的照片

使用环境win10系统,python先简单开始访问,获取html从而提取所需数据import requestsurl = 'https://www.douyu.com/g_yz'response = requests.get(url=url)html = response.textprint(html)将输出结果往下拉,指导看到jpg相关的如下图所示接着就利用简单的正则表达式进行提取import retitle_url = re.findall(r'"rn":"(.*?)","rpo

2020-08-14 17:21:01 1519

原创 简单将喜欢的博客做成pdf

使用工具开发工具IDEA需要安装模块pdfkit,request,parsel,以及wkhtmltox-0.12.5-1.msvc2015-win64工具进行分析某博客的源代码分析获得里面所需的内容的html紧接着利用parsel模块进行筛选从而获得需要获得目标的相关内容标准的html格式接着将获得body体与标准的html结构进行拼接便会在该目录下得到一个html...

2020-08-14 00:59:24 346

vue.js,mysql-connect.jar,element-ui

vue.js,mysql-connect.jar,element-ui下载

2022-03-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除