自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 收藏
  • 关注

原创 scrapy爬取图片

Scrapy 是一个开源的 Python 爬虫框架,专为爬取网页数据和进行 Web 抓取而设计。它的主要特点包括:高效的抓取性能:Scrapy 采用了异步机制,能够高效地进行大规模的网页抓取。灵活的数据处理:它支持将抓取的数据导出为多种格式,如 JSON、CSV 和 XML。强大的选择器:Scrapy 提供了基于 XPath 和 CSS 选择器的功能,方便用户从网页中提取数据。爬虫管理:Scrapy 允许用户定义爬虫的行为(如请求的间隔、错误处理、代理设置等),并支持管理多个爬虫项目。

2025-01-10 23:28:55 1536 1

原创 学生信息管理系统(Python版),2024最新版,流程齐全,快来围观

学生信息管理系统为Python基础阶段知识的整合,在这一过程中可以增进对Python数据类型的理解,也可以对包、模块、函数等的相关知识进行巩固,对基础知识进行复盘,加深对Python语法的理解。

2024-02-01 15:43:18 3796 11

原创 豆瓣评论爬取

用Python来爬取豆瓣评论

2023-12-27 09:02:51 4928 1

原创 docker使用neo4j

本文介绍了如何快速部署Neo4j图数据库的Docker容器。主要内容包括:1)通过docker search查找官方Neo4j镜像;2)拉取最新版镜像;3)运行容器时设置端口映射(7474用于Web管理界面,7687用于应用程序连接)和数据卷挂载;4)配置管理员密码;5)验证容器运行状态后,通过浏览器访问7474端口成功连接Neo4j。整个过程简洁明了,适合快速搭建Neo4j开发环境。

2026-05-02 18:31:01 184

原创 Chroma简单上手

本文介绍了使用Chroma进行文档向量化的完整流程

2026-03-30 18:44:10 258

原创 DataFrame存入mysql以及读取操作

本文介绍了使用Python将DataFrame数据导入MySQL数据库的方法。首先在MySQL创建测试数据库,然后通过pandas创建示例DataFrame。使用SQLAlchemy创建数据库引擎连接,配置to_sql()方法将数据写入MySQL表,设置参数控制索引和批量插入。最后演示了从数据库读取数据回DataFrame的过程,并验证数据类型。整个过程主要需要注意SQLAlchemy引擎的配置写法,实现了DataFrame与MySQL数据库之间的双向数据转换。

2026-03-19 17:06:53 70

原创 速通python加密之RSA加密

RSA加密是一种非对称加密算法(与AES等对称加密不同),由罗纳德·李维斯特(Ron Rivest)、阿迪·萨莫尔(Adi Shamir)和伦纳德·阿德曼(Leonard Adleman)于1977年提出,名字取自三人姓氏首字母。它通过一对密钥(公钥和私钥) 实现加密和解密,是目前应用最广泛的非对称加密技术之一。

2025-07-26 19:15:43 804

原创 速通python加密之AES加密

AES加密(Advanced Encryption Standard,高级加密标准)是目前全球公认的最安全、应用最广泛的对称加密算法之一,于2001年被美国国家标准与技术研究院(NIST)确定为替代DES的标准加密算法,目前在金融、通信、军事等安全敏感领域被广泛采用。

2025-07-26 18:53:42 665

原创 速通python加密之base64

Base64编码摘要 Base64是一种将二进制数据转换为文本格式的编码方式,使用64个可打印字符(A-Z、a-z、0-9、+和/)表示数据。其核心特点包括: 编码原理:每6位二进制对应一个Base64字符 可逆性:可完整还原原始数据,非加密算法 数据膨胀:编码后体积增加约33% 主要应用于: 网络传输(URL、邮件附件等) 数据存储(嵌入HTML/JSON等) 二进制数据转换 Python示例展示了字符串与Base64的相互转换过程,包括编码、解码及字节处理。

2025-07-26 18:41:41 478

原创 速通python加密之SHA加密

SHA加密是安全散列算法系列,由美国NSA设计,用于数据校验、密码存储等场景。常见版本包括SHA-1(已淘汰)、SHA-2(主流)和SHA-3(备选方案),具有固定输出、单向性和抗修改性。SHA-256因安全高效应用最广,用于密码存储、区块链和文件校验等。示例展示了Python中SHA-1的使用方法。整个算法家族通过不可逆转换确保数据安全,是当前主流的加密技术基础。

2025-07-26 18:30:50 668

原创 速通python加密之MD5加密

MD5摘要算法概述 MD5(消息摘要算法第5版)是一种128位的密码散列函数,可将任意数据转换为固定32位十六进制字符串(如d41d8...)。核心特性包括:固定输出长度、不可逆性、抗修改性(微小输入变化会导致输出巨变)。曾广泛用于密码存储、文件校验,但因存在哈希碰撞漏洞,已不再推荐安全场景使用,逐步被SHA-256替代。示例代码展示了Python中通过hashlib实现MD5加密(含加盐操作),最终生成不可逆的摘要值。

2025-07-26 18:26:32 512

原创 scrapy爬取双色球数据

scrapy与selenium爬取双色球数据

2025-03-04 13:57:57 568

原创 如何提升scrapy的效率

提升scrapy的爬取效率和速度

2025-01-10 23:30:52 470

原创 python多线程爬取药品信息

爬虫爬取药品信息,开启多线程爬取,速度快,效率高

2024-12-22 22:51:35 1564

原创 简单入门sqlite

【代码】简单入门sqlie。

2024-10-24 23:23:43 430

原创 在pycharm中使用sqlite

SQLite 是一个开源的、轻量级的、关系型数据库管理系统(RDBMS),它设计用于嵌入到应用程序中,并且可以在无需外部服务器进程的情况下运行。SQLite 提供了完整的 SQL 语言支持,允许用户进行标准的数据库操作,如创建表、插入数据、查询数据等。

2024-10-24 23:13:47 2785

原创 Selenium登录网易邮箱

【代码】Selenium登录网易邮箱。

2024-10-16 21:56:15 348

原创 selenium登录B站,实现验证码识别登录

利用selenium和超级鹰实现b站验证码识别并登录

2024-10-16 21:52:38 1069

原创 python爬虫,m3u8,获取自己相看的影视作品

python爬取m3u8文件,得到ts文件,进而拼接,得到自己想看的影视作品

2024-09-07 09:32:31 1217

原创 学生信息管理系统python最终版(可连接数据库)

学生信息管理系统为Python基础阶段知识的整合,在这一过程中可以增进对Python数据类型的理解,也可以对包、模块、函数等的相关知识进行巩固,对基础知识进行复盘,加深对Python语法的理解。之前写的一篇学生信息管理系统有一些地方并不完善,而且部分留言的小伙伴希望有将数据保存到数据库的功能,所以这次在原来的基础上加入了新的功能–将数据保存到数据库!!

2024-09-07 09:25:06 1354

原创 bs4的一些相关知识

bs4的一些相关知识

2024-08-24 17:05:55 325

原创 豆瓣书评爬取_xpath

豆瓣读书评论爬取,利用xpath

2024-08-24 17:01:15 1244

原创 python中的锁

python中锁的简单使用

2024-07-26 21:43:32 505

原创 bs4案例,爬取诗词名句网

bs4案例,爬取诗词名句网。

2024-07-09 10:58:50 492

原创 易车网车评数据获取(2024最新版!!!)

2024最新版易车网车评数据爬虫程序,利用pyquery进行爬取

2024-07-09 10:47:08 1268 6

原创 豆瓣电影排行榜爬虫

利用正则表达式匹配字符串来对豆瓣电影排行榜的数据信息进行爬取

2024-04-29 16:10:41 238

原创 python中常用的内置模块

搜罗了一些python中常用的内置模块

2024-02-01 15:47:21 221 1

原创 文件对象的常用方法(Python)

Python中文件对象的常用方法

2024-01-24 21:14:26 561 1

原创 常用的文件打开模式

常用的文件打开模式

2024-01-24 21:10:28 639 1

原创 豆瓣评论爬取

豆瓣评论爬取的一些细节分析以及爬虫程序设计(附带打包好了的软件)

2023-12-30 10:44:07 629 3

原创 链家二手房信息爬取(打包好了,直接运行)

链家网房源获取软件,它来了它来了

2023-12-28 09:34:59 558 1

原创 58同城租房房源信息获取

五八同城房源信息获取(学习参考不二之选)

2023-12-27 11:29:12 4886 3

豆瓣读书书评爬虫软件,使用方便快捷

豆瓣读书书评爬虫软件将辅助你爬取你感兴趣的书目短评,交互简单,你可以轻松的获取目标书目的指定页数的内容,你可以非常方便地使用该资源即可爬取对应书目的短评内容,可以爬取指定页数的信息,也可以将内容保存到数据库sqlite中,当然也会保存为文本文件,每条评论独占一行,如果后续你要做评论的文本情感分析也会特别方便,如若不会使用,详细使用方式可以看我写的一篇文章,链接在此处,点击可跳转:https://blog.csdn.net/weixin_45938063/article/details/141500999spm=1001.2014.3001.5501 ,该资源收取1积分即可下载,欢迎支持下载,您的支持是我创作的动力

2024-08-30

豆瓣评论爬虫程序,基于Python,快捷好用

豆瓣影视评论爬取程序,拥有简洁的界面,使用方便,非常适合想要获取豆瓣评论做可视化和词云图的小伙伴,使用时请按照程序中的提示操作,(tips:使用无任何难度,不用有心理压力ヾ(≧▽≦*)o),爬取到的评论会自动保存为‘页数.txt’这样格式的文件,方便整理。最好选好自己的保存位置(不过评论文本什么的占用空间也不大,看个人使用习惯就好),本资源用于学习交流,转载请声明出处,如果使用时有疑问可以参考本人的博文,已经描述的比较详细了,希望各位满意

2024-01-02

链家二手房信息爬取软件(打包好了,直接cmd运行)

方便做房源信息可视化的小伙伴学习

2023-12-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除