自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(87)
  • 收藏
  • 关注

原创 [python爬虫]selenium模拟登录京东招聘网,爬取研发类,数据清洗,数据存储,终数据分析和可视化

selenium模拟登录京东招聘网,爬取研发类,xpath数据解析,数据清洗,存储csv,mongodb形式,终数据分析和可视化

2022-06-10 16:51:19 1126

原创 存储mongodb中的数据至表格中

【代码】存储mongodb中的数据至表格中。

2023-12-30 23:22:36 464

原创 OpenCV图像识别技术-验证码识别之前置基础

1.安装opencv:终端:pip install opencv-python。1.安装numpy:pip install numpy。2.创建py文件,输入如下代码。

2023-11-02 21:36:47 421

原创 python面向对象

【代码】python面向对象。

2023-10-29 22:18:52 195

原创 正则表达式基础补充学习

一、除换行符之外的任意字符。二、 字母、数字、下划线。五、非字母、数字、下划线。

2023-10-27 07:30:00 162

原创 用python实现操作mongodb的插入和查找操作

用python实现操作mongodb的插入和查找操作。

2023-10-26 21:47:26 561

原创 redis连接数据库与去重代码

【代码】redis连接数据库与去重代码。

2023-07-28 17:49:59 79

原创 redis数据换库代码

【代码】redis数据换库代码。

2023-07-28 17:39:59 92

原创 用户登录案例练习(flask+微信小程序)

在index.js书写函数配置,登录成功则跳转页面,登陆失败显示登陆失败字样。在index.wxml中添加用户登录的标签。(4) 粘贴官网的最小flask代码。(3)在虚拟环境里边安装Flask。(5)启动flask服务。3.运行flask测试。

2023-07-21 22:05:04 601

原创 使用python语言调用有道翻译接口实现中英互译

【代码】使用python语言调用有道翻译接口实现中英互译。

2023-07-21 10:28:04 1246

原创 git知识总结

2. git是用来管理版本的,比如我现在写了一个代码,500M,我想更改一个版本,同时保留现在的版本,把他复制一份,然后再复制的上边去改,这样文件大小一共可能就是1000M多了。但是,如果我是用git,不管改几个版本,他都是500多M,也就是说,不同版本之间相同的那部分代码,只会保留一份。12. 如何新建分支:git checkout -b xxxx,注意,如果没有-b选项,那么就是切换到xxxx分支,如果这个分支不存在,会报错。3. git的使用,首先去git官网下载安装,略。

2023-07-15 11:06:10 395

原创 微信小程序添加底部导航栏+实现点击跳转代码书写

建立如下文件夹:(标红为底部导航栏的导航文件夹,某些需要新建)

2023-07-04 17:24:12 876

原创 爬虫进阶-反爬破解2(破解加密登陆的过程+账号信息加密的常用算法)

1. 加密算法分类:不需要密钥的散列算法(MD5、SHA-1)、需要密钥的加密算法(对称加密DES、3DES、AES,非对称加密RSA);5. RSA算法介绍:非对称加密算法,加解密需要公钥和私钥的配合,抵抗到目前为止已知的所有密码攻击,已被ISO推荐为公钥数据加密标准。(1)Alert弹出内容 (2)console.log("输出到终端的日志信息") (3)在JS代码中增加断点。(1)开发者工具是打开状态(2)BreakPoint处于激活状态(3)在JS代码中增加断点。(一)开发者工具的栏目说明。

2023-06-27 16:30:53 1306

原创 jenkins定时任务时间设置

参考链接:https://blog.csdn.net/weixin_39267265/article/details/121082254。具体的格式划分为5个字段:分别为 分钟、小时、日、月、星期、通过tab或者空格进行隔离区分。jenkins定时任务的时间格式设定遵循的是cron的语法规则。H 5 * * 1表示:每周一上午五点执行一次。

2023-06-26 15:08:17 562

原创 redis学习整理

是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。Redis作为一种内存数据库,具有快速的数据访问和高效的数据存储,适合用作缓存的存储层。哨兵的作用是监控 Redis 的主从节点是否正常工作,当发现节点出现故障时,自动将从节点晋升为主节点,继续提供服务。主从复制的作用是将主节点的数据复制到从节点上,当主节点出现故障时,从节点可以接替主节点,继续提供服务。当主节点出现故障时,从节点会自动升级为主节点,继续提供写操作。

2023-06-25 16:50:48 403

原创 爬虫进阶-反爬破解1(反爬技术简介、HTTP网络基础知识、搭建代理服务)

爬虫进阶-反爬破解1(反爬技术简介、HTTP网络基础知识、搭建代理服务)

2023-05-30 19:08:46 1687

原创 python语言通过终端命令解压rar文件

python语言通过终端命令解压rar文件

2023-05-16 16:50:53 342

原创 根据url链接下载pdf,并提取图中文本

根据url链接下载pdf,并提取图中文本

2023-05-16 16:46:01 350

原创 python - jsonp格式转json格式

python - jsonp格式转json格式

2023-05-06 17:07:20 316

原创 sql语句-查询某个字段是否有重复数据,重复几次

sql语句-查询某个字段是否有重复数据,重复几次

2023-04-13 12:24:35 609

原创 sql语句中将id自增长从n(1)开始

sql语句中将id自增长从n(1)开始

2023-04-13 12:21:10 780

原创 selenium保持用户登陆的方法(获取cookie和添加cookie)

selenium保持用户登陆的方法(获取cookie和添加cookie)

2023-04-07 14:40:48 2146 4

原创 决策树和随机森林

决策树和随机森林

2023-04-02 11:52:36 363

原创 数据库死锁解决方法

数据库死锁解决方法

2023-03-29 14:51:14 604

原创 用seleniumwire获取网站的network中的url链接情况(url、headers)

用seleniumwire获取网站的network中的url链接情况(url、headers)

2023-03-28 18:19:55 970

原创 精确率和召回率、模型的选择和调优(交叉验证、网格搜索)

精确率和召回率、模型的选择和调优(交叉验证、网格搜索)

2023-03-28 00:11:54 215

原创 朴素贝叶斯

朴素贝叶斯

2023-03-26 16:59:36 46

原创 根据url链接下载word文档(doc、docx)、excel(xlsx、xls)、pdf、txt,并解析获取其中的内容(段落、表格)形式

根据url链接下载word文档(doc、docx)、excel(xlsx、xls)、pdf,并解析获取其中的内容

2023-03-23 17:32:06 920

原创 k近邻算法(KNN)

k近邻算法(KNN)

2023-03-18 17:18:16 66

原创 将字符串运用md5方式加密

将字符串运用md5方式加密

2023-03-10 14:44:44 329

原创 按月迭代两个日期

按月迭代两个日期

2023-03-06 11:20:21 59

原创 机器学习算法分类和开发流程

机器学习算法分类和开发流程

2023-02-24 00:02:35 80

原创 sklearn数据集(分类、回归)与转换器、估计器

sklearn数据集(分类、回归)与转换器、估计器

2023-02-23 23:39:27 182

原创 数据的降维—特征选择+降维案例

特征选择(VarianceThreshold语法、PCA(主成分分析))、降维案例

2023-02-23 00:12:46 257

原创 时间戳转换为日期格式

时间戳转换为日期格式

2023-02-22 16:04:31 363

原创 特征与处理-sklearn归一化、标准化、缺失值处理

特征与处理-sklearn归一化、标准化、缺失值处理

2023-02-22 00:19:49 632

原创 特征工程-定义+意义+安装scikit-learn+数据的特征抽取(字典、文本)

特征工程-定义+意义+安装scikit-learn+数据的特征抽取(字典、文本)

2023-02-20 23:31:41 363

原创 机器学习定义和数据集构成

机器学习定义和数据集构成

2023-02-18 18:01:39 101

原创 pandas的时间序列

pandas的时间序列-生成一段时间范围、pandas重采样

2022-11-28 00:03:30 191

原创 pandas常用统计方法、数据合并和分组聚合、索引和复合索引

pandas常用统计方法、数据合并和分组聚合、索引和复合索引

2022-11-27 23:14:09 661

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除