周凡123
码龄9年
关注
提问 私信
  • 博客:78,119
    78,119
    总访问量
  • 53
    原创
  • 28,627
    排名
  • 188
    粉丝
  • 0
    铁粉
  • 学习成就
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:上海市
  • 加入CSDN时间: 2015-11-02
博客简介:

sinat_32501475的博客

查看详细资料
  • 原力等级
    成就
    当前等级
    4
    当前总分
    502
    当月
    2
个人成就
  • 获得281次点赞
  • 内容获得24次评论
  • 获得367次收藏
  • 代码片获得756次分享
创作历程
  • 11篇
    2024年
  • 12篇
    2023年
  • 12篇
    2022年
  • 11篇
    2021年
  • 11篇
    2020年
成就勋章
创作活动更多

如何做好一份技术文档?

无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

349人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

OpenAI浅聊爬虫

OpenAI越来越火,大有要干掉一片程序员的架势。在此,我们看看Sider(本文使用的OpenAI工具)对爬虫的看法。
原创
发布博客 2024.11.29 ·
1095 阅读 ·
12 点赞 ·
0 评论 ·
14 收藏

OpenCV自动滑块验证(Java版)

爬与防爬就是一场“道高一尺,魔高一丈”的拉力赛,双方都在见招拆招。时至今日,较为常见的防爬手段有手机短信验证、滑块验证、按顺序点击图片验证等。本文主要介绍滑块验证的应对之法。
原创
发布博客 2024.10.31 ·
369 阅读 ·
10 点赞 ·
1 评论 ·
2 收藏

数据资产管理,到底管什么?

数据资产是数据中台的重要根基,没有资产的数据中台是无源之水,就只能叫作数据工具。在数据中台架构中,数据资产建设、管理、治理是重头戏。
原创
发布博客 2024.09.30 ·
1171 阅读 ·
17 点赞 ·
0 评论 ·
11 收藏

网页正文提取算法:行块分布算法 & Readability

爬取百度、搜狗、必应等搜索引擎时,详情页的正文因来源多样而无法简单通过通用的规则来匹配,这就需要相关的提取算法。本文在此介绍两种网页正文提取算法:行块分布算法 & Readability。
原创
发布博客 2024.08.30 ·
568 阅读 ·
2 点赞 ·
1 评论 ·
4 收藏

图像相似度算法

图像相似度算法
原创
发布博客 2024.07.31 ·
991 阅读 ·
20 点赞 ·
0 评论 ·
13 收藏

MySQL事务:ACID特性的实现原理

事务是MySQL等关系型数据库区别于NoSQL的重要方面,是保证数据一致性的重要手段。
原创
发布博客 2024.06.28 ·
781 阅读 ·
23 点赞 ·
0 评论 ·
28 收藏

MySQL中的触发器Trigger用法解析

这篇文章主要介绍了MySQL中的触发器trigger用法解析,触发器是由事件来触发某个操作,这些事件包括 INSERT、UPDATE、DELETE事件,事件就是指用户的动作或者触发某项行为。
原创
发布博客 2024.05.31 ·
1095 阅读 ·
29 点赞 ·
0 评论 ·
20 收藏

常用加密算法介绍与比较

加密算法分对称加密和非对称算法,其中对称加密算法的加密与解密密钥相同,非对称加密算法的加密密钥与解密密钥不同,此外,还有一类不需要密钥的散列算法。
原创
发布博客 2024.04.30 ·
917 阅读 ·
21 点赞 ·
0 评论 ·
7 收藏

时间序列预测方法汇总

本文汇总了几种常见的时间序列预测方法。
原创
发布博客 2024.03.29 ·
1696 阅读 ·
33 点赞 ·
0 评论 ·
25 收藏

LSTM预测股票走势的原理

LSTM算法是一种重要的目前使用最多的时间序列算法,是一种特殊的RNN(Recurrent Neural Network,循环神经网络),能够学习长期的依赖关系。主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题。简单来说,就是相比普通的RNN,LSTM能够在更长的序列中有更好的表现。
原创
发布博客 2024.03.01 ·
1438 阅读 ·
19 点赞 ·
0 评论 ·
24 收藏

一种手机短信验证码登录平台的解决方案

爬取数据时,请求需要带上Cookie,这是很常见的一种防爬手段。更新Cookie,常用的方法就是Selenium模拟输入用户名和密码;偶尔会遇到图片验证码,现在打码平台很多且技术也很成熟,这个已经不成问题。所谓“道高一尺,魔高一丈”,频繁访问且不断切换IP的账号,平台考虑减少误杀的情况,不可能直接封号,那就只能在登录上设置障碍;正常账号输入手机短信验证码就应运而出了。
原创
发布博客 2024.01.31 ·
535 阅读 ·
8 点赞 ·
0 评论 ·
8 收藏

Git 浅入浅出

最近和同事分模块联合开发代码,自然而然就要用到 Git 管理代码;借此机会,对 Git 进行简单介绍。
原创
发布博客 2023.12.29 ·
1215 阅读 ·
21 点赞 ·
1 评论 ·
27 收藏

Kettle 浅入浅出

Kettle(水壶)是一款国外开源的 ETL 工具,现在已经更名为 PDI,Pentaho Data Integration-Pentaho 的缩写,由纯 java 编写,可以在 Window、Linux、Unix 上运行,绿色无需安装,数据抽取高效稳定。它可以处理各种异构数据库中的数据,并且提供了可视化图形界面的方式进行操作,让你思路主要关注在如果处理数据上,而不是如何实现处理的过程。
原创
发布博客 2023.12.01 ·
1196 阅读 ·
22 点赞 ·
0 评论 ·
23 收藏

Inspeckage,动态分析安卓 APP 的 Xposed 模块

Inspeckage,动态分析安卓 APP 的 Xposed 模块
原创
发布博客 2023.10.31 ·
896 阅读 ·
1 点赞 ·
1 评论 ·
6 收藏

基于APP数据爬取的运行环境

数据爬取本就是“道高一尺,魔高一丈”;越往后,爬取越接近于真实,真实包含了真实的运行环境(不再是简单地伪造请求、User-Agent和Cookie等)和真实的操作流程。本文对APP的运行环境做了简单梳理以供参考。
原创
发布博客 2023.09.28 ·
221 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Charles信任证书后依然无法抓包的解决方案

Charles信任证书后依然无法抓包的解决方案
原创
发布博客 2023.08.31 ·
6169 阅读 ·
4 点赞 ·
2 评论 ·
10 收藏

浅入浅出MySQL事务

事务是由数据库中一系列的访问和更新组成的逻辑执行单元。事务的逻辑单元中可以是一条SQL语句,也可以是一段SQL逻辑,这段逻辑要么全部执行成功,要么全部执行失败。
原创
发布博客 2023.07.31 ·
549 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

浅入浅出Java锁

做分布式爬虫时,结合已有的架构,直接对某网站的详情页进行了爬取;尴尬的是,某网站需先采集列表页,之后才能采集详情页;这种防爬手段使用了用户行为监控,行为异常的访问直接就给屏蔽了。对于这种情况,既要满足分布式的性能要求,又要模拟合理的用户行为,程序中就要对列表页的访问加锁。
原创
发布博客 2023.06.30 ·
240 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

MySQL 视图 浅入浅出

视图(view)是一个虚拟表,非真实存在,其本质是根据SQL语句获取动态的数据集,并为其命名,用户使用时只需使用视图名称即可获取结果集,并可以将其当作表来使用。数据库中只存放了视图的定义,而并没有存放视图中的数据。这些数据存放在原来的表中。使用视图查询数据时,数据库系统会从原来的表中取出对应的数据。因此,视图中的数据是依赖于原来的表中的数据的。一旦表中的数据发生改变,显示在视图中的数据也会发生改变。
原创
发布博客 2023.05.31 ·
516 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

数据对接安全性之AES与RAS结合加解密方案

为了保障数据对接的安全性,我们采用AES与RAS结合加解密的方案。
原创
发布博客 2023.04.28 ·
336 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多