自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

见证自己学习,成长的记录

积少成多,聚沙成塔

  • 博客(333)
  • 资源 (1)
  • 问答 (1)
  • 收藏
  • 关注

原创 解决navicat链接oracle错误:ORA-28547: connection to server failed, probable Oracle Net admin error

今天需要使用navicat连接oracle数据库,基本参数都拿到了,但是连接不上去。检查了好几次确保无误,然后上网搜了下解决了,特此记录一下。

2026-03-20 10:50:42 122

原创 2026年终极指南:10款网络爬虫工具深度对比,避开选型那些坑

前言在数据驱动的2026年,网络爬虫早已从程序员的“黑科技”变成了企业标配的数据基础设施。无论是训练AI模型、监控竞品价格,还是做市场舆情分析,都离不开稳健的爬虫。但当我们打开搜索引擎,面对Scrapy、Selenium、Bright Data、Octoparse等琳琅满目的工具时,很容易陷入**“选择困难症”**,本文我将深度评测10款2026年最具代表性的网络爬虫工具。从开源利器到企业级战舰,不谈虚的,直接上代码、比性能、算成本,帮你找到最适合自己的那一款。不想看完整篇?看这里你的情况。

2026-03-18 10:20:56 8599

原创 LLM驱动智能数据采集:2026年10大AI网络爬虫工具对比评测

它提供可视化界面操作通过点击选择提取字段,支持循环点击和自动翻页等复杂操作,可处理动态 JavaScript 渲染页面抓取单页应用数据,数据可导出 CSV、JSON、Excel 等多种格式,支持定时抓取与云存储无需本地运行。Bright Data作为AI网络爬虫领域的领军者,其。更偏向开发者友好的API服务,通过API接口,可以轻松抓取互联网上的大量数据,无需人工手动提取,节省时间和人工成本,在数据抓取后可以直接进行初步清洗和格式化处理,输出结构化的数据(如CSV、JSON等),方便后续使用。

2026-01-08 10:06:25 8568

原创 LLM驱动智能数据采集:2026年10大AI网络爬虫工具对比评测

网络爬虫早就是企业获取公开信息、支撑业务增长的核心工具。但传统爬虫的痛点实在太突出——高技术门槛把非技术团队挡在门外,网站一改版爬虫就失效,维护成本居高不下,技术团队大半精力都耗在重复适配这种琐事上,实在不值当。好在大语言模型(LLM)、计算机视觉这些AI技术成熟后,新一代AI网络爬虫彻底改变了游戏规则。它们靠Prompt驱动、自动自愈这些核心特性,把原本要数天的爬虫开发压缩到几分钟,维护成本几乎降到零,这波技术迭代确实解决了行业的真痛点。本文。

2026-01-08 00:13:08 9695

原创 AI Prompt 零代码爬虫,AI Scraper Studio让数据采集变得如此简单

都能实现简单高效的操作。更关键的是,它精准破解了传统爬虫的核心痛点:既解决了多网站采集时的代理、封锁、代码易失效、数据不一致等工程难题,又能在方案升级或业务变动时快速调整抓取流程,以极快的交付速度适配市场窗口期,为用户提供了低门槛、高弹性的生产级数据采集方案,彻底改变了数据采集的传统作业模式,为各类数据驱动型业务的落地扫清了技术障碍。在数据采集的实际场景中,传统爬虫模式的短板已成为制约业务效率的“拦路虎”,其核心痛点贯穿于开发、运维、业务拓展全流程,让数据采集陷入“投入高、隐患多、响应慢”的困境。

2025-12-10 12:48:40 26279

原创 openGauss数据库:从CentOS 7.9部署到实战验证

本篇作为系列开篇,不仅完成在华为云 CentOS 7.9 环境的极简部署与可用性验证,还将引入更贴近生产的进阶内容:架构与版本要点、性能与SQL优化、企业级安全实践、向量与RAG场景的落地路径。本篇在完成极简部署与基础验证的同时,补充了架构与版本要点、进阶优化路径、安全实践以及向量与RAG的入门引导,形成可向后续两篇延伸的完整链路。进阶提示:生产环境建议将程序与数据目录置于独立磁盘或分区,数据目录开启合适的挂载参数(如 noatime),并规划独立的归档与备份路径,降低IO干扰与运维风险。

2025-11-22 18:39:44 22379

原创 多模态 AI 时代的数据困局与机遇,Bright Data 赋能LLM 训练以及AEO场景

单纯依赖文本训练的 LLM 时代正在落幕,多模态 AI 时代已经到来,在LLM训练中,尤其是多模态数据,已经成为 AI 大模型竞赛的核心战场。当无数 AI 团队和研究机构踏入多模态数据采集领域时,却发现自己面临着前所未有的困局:技术困局:使用 yt-dlp 等工具时,频繁遭遇 IP 封锁和 HTTP 429,成功率降至 30% 以下规模困局:从百级扩展到百万级时,陷入代理-IP-并发的瓶颈。有团队 4 个工程师 3 个月只采集到 5 万条数据。

2025-11-05 16:24:26 26329 8

原创 2025年程序员接单怎么开始?一文讲清楚

不同平台各有优劣,没有放之四海而皆准的选择。关键在于结合自身情况,稳扎稳打,从小单开始积累口碑,再逐步接触高质量客户。只要方法对,接单不光能带来收入,还可能成为你职业发展的另一条赛道。祝各位早日开张,接单顺利!

2025-10-28 16:29:14 44610

原创 社交媒体数据价值爆发:探讨Bright Data、Oxylabs、ThorData海外影音数据采集的潜能

Oxylabs 是另一家全球知名的数据采集服务商,优势主要在于其 强大的代理网络 与 数据提取 API,支持爬取Google、Amazon、YouTbe、Alibaba、AliExpress、eBay、Etsy、Flipkart、Walmart、等34个常见网站,其中只包括YouTube一个社交媒体网站,电商平台居多。用户控制面板之后,选择左侧菜单“Data”中的“Scrapers Library”,然后选择分类中的“社交媒体”,选择下面的“youtube.com”那么,谁更适合大规模采集海外影音数据?

2025-09-30 08:36:14 36200 3

原创 AI训练必看!2025年十大最佳数据采集代理推荐

在选择AI数据采集代理时,关键在于明确采集目标、遵守合规性要求,并结合代理的技术能力、可扩展性与稳定性来做出选择。对于大规模、长期采集任务,比如Bright Data和 Oxylabs这样的高端服务商提供了强大的技术支持和全球合规保障,适合需要高并发和高成功率的企业级应用。

2025-09-01 10:51:37 24427 1

原创 用java写一个抽奖小程序

用java写一个抽奖小程序

2025-08-16 15:18:05 16514

原创 SpringBoot+Vue使用Echarts

SpringBoot+Vue使用Echarts

2025-01-23 17:04:51 10560

原创 vue使用echarts报错:Can‘t get DOM width or height. Please check dom.clientWidth and dom.clientHeight

[ECharts] Can't get DOM width or height. Please check dom.clientWidth and dom.clientHeight. They should not be 0.For example, you may need to call this in the callback of window.onload.

2025-01-23 16:20:52 11186

原创 解决feign之间文件上传报错:Error converting request body

今天使用feign调用一个附件上传的时候出现一个问题。

2024-11-26 13:36:34 10590 1

原创 IDEA 打开项目不显示或者缺失项目文件目录

今天遇到一个很奇怪的问题,一个web项目,切换分支提交代码之后在IDEA缺失了一些东西,但是在本地文件夹看是完好的.

2024-10-18 10:08:06 11113

原创 maven clean报错:Failed to delete xxxxx\target\xxxx.jar

target文件可能时编译的文件被其他程序占用,导致资源无法回收。在cup这里,关联的把柄,输入target。点击性能,点击打开资源监视器。把搜索出来的进程全部杀死。

2024-07-26 16:19:05 1221

原创 mybatis新增到数据库后返回当前ID

之前用mybatisPlus自带的api非常简单,调用完save or insert之后再getId即可。keyProperty=“id” 自增后的Id赋值给实体类中的字段 这个千万不要写错。useGeneratedKeys=“true” 是否给主键设置自增。今天使用mybatis的时候也遇到了这个场景,在此记录一下。在开发中,插入一条数据并返回当前的ID的场景很多。直接再insert标签里面表明属性。再次重启项目后,解决问题。简单解释下这两个属性。

2024-05-28 11:37:41 11604

原创 mybatis日期格式错误:IllegalArgumentException: invalid comparison: java.util.Date and java.lang.String

找了几圈,debug了好几遍发现是mapper中的问题,使用if标签判断的时候,如果是日期类型或者int类型,只需要判断是不是null就像了,不需要判断是不是’',不然就有这个问题。今天使用mybatis做一个save操作的时候,创建时间报错了。这个问题之前在int类型中也遇到过。把判断日期的代码中的’'判断去掉。再次启动项目重新允许即可解决问题。然后进行添加操作就报错了,如下。

2024-05-27 19:26:26 587

原创 minio客户端基本操作

minio客户端基本操作

2023-11-27 12:01:19 2921 1

原创 springBoot整合quartz定时任务

Spring Boot整合Quartz的定时任务技术可以应用于许多不同的场景,帮助我们实现定时执行任务、数据清理、缓存刷新、邮件发送、数据备份、系统监控与报警、数据分析和报表生成等功能。4 TriggerBuilder.newTrigger().forJob制定的是具体明细的方法名,不要忘了加括号,当然不加编译也会报错。创建quartz定时任务配置类,在该类里面有两个地方需要处理,分别是任务明细的构造和触发器的构造。1 工作(Job):用于定义具体执行的工作,通常写业务处理的地方。

2023-11-22 14:03:33 1807 1

原创 程序员怎样才能学好算法,推荐好书送给大家

数据结构和算法是计算机科学的基石,是计算机的灵魂要想成为计算机专业人员,学习和掌握算法是十分必要的。不懂数据结构和算法的人不可能写出效率更高的代码。计算机科学的很多新行业都离不开数据结构和算法作为基石,比如大数据、人工智能等。底层开发中也需要使用非常多的数据结构和算法知识,以保证底层系统的稳定性和高效性。

2023-11-08 16:37:04 6510

原创 Java附件和base64相互转换

Java附件和base64相互转换

2023-11-07 17:23:46 1341 1

原创 解决使用Hutool发送邮件报错: MailConnectException: Couldn‘t connect to host, port: smtp.qq.com, 456; timeout -1

解决使用Hutool发送邮件报错: MailConnectException: Couldn't connect to host, port: smtp.qq.com, 456; timeout -1

2023-11-07 14:52:15 3245 1

原创 IDEA取消git对项目的版本控制

IDEA取消git对项目的版本控制

2023-11-06 16:22:50 10880 1

原创 解决SpringBoot启动报错:java: 无法访问org.springframework.boot.SpringApplication 类文件具有错误的版本 xxx, 应为 xxx

解决SpringBoot启动报错:java: 无法访问org.springframework.boot.SpringApplication 类文件具有错误的版本 xxx, 应为 xxx

2023-11-03 00:17:04 3647 3

原创 解决使用IDEA启动SpringBoot项目报错 java: 警告: 源发行版 17 需要目标发行版 17 或者 java: 无效的目标发行版: 17

解决使用IDEA启动SpringBoot项目报错 java: 警告: 源发行版 17 需要目标发行版 17 或者 java: 无效的目标发行版: 17

2023-11-03 00:04:58 2423

原创 解决IDEA打开报错:Internal error. Please refer to https://jb.gg/ide critical-starup-errors

解决IDEA打开报错:Internal error. Please refer to https://jb.gg/ide critical-starup-errors

2023-11-01 10:32:51 7065 1

原创 vuex中的四个map方法的使用

用于帮助我们映射state中的数据为计算属性//借助mapState生成计算属性:sum、school、subject(对象写法)//借助mapState生成计算属性:sum、school、subject(数组写法)},用于帮助我们映射getters中的数据为计算属性//借助mapGetters生成计算属性:bigSum(对象写法)//借助mapGetters生成计算属性:bigSum(数组写法)},3用于帮助我们生成与actions对话的方法,即:包含的函数methods:{

2023-07-07 18:18:58 5661 3

原创 解决python连接mysql报错:pymysql.connect(DBHOST,DBUSER,DBPASS,DBNAME) TypeError: __init__() takes......

不明白是什么原因,感觉应该是数据库版本的问题。我这个mysql版本是8.0的。可能是没有指定参数造成了混乱导致失败。

2023-07-07 18:15:19 2083

原创 解决连不上mysql: message from server: “Host ‘xxxx‘ is not allowed to connect to this MySQL serve

今天链接别人的数据库,发现报错了:很奇怪的是,我们是在一个局域网,ip段都是一样的。pin ip也是没问题的,就是3306这个端口不通在网上查询了一些资料,最终发现是因为数据库权限的问题。下面分享下我的解决办法吧。

2023-07-06 11:03:43 1833 1

原创 Java安装并使用Jmter测试微服务高并发下的服务雪崩场景

Jmeter是Apache JMeter 是 Apache 组织基于 Java 开发的压力测试工具,用于对软件做压力测试。它的功能十分强大,今天我们只做测试高并发请求通过测试发现,由于order方法囤积了大量阻塞线程请求,导致test方法出现了问题,这就是服务雪崩的雏形。

2023-06-27 14:05:39 1868

原创 Windows安装使用Nacos并进行服务治理

Nacos致力于帮助您发现、配置和管理微服务。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据及流量管理。Nacos其实就是一个注册中心,用来管理和注册微服务。

2023-06-27 14:05:09 1328

原创 Vuex-getters配置项

首先在store里面定义getters,在里面进行逻辑处理,它有一个参数是state,里面有存放的数据,通过return返回最终处理好的结果概念:当state中的数据需要经过加工后再使用时,可以使用getters加工。在store.js中追加getters配置......//创建并暴露store......getters})1. 概念:当state中的数据需要经过加工后再使用时,可以使用getters加工。2. 在store.js中追加getters配置//js代码。

2023-06-27 14:04:22 1018

原创 Vue-搭建Vuex开发环境

/引入Vue核心库//引入Vuex//应用Vuex插件//准备actions对象——响应组件中用户的动作//准备mutations对象——修改state中的数据//准备state对象——保存具体的数据//创建并暴露storeactions,mutations,state})2 在main.js中创建vm时传入store配置项......//引入store......//创建vmnew Vue({el:'#app',store})

2023-06-24 22:18:27 1500

原创 ElasticSearch的核心概念简单描述

ES使用的是一种称为倒排索引的结构,采用Lucenne倒排索引作为底层,这种结构适用于快速的全文索引,一个索引由文档中所有不重复的列表构成,对于每一个词,都有一个包含它的文档列表比如现在有两个文档如果要搜索 to forever,由于文档1的权重(score )更高,所以优先考虑文档1,百度也是这样的机制在看一个例子,倒排索引会过滤掉全部和查询无关的数据,效率更加高。

2023-06-24 21:40:06 1960

原创 ElasticSearch-使用IK分词器进行分词

找到并且打开IKAnalyzer.cfg分词器配置文件自己自定义新建一个dic文件,一个dic就算一个字典,ik自带的字典是远远不够用的,我们需要手动去创建字典新增字典项内容并且保存然后把我们自定义配置的字典加入到配置文件让字典生效配置完之后保存,然后重启es,注意观察,在重启es的时候会发现黑窗口已经加载我们自定义的字典weiyihe.dic重启kibana,再次测试使用过自定义字典之后魏一鹤是否被分割不管是哪种分词,魏一鹤都没被分割!说明我们自定义字典配置成功!

2023-06-24 21:39:26 2195

原创 ElasticSearch-IK分词器介绍和下载

分词:把一段中文或者别的划分成一个一个的关键字,我们在搜索的时候会把自己的信息进行分词,会把数据库中或者索引库中的数据进行分词,然后进行一个匹配操作,默认的中文分词是将每个字看成一个词,比如"我爱魏一鹤"会被分成"我",“爱”,“魏”,“一”,“鹤”,这显然是不符合要求的,索引我们需要安装中文分词器IK来解决这个问题如果要使用中文,建议使用ik分词器。

2023-06-24 21:36:42 3094

原创 JSON的基本概念

早期网站我们进行登录操作,如果登录失败,需要重新刷新页面才能重新登录,而且不点击提交按钮,就不知道密码输入错误(同步)注册的时候,发现手机已经注册过了,但是你只是输入,没有提交,它从数据库查询进行提(异步)现在大多数都网站,都是局部刷新,不刷新整个页面的情况下,实现页面更新前后端分离,数据交互变得异常重要,JSON就是王者Ajax即AJavascriptAndXML(异步JavaScript和XML。

2023-06-24 21:32:43 1376

原创 Java项目使用JSON处理中文乱码和Date格式

如果出现乱码,我们需要设置他的编码格式为utf-8,以及它返回的类型,通过@RequesMapping的produces属性来实现,代码如下。//关闭ObjectMapper的时间戳功能 通过objectMapper的configure方法关闭时间戳功能。发现问题:时间默认返回的json字符串变成了时间戳类型的格式 Timestamp 1644327387386。上述代码冗余 我们把公共代码提取出来进行封装成工具类,下次使用直接调用即可。注意观察JSONDateUtil.()的参数列表和返回的格式。

2023-06-24 21:31:58 1862

原创 ElasticSearch-安装Head可视化插件

Head下载地址:https://github.com/mobz/elasticsearch-head/官方下载地址:http://nodejs.cn/download/ 下载LTS版本(长期稳定版本)查询JSON,这里可以写,但是不建议,我们后面所有的查询,都是在KIbana里面做。npm -v 查看npm的版本(新版的node安装自带安装npm)安装可以更改安装路径,其余的都是选择 下一步傻瓜是安装。配置全局安装的模块路径和缓存路径(不一定是安装路径)访问 http://localhost:9200/

2023-06-24 21:22:21 2848

mybatisPlus代码生成

mybatisPlus代码生成

2023-11-17

一个好看的html.zip

b站一个前端大佬写的 搬砖分享给大家

2021-06-11

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除