自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(167)
  • 收藏
  • 关注

原创 国内环境部署 AI 助手:硅基流动 + Claude Code 完整开发环境教程

特性说明国内直连无需翻墙,低延迟,稳定可用数据合规代码数据不出境,符合国内监管要求成本极低国产模型价格仅为Claude 3的1/10~1/20,新用户免费额度可覆盖日常使用模型丰富支持GLM、DeepSeek、Qwen、Kimi等国内顶尖大模型,按需切换官方原生基于Claude Code官方客户端,完整保留原体验,无功能阉割部署简单一键配置,5分钟完成环境搭建,适合开发、教学、竞赛场景。

2026-04-13 16:54:24 409

原创 智谱 GLM-5.1 新旗舰实测:开源 SOTA 级大模型,注册即领 2000 万 Tokens,开发者必冲!

近期大模型圈重磅更新!智谱大模型开放平台BigModel.cn正式上线新一代旗舰模型 GLM-5.1,凭借推理、代码、智能体三大核心能力的 SOTA 级表现,迅速成为开发者首选工具。通过我的专属邀请链接注册BigModel.cn,新用户可免费领取 2000 万 Tokens 大礼包,无需充值,直接解锁 GLM-5.1 旗舰模型体验,零成本测试 AI 应用、打磨项目方案。结合 2000 万 Tokens 专属福利,无论是个人开发者练手、大学生竞赛备赛,还是企业项目落地,都能大幅降低开发门槛、提升效率。

2026-04-13 16:12:21 171

原创 【2026-Scala教程-四、函数基础】

摘要:本文介绍了Scala函数基础,包括函数的定义与调用(基本语法、无返回值函数)、参数处理(默认参数、带名参数、可变参数)以及递归函数(基本递归和尾递归优化)。通过多个练习案例展示了实际应用,包括数据大小转换、统计分析和文件系统模拟等场景。特别强调了函数在Spark大数据处理中的核心作用,如RDD操作和UDF定义。学习重点在于掌握函数定义方式、参数灵活使用方法以及递归优化技巧,为后续Spark编程打下基础。

2026-03-19 17:41:06 56

原创 【2026-Scala语法一-Scala简介与环境搭建】

本文介绍了Scala语言在大数据领域的重要性及其特点,详细说明了Scala开发环境的搭建步骤,包括JDK安装、Scala配置和IDE设置。通过REPL交互式环境和独立程序两种方式演示了Scala基础语法,提供了练习代码示例,并对比了普通Scala程序与Spark应用的相似性,为后续Spark学习奠定基础。

2026-03-12 16:51:29 211

原创 【2026-Scala语法四-函数基础】

Scala函数基础摘要 本文介绍了Scala函数的基础语法和特性,主要内容包括: 函数定义:基本语法、返回值类型声明、无返回值函数(Unit)的写法 函数参数:默认参数值、带名参数调用、可变参数(varargs)的使用 递归函数:普通递归与尾递归的区别,@tailrec注解确保尾递归优化 实际应用:包含数据大小转换、用户信息创建、数据统计分析等大数据场景示例 文章通过大量代码示例演示了Scala函数的核心概念,特别是对函数参数灵活性和递归优化的讲解较为详细。

2026-03-12 16:38:29 199

原创 【2026-Scala语法三-控制结构】

Scala语法控制结构、条件表达啥,if-else结构,循环结构 for/while/do...while/foreach

2026-03-12 16:16:17 210

原创 【2026-Scala语法-二基础语法、变量与数据类型】

Scala基础语法摘要 变量定义: 使用val声明不可变变量(推荐),var声明可变变量 支持类型推断,也可显式指定类型(如val x: Int = 42) 数据类型: 数值类型:Byte/Short/Int/Long/Float/Double 字符和字符串:Char/String,支持多行字符串和三种插值方式(s/f/raw) 特殊类型:Unit(类似void)、Nothing(异常场景) 类型转换: 数值类型间通过.toXxx方法转换(如42.toDouble) 字符串与数值互转("123&q

2026-03-12 14:36:34 394

原创 【2026-Spark实验一-Windows中安装Spark环境】

本文详细介绍了在Windows系统中配置Spark 3.5.8开发环境的完整流程。主要内容包括:安装JDK 8并配置环境变量,下载并解压Spark 3.5.8预编译版,设置SPARK_HOME系统变量,配置Hadoop的winutils工具解决Windows兼容性问题。通过spark-shell和SparkPi示例程序验证环境配置成功,确保Spark能够正常运行分布式计算任务。文中特别强调了路径命名规范、环境变量设置顺序等关键细节,提供了完整的配置截图和验证方法,帮助开发者快速搭建稳定的Spark学习环境。

2026-02-27 15:20:12 1306

原创 本地局域网部署的gitlab使用教程

本文介绍了在局域网内使用Docker部署中文版GitLab的教程。通过docker-compose配置GitLab服务,指定IP地址和端口映射,优化性能参数。重点强调局域网使用时需将远程仓库地址改为GitLab主机地址,并提供HTTP推送方式的详细步骤,包括IDEA配置和推送验证。教程旨在帮助企业在内网安全地管理代码,使用中文界面更符合国内用户习惯。

2025-12-18 14:08:23 726

原创 基于Docker部署测试PySpark

摘要 本文介绍了使用Docker快速部署PySpark环境的方法。通过挂载本地目录到容器中,用户可以方便地访问测试数据文件。文章详细展示了启动PySpark容器的命令参数配置,包括卷挂载、环境变量设置等。同时提供了在PySpark交互式环境中进行基本文本处理操作的完整示例代码,包括文件读取、过滤、单词统计等常见Spark操作。这种方法简化了PySpark环境的搭建过程,特别适合快速测试和学习Spark功能。

2025-12-15 17:12:36 317 1

原创 GNU归档工具

摘要:GNU学校归档工具是一款专为贵师大设计的成绩管理软件,支持快速导入命题系统成绩、等分系统成绩和试题文件(均为Excel格式),自动生成归档结果。该工具采用简洁的软件架构,用户只需下载运行exe程序,通过三步操作(运行程序→导入文件→获取结果文件)即可完成成绩归档工作,显著提升教务管理效率。(99字)

2025-09-10 21:34:02 259

原创 【基于飞浆训练车牌识别模型】

LPRNet是一种轻量级CNN网络,专为端到端车牌识别设计,无需字符分割和RNN结构,通过CNN和CTC Loss直接实现序列识别。其创新点在于采用1×13宽卷积模块捕获字符间上下文信息,结合轻量级Backbone和全局上下文融合模块,在保持高精度(95%)的同时实现实时处理(3ms/plate)。基于飞桨的代码实现展示了模型训练流程,包括数据增强、CTC Loss优化等关键环节。该模型参数量仅0.48M,显著优于传统CRNN,适用于嵌入式设备部署,已与YOLO系列检测器集成形成完整车牌识别系统。

2025-07-16 23:25:51 1438

原创 【基于PaddlePaddle训练的车牌识别系统】

车牌识别系统部署

2025-07-16 22:21:25 616

原创 【基于飞浆的波士顿房价预测-两种写法基础+高级API】

摘要 本文介绍了使用飞桨框架(PaddlePaddle)实现波士顿房价预测的机器学习项目。项目采用经典的波士顿房价数据集,包含506个样本和13个特征变量(如犯罪率、房间数量等)以及房价中位数(MEDV)作为目标变量。通过构建线性回归模型,对数据进行归一化处理后,使用随机梯度下降优化器进行训练。实验结果显示,模型在测试集上取得了良好的预测效果,并计算了平均绝对误差(MAE)作为评估指标。代码实现了数据预处理、模型训练和评估的全流程。

2025-07-10 22:04:37 488

原创 Python代码规范故事——商人的账本管理术

《Python代码优化启示录:商人账本的管理智慧》通过商人李四的案例,生动展示了Python编程的最佳实践。故事揭示了字符串操作的效率陷阱——避免循环中使用+拼接,推荐f-string格式化和join方法;强调了资源管理的重要性,提倡使用with语句自动关闭文件;规范了日志记录方式(使用%而非f-string)和错误消息格式。文章还统一了代码风格,如单/双引号使用规范和三重引号的多行文本处理技巧。这些优化使李四的账本系统性能显著提升,资源管理更安全,体现了Python代码规范的实际价值。

2025-06-19 15:15:22 381

原创 Python代码规范故事——注释和文档字符串如同图书馆的导读手册

本文通过图书馆管理员张三的故事,生动阐释了Python代码注释和文档的重要性。文章将注释比喻为图书馆的导读手册,强调注释应解释代码目的而非实现细节,并提供了规范的注释、文档字符串(包含Args/Returns/Raises等)和TODO注释(需标注作者和计划)的编写示例。故事展示了良好文档对代码可读性的提升作用,涵盖注释格式、文档字符串内容要求等关键知识点,帮助开发者编写更易维护的Python代码。

2025-06-19 15:08:59 233

原创 Python代码规范故事——代码可读性如同村庄的共享手稿

摘要:中世纪村庄的抄写员李四通过规范法典(代码库)格式提升可读性。她制定规则:每行不超过80字符(长URL等例外),用括号而非反斜杠续行;统一4空格缩进(禁用tab),展示对齐与悬挂缩进两种风格;合理使用空格(运算符/逗号后加空格,括号内不加)。这些调整使法典如"共享手稿"般清晰易读,涵盖行长度、缩进、空格等Python代码规范核心要素。(149字)

2025-06-19 15:05:46 384

原创 【Trae AI工具上新评测报告-免费AI开发助手-Cursour平替】

支持自定义创建智能体是Trae的一大亮点。用户可灵活设置智能体提示词,接入MCP或内置工具,增强智能体处理特定任务的能力和协作性。例如,在复杂的数据分析场景中,用户可定制专注于数据洞察的智能体,提升任务处理的专业性和精准度。通过配置用户、项目维度的Rules.md文件,Trae可在全局或单个项目中精细化控制AI的输出风格和行为。这一功能满足了不同用户在不同场景下的个性化需求,确保对话结果更符合预期。

2025-04-22 10:20:55 1375

原创 【Datawhale AI春训营-第三届世界科学智能大赛创新药赛道:RNA逆折叠与功能核酸设计】

第三届世界科学智能大赛由上海市科学技术委员会等多部门指导,上海科学智能研究院与复旦大学联合主办,阿里云、复星医药等机构协办,总奖金池达百万元,面向全球开放。大赛聚焦科学智能与高价值产业场景的融合,设置航空安全、材料设计、合成生物、创新药、新能源五大赛道,旨在推动人工智能(AI)技术在复杂科学问题中的突破,加速科研范式变革。创新药赛道作为核心方向之一,以 “RNA 逆折叠与功能核酸设计” 为主题,要求参赛者基于给定的 RNA 三维骨架结构,设计能够折叠成该结构的 RNA 序列。

2025-04-19 08:40:35 812

原创 【Git江湖秘典——禁制、心法与渡劫篇】

Gitignore 是一个文本文件,用于告诉 Git 哪些文件或目录不需要纳入版本控制。就像门派的「禁书目录」,明确哪些文件不能上传到总舵(远程仓库),避免泄露垃圾文件或敏感信息。通过以上技巧,你已掌握 Git 的核心「内功心法」,无论是屏蔽文件、快速操作,还是解决冲突,都能游刃有余地在江湖中修炼武功!)修改了同一文件的同一段代码,合并时 Git 无法自动判断,需手动解决冲突。:用20%的技巧解决80%的日常问题。假设你和师弟(另一个分支)修改了。

2025-03-24 16:21:30 1097

原创 《Git江湖风云录:代码藏经阁》

你夜观星象,发现GitHub山、Gitee峰灵气汇聚。“西域GitHub山藏有《易筋经》源码,速取!:自创"独孤九剑React版",需昭告天下。如时光回溯(新增commit抵消错误):月黑风高夜,你持七星令牌初入江湖。:闭关三日,江湖已更新Vue3秘籍。:为防域外邪魔,你在三山布下镜像阵。:与师兄同改剑谱,引发灵力冲撞。不在记住了多少git命令,类型(范围): 描述。都留了条退路给队友”

2025-03-24 15:55:26 1820

原创 《Git江湖录·分支篇》

Git分支江湖版,关门弟子,正在修炼《九阳真经》的秘籍。突然掌门说:“你若想尝试新招式,切勿直接修改正本,否则会毁了祖传功法!:你有了两个分身,一个在练“乾坤大挪移”,另一个在练“降龙十八掌”。:你练成了“乾坤大挪移”,想把它合并到正本《九阳真经》里。但掌门提醒:“若你和正本的招式有冲突,得先调和矛盾!:你成功将“乾坤大挪移”合并到正本,但留下了一堆用过的副本纸。:分支就像武侠世界的“分身术”,让你在江湖中自由探索,但最终目标是让正本功法更强大!(就像你拿出一张新纸,抄下正本的内容,准备画新招式)

2025-03-24 15:03:38 1062

原创 【快递分拣员-Git介绍】

Linus Torvalds(Linux之父),他想让程序员像「玩积木」一样自由地修改代码。每次寄快递都要写寄件人姓名和电话,Git 也要记录你的身份,这样提交的代码才能知道是谁写的。,就像你有一个私人快递分拣站,可以随时回溯到任何时间点的代码状态。把修改的文件「放进快递柜」,告诉 Git:「这些文件我要提交!把暂存区的快递「打包寄到保险柜」,并写上快递单号(提交信息)。发现寄错了快递,补发一个「撤销快递单」,但原快递单还在记录里。在你的文件夹里建一个「分拣站」,从此可以开始管理代码版本。

2025-03-20 22:26:46 1248

原创 【IDEA中配置Maven国内镜像源】

在国内开发时,配置国内镜像源是一个提高开发效率的好办法,避免了因为网络问题带来的构建失败和速度慢的困扰。根据具体情况,使用全局配置或者项目级配置都能帮助提升体验。在团队协作中,使用全局配置的方式会更方便,能够确保构建的一致性。

2025-03-19 22:08:32 3438

原创 【Python 的发展历史】

Python 是一种高层次、通用型编程语言,以其简单性、可读性和多功能性而闻名。它被广泛用于 web 开发、数据科学、机器学习、人工智能和教育等领域。根据 2025 年 3 月的最新数据,Python 在 TIOBE 指数中以 23.88% 的评分位居榜首,显示其在技术领域的持续主导地位 (以下是 Python 发展历史、开发者、应用场景、优点和缺点的详细分析。

2025-03-19 21:47:34 1390

原创 【Python主流环境管理工具深度对比指南】

Python 版本管理,依赖管理。环境隔离工具对比

2025-03-10 11:10:08 1174

原创 【利用conda配置管理Python版本和依赖环境】

利用conda部署python环境管理相关依赖库

2025-02-25 18:04:50 681

原创 【Flink快速入门-11.Flink 中 Table API 和 SQL】

在 Flink1.9 之前,开发人员如果需要处理批计算和流计算,需要同时掌握两种编程接口,对应的业务代码也是两套。一直到 2019 年阿里巴巴 Blink 团队在 Blink 中实现了 Table API 和 SQL,并将 Blink 贡献给 Flink 社区之后,这一问题才得以解决。由于 Table API 和 SQL 出现的时间较晚,所以功能尚不完善,但是已有功能已经可以解决开发人员的很多困难。根据上图我们可以看到,Flink 中最底层的编程接口是,在其的上面一层就是。

2025-02-22 19:28:59 1274

原创 【Flink快速入门-10.Flink 中的时间语义和 WaterMark】

在本节实验中,我们介绍了 Flink 中的三个时间语义(Event Time、Ingestion Time、Processing Time)和 Watermark(水位线)。时间语义好理解,Watermark 虽然使用起来比较简单,有成熟的 API 可以调用,而且有固定的编程模式,无非就是传个参数。但是要结合到企业的业务实践中去,就必须要能够深入了解它的概念,只有这样才能应对不同的业务场景,并根据不同场景做相应的参数调整。

2025-02-21 18:31:25 933

原创 【Flink快速入门-9.Flink 中的窗口】

Window 是流处理中非常常用,也是非常重要的一种处理方式。其中 Time Window 可以说是重点中的重点,大家在学习的时候要认真理解示例图,搞清楚窗口大小和窗口滑动大小的关系。万变不离其宗,不论业务过程如何复杂,最终都会转化到本实验的编程模型中,唯一需要替换的就是聚合部分的业务逻辑。Keyed Window 和 Global Window 大家简单了解就好,有兴趣的同学可以自行实验。

2025-02-21 10:37:08 1212

原创 【Flink快速入门-7.Flink 状态管理】

本节实验我们介绍了 Flink 中的状态管理,包括 State 分类、Checkpoint 机制和 StateBackends。其中 State 分类包括 Keyed State 和 Operator State。在 Flink 状态管理中,使用相对来说比较简单,重点是概念理解。如果你学习过 Spark,请不要用 Spark 中的 Checkpoint 来类比 Flink 中的 Checkpoint,这是两种完全不同的机制。另外,在 Keyed State 案例中的。

2025-02-19 23:10:13 1254

原创 【Flink快速入门-6.流处理之 Source 与 Sink】

一般来说,Flink 官方提供的 Source 和第三方依赖提供的 Source 已经完全可以满足我们日常的开发需求了,但是如果存在不能满足的情况,那么就需要我们自己去实现一个 Source 了。虽然这种情况少之又少,但其依然是一个很重要的知识点。细心的同学可能已经发现了,我们在前面的实验中通过,env对象是有一个addSource方法的,这个方法就是我们自定义 Source 用的。自定义一个类MySource,继承并重写其方法将MySource的实例对象作为参数传入addSource。

2025-02-18 13:16:04 1468

原创 【Flink快速入门-5.流处理之多流转换算子】

本节实验中我们介绍了 Flink 中的多流转换算子,其中 Union 是将两个或者多个类型相同的输入流转换成一个输入流,而filter是将一个输入流根据给定的条件切分成多个子输入流。这部分内容在工作中会经常用到,大家一定要理解。

2025-02-16 17:49:35 1199

原创 【Flink快速入门-4.流处理之基于 Key 的算子】

在本节实验中我们介绍了 Flink 中基于 Key 的算子,keyBy 和 reduce 好理解,但是 Rolling Aggregation 算子的输出结果可能会和大家预想的不一样,特别是 min(minBy)和 max(maxBy),请一定要注意它们之间的区别。需要自己练习,确定效果。

2025-02-14 18:12:24 1282

原创 【Flink快速入门-3.流处理之基础算子】

本节实验中,我们介绍了流处理的基本流程以及三个最基础的算子,也是日常工作中使用相当频繁的三个算子。相信对于有 Spark 使用经验的同学来说并没有什么难度,对于刚入行学习的新同学来说,flatMap 算子可能会比较烧脑,但是不要气馁,所谓熟能生巧。

2025-02-10 14:36:46 564

原创 【Flink快速入门-2.Flink 部署模式】

Flink有三种部署模式,分别是 Standalone、Yarn 模式和 Kubernetes。在本次实验中我们的重点是 Standalone 模式,Yarn 和 Kubernetes 只需要了解即可

2025-02-08 22:06:38 981

原创 【Flink快速入门-8.Flink Flink 架构介绍】

Flink 运行时架构主要包括四个不同的组件,它们会在运行流处理应用程序时协同工作:作业管理器(JobManager)、资源管理器(ResourceManager)、任务管理器(TaskManager),以及分发器(Dispatcher)。因为 Flink 是用 Java 和 Scala 实现的,所以所有组件都会运行在 Java 虚拟机上

2025-02-08 15:01:05 1318

原创 免费 “白嫖” 满血版 DeepSeek:硅基流动 x 华为云

因「DeepSeek」爆火,使用的人太多,加上被攻击的原因,导致服务器繁忙。官方之前也表示「DeepSeek」近期不幸遭受了大规模的网络恶意攻击,导致注册系统繁忙,新用户注册时可能会遇到困难。目前官方的 API 服务也暂停了使用。为解决服务器繁忙导致的无法使用,之前也分享过如何在电脑和手机上离线部署「DeepSeek」模型,不过有些小伙伴的电脑配置比较低,跑不动模型,加上本地部署的 DeepSeek-R1 是蒸馏模型,比 “满血版” 效果要差很多。

2025-02-08 11:08:58 2939

原创 【Flink快速入门-1.Flink 简介与环境配置】

Flink快速入门,流处理概述Flink 简介Flink 批处理 WordCountFlink 流处理 WordCount

2025-02-07 16:09:56 1455

原创 ubuntu24.04部署单节点kafka_2.13-3.8.1

下载地址推荐使用清华镜像源下载部署kafka部署。

2024-12-11 22:30:19 973 1

typora 1.9.4 版本,个人使用,分享测试

typora 1.9.4 版本,个人使用,分享测试

2025-03-04

贵州师范大学目标达成度分析工具

贵州师范大学目标达成度分析工具

2025-02-25

vmware workstatiions pro 17.6.1个人使用免费,不用证书直接安装使用

虚拟机vmware workstatiions pro 17.6.1个人使用免费,不用证书直接安装使用

2024-11-18

SparkSQL进阶操作相关数据

2023_Spark_实验十五:SparkSQL进阶操作相关数据

2024-11-14

Hadoop集群部署相关资源

VMware-workstation-full-15.5.1-15018445.exe MobaXterm_Portable_v20.3.zip apache-flume-1.7.0-bin.tar.gz hadoop-2.7.3.tar.gz spark-2.4.8-bin-hadoop2.7.tgz apache-maven-3.6.3-bin.zip jdk-8u171-linux-x64.tar.gz sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz flink-1.10.1-bin-scala_2.12.tgz kafka_2.11-2.3.1.tgz zookeeper-3.4.5.tar.gz apache-hive-2.3.9-bin.tar.gz

2022-09-11

zotero+zotero-better-bibtex插件分享

zotero+zotero-better-bibtex插件分享,帮助word管理论文,毕设的参考文献管理。 减少论文书写时,调整参考问题格式,快速修改,整理格式。降低书写论文难度。

2024-03-27

2023-Spark-实验十三:Spark RDD 求员工工资总额

求员工工资总额样例数据

2023-10-16

可视化大屏项目动态数据样例

可视化大屏项目MySQL端后端数据资源,包含一下数据: 1. 柱形图数据 2. 条形图数据 3. 折线图1数据 4. 折线图2数据 5. 饼图1数据 6. 饼图2数据。

2023-07-02

17. 可视化大屏配置之代码整理

可视化大屏配置专栏的完整代码,包含Echarts代码,Spring Boot代码,前后端交互代码,SQL代码。独立设计的大屏,运行在Spring Boot Application上的完整代码。其中包含了静态数据,定制,中国地图定制,静态数据定制,使用Maven打包好后的jar,可直接运行。得到一个大屏。解决了前后端跨域访问问题。使用IDEA开发,包含项目演示使用的数据。包含讲课时可以用到的演示代码。 运行说明: 1. 解压后使用idea打开项目 2. 加载sql文件并将其导入自己的mysql数据库中【MySQL数据库的版本为8.0.30,如有不同,这需要修改,pom文件修改成自己的版本,推荐使用8.0.30】 3. 修改src/main/resources/application.properties中的数据库IP和端口,数据库名,用户名和密码 4. 运行src/main/java/org/lh/view/controller/ViewController.java代码 5. 网页端访问运行的地址:运行服务器的IP:9090

2023-07-02

httpclient4_5和httpcore4_5

支持zeppelin按照部署使用 httpclient4.5.13.jar httpcore4.4.15.jar

2022-09-26

MySQL练习数据-Sakilia-spatial DB

MySQL练习数据-Sakilia-spatial DB,支持MySQL5.6~8 sakila-mv-data.sql sakila-mv-schema.sql Sakila 数据库提供了以下数据表: actor,演员信息表。通过 film_actor 表和 film 表进行关联。 film,电影信息表。film 引用了 language 表,同时被 film_category、film_actor 以及 inventory 表引用。 film_actor等 安装方法: shell> mysql -t < sakila-schema.sql; shell> mysql -t < sakila-data.sql;

2022-09-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除