自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(234)
  • 资源 (9)
  • 收藏
  • 关注

原创 【金仓数据库征文】从 HTAP 到 AI 加速,KingbaseES 的未来之路

国产数据库早已实现 “可替代”,但要真正与国际头部厂商掰手腕,必须在 HTAP(Hybrid‑Transaction/Analytical Processing)与 AI 加速 两条技术赛道上实现跨越。KingbaseES 自 V8R3 调整为多进程架构后,历经 V8R6、KSOne 等产品层迭代,正在形成覆盖事务、分析、向量检索的一体化数据平台。本文基于官网文档、社区实践案例与作者内部测试数据,系统梳理 KingbaseES 的 HTAP 架构、关键特性和性能现状,进一步提出面向 AI 场景的向量引擎

2025-04-23 15:51:07 9497 60

原创 【金仓数据库征文】从Oracle到KingbaseES的语法兼容与迁移

随着“信创”战略的深入推进,国产数据库逐渐成为IT系统的重要组成部分。KingbaseES(金仓数据库)凭借其良好的Oracle兼容性和日益完善的生态,成为金融、政务等核心行业国产化替代的重要选项。本文将从语法兼容性分析出发,系统梳理从Oracle迁移至KingbaseES的全过程,分享迁移中遇到的典型问题与实战解决方案,帮助读者顺利完成系统国产化落地。

2025-04-23 15:13:29 9028 53

原创 玩转代理 IP :实战爬虫案例

在现代互联网环境下,爬虫不仅是数据获取的利器,也成为应对网站反爬机制的技术博弈。而在这场博弈中,"代理 IP" 是核心武器之一。本文将以高匿名的代理ip为核心,结合 Python 实战、代理策略设计、高匿技巧与反封锁优化,全面拆解代理 IP 技术的实际应用路径,并通过完整案例实现一个稳定、高效、抗封锁的爬虫系统。

2025-04-10 17:00:02 1823 9

原创 数据采集爬虫三要素:User-Agent、随机延迟、代理ip

做爬虫的朋友都懂:你刚打开一个页面,还没来得及发第二个请求,服务器已经把你当成了“可疑流量”。403、429、验证码、JS挑战……这些“欢迎仪式”你是不是也经常收到?防爬策略越来越猛,采集工程师越来越秃。

2025-04-10 14:59:06 2322 5

原创 原理剖析 + 实战教程 + 资源优化总结大模型微调实战:LoRA / QLoRA / PEFT 全解析,教你低成本玩转大模型微调

随着大语言模型(LLM)在自然语言处理各领域取得突破性进展,越来越多开发者和企业开始关注模型的微调方式。然而,全参数微调不仅成本高昂、资源要求极高,还容易引发过拟合与知识遗忘等问题。为此,LoRA、QLoRA、PEFT 等轻量级微调技术迅速崛起,成为大模型落地实践的热门选择。

2025-04-10 13:24:02 1410 5

原创 1.5万字彻底讲透Transformer:从Attention原理到大模型训练实战

Transformer是现代深度学习的核心架构之一,广泛应用于自然语言处理、计算机视觉等领域。本文将从Attention原理讲起,逐步拆解Transformer架构,结合BERT、GPT等主流模型,通过实战示例讲透大模型训练的完整流程。

2025-03-28 10:29:03 1305 1

原创 爬虫不“刑”教程

在大数据时代,信息的获取至关重要,而网络爬虫正是帮助我们从互联网上获取海量数据的重要工具。无论是数据分析、人工智能训练数据,还是商业情报收集,爬虫技术都能发挥重要作用。本篇文章将全面解析 Python 爬虫的各个方面,从基础知识到高级应用,带领读者掌握爬虫开发的核心技能。

2025-03-03 17:30:33 2914 4

原创 混个眼熟,来见见SQL中那些不常见的关键字

在日常SQL开发中,我们经常使用SELECT、UPDATE、DELETE、INSERT等常见关键字,但SQL标准中还有许多不常见却非常实用的关键字,这些关键字在特定场景下可以极大地优化查询性能或提供额外功能。本文将介绍一些鲜为人知但值得掌握的SQL关键字,并通过查询示例加深理解。

2025-02-13 17:17:02 1744 8

原创 金三银四冲刺力扣热门算法题!50. Pow(x, n)

本题要求实现 pow(x, n),即计算 x 的 n 次幂 x^n。提供python、Java、C三语答案解析

2025-02-12 10:45:34 1056 3

原创 金三银四冲刺力扣热门算法题!134. 加油站问题

本题要求找出能够绕环路一圈的起始加油站编号,或者返回 -1 表示无法完成一圈。提供python、Java、C三语答案解析

2025-02-11 13:54:34 519 1

原创 金三银四冲刺力扣热门算法题!380. O(1) 时间插入、删除和获取随机元素

本题要求实现一个数据结构 RandomizedSet,它需要支持以下操作,并且所有操作的 平均 时间复杂度必须是 O(1)

2025-02-11 13:25:02 973

原创 10 个进阶 Python 编程技巧

Python 作为一门强大的编程语言,不仅适用于初学者,同时也为进阶开发者提供了丰富的高级特性和优化技巧。如果你已经掌握了 Python 的基础语法,希望进一步提升代码质量、优化性能,甚至编写更 Pythonic(符合 Python 习惯)的代码,那么本篇文章将为你提供 10 个实用的 Python 进阶技巧。

2025-02-10 15:01:47 486 1

原创 提升 Python 能力的 10 个小技巧

Python 作为一门强大且易学的编程语言,广泛应用于数据科学、人工智能、自动化、Web 开发等多个领域。然而,想要从 Python 初学者成长为高效的开发者,不仅需要掌握基础语法,还需要不断优化编程思维,提高代码质量,熟练使用工具。本文总结了 10 个实用的小技巧,帮助你更快提升 Python 编码能力,让代码更简洁、高效、可读性更强。        

2025-02-10 14:43:36 1075

原创 Python 入门:文件操作、读写、管理

在计算机程序开发中,文件操作是非常重要的部分。无论是处理文本文件(如 .txt、.csv、.json)还是二进制文件(如 .jpg、.pdf),掌握 Python 的文件操作能力能极大地提高数据处理和存储的效率。

2025-02-08 14:31:25 518 1

原创 Python 入门:函数与模块

函数是 Python 代码的基本组织单位,它允许我们将常用的代码封装在一个独立的块中,并在需要时调用,而不需要重复编写相同的代码。而模块则是由多个 Python 文件组成的结构化代码集合,它允许我们对代码进行更好的管理,并且可以与他人共享。

2025-02-08 14:29:27 787 1

原创 Python 入门:条件判断与循环语句

在编程中,我们经常需要根据不同的条件执行不同的操作(如 if-else 语句),或者重复执行某些代码(如 for 和 while 循环)。这些控制流语句让程序变得更加灵活和高效,使得我们能够编写更加智能的程序。

2025-02-08 13:32:38 868 1

原创 Python 入门:基础语法与数据类型

理解 Python 的基础语法是编写代码的第一步,而掌握数据类型和变量则是 Python 编程的基础。数据类型决定了变量可以存储的数据种类,而变量则是编程中的基本单元。无论是数学计算、字符串处理,还是数据存储和处理,都离不开数据类型。

2025-02-08 11:58:42 694

原创 搞懂数据库事务性

数据库是现代应用的关键支柱,而“事务”更是数据库赖以保证一致性与正确性的核心机制。很多读者在使用MySQL、PostgreSQL等关系型数据库时,仅停留在“BEGIN、COMMIT、ROLLBACK”的表面操作,对事务背后的原理与实现细节了解不多。本文将从ACID特性、隔离级别、多版本并发控制(MVCC)到常见陷阱、优化策略等方面,深度剖析数据库的事务性,帮助大家在实际开发和运维中做到心中有数、下手不慌。

2025-02-07 14:13:12 1259 3

原创 编程语言里变量都有存储地址,而数据库为什么偏偏“不关心”每条数据的地址?

在学习C语言编程时,大家会接触到“每个变量都有自己的存储地址”这一概念:通过指针可以访问变量在内存中的地址。然而,到了数据库领域,明明是用来存储海量数据的系统,却似乎对每条数据的具体存储地址“无动于衷”。究竟是什么原因,让数据库与C语言的思路截然不同?

2025-02-07 13:28:11 1331 2

原创 SQL 中的谓词逻辑

在 SQL 查询语言中,谓词(Predicate)是用于 评估条件并返回布尔值(TRUE、FALSE 或 UNKNOWN) 的表达式。谓词在 SQL 语句中被广泛应用,尤其是在 WHERE、HAVING、JOIN、CASE 语句中,用于筛选数据、定义逻辑和执行条件操作。

2025-02-06 14:41:53 992

原创 SQL 中不能轻视的 HAVING 子句

SQL 是一种强大的数据库查询语言,它允许我们在大量数据中搜索、计算和汇总信息。在查询中,对数据进行过滤是常见的需求,当我们在过滤时,常用 WHERE 和 HAVING。这两者的区别看似简单,但在实际应用中并不容易分清。

2025-02-06 14:33:45 1229

原创 SQL条件分支中的大讲究

在SQL中,条件分支用于根据不同的条件执行不同的操作,适用于数据查询、数据更新以及存储过程等场景。合理使用SQL条件分支,可以优化数据操作流程,提高代码的可读性和可维护性。

2025-02-06 13:47:21 763

原创 ARP地址解析协议的原理与应用

在计算机网络通信中,IP 地址是网络层的核心地址,而 MAC 地址是数据链路层的关键标识符。由于设备在本地网络(LAN)中通信时依赖 MAC 地址,而 IP 地址是逻辑分配的,两者并不能直接互通。因此,需要一种机制将 IP 地址解析为 MAC 地址,这就是 ARP(Address Resolution Protocol,地址解析协议)的作用。ARP 是以太网环境下的必备协议,决定了本地网络通信是否能顺利进行。

2025-02-05 16:47:30 761 1

原创 为什么关系模型不叫表模型

在数据库设计中,关系模型(Relational Model)是最广泛应用的模型之一。然而,许多初学者容易将其简单地理解为"表模型",因为在实际应用中,数据通常以表的形式存储和展示。那么,为什么关系模型不被直接称为"表模型"呢?

2025-02-05 16:31:23 826

原创 SQL中的三值逻辑和NULL

在SQL中,三值逻辑(Three-Valued Logic, 3VL)是一个重要概念,它的存在主要是由于 NULL 值的引入。NULL 代表未知值,它既不是空字符串,也不是数字 0,而是一个特殊的标记,表示数据缺失或不可用。

2025-02-05 16:21:27 911

原创 Python算法详解:回溯算法

回溯算法(Backtracking)是一种通过逐步尝试构建解,并在发现当前路径无法满足条件时回溯以重新尝试的算法思想。它是一种系统的搜索方法,特别适用于解决组合、排列、分割和图遍历等问题。本文将结合回溯算法的核心思想,通过典型案例及Python实现详细解析其应用场景。

2025-01-26 10:48:50 1026 2

原创 Python算法详解:滑动窗口算法与高效解决区间

滑动窗口(Sliding Window)是一种高效解决区间问题的算法思想,常用于处理数组或字符串的子数组问题。它通过动态调整窗口的左右边界,避免了枚举所有区间的低效计算方式。本文将详细讲解滑动窗口算法的基本原理,并结合Python代码解析典型应用场景。

2025-01-26 10:45:06 1240

原创 Python算法详解:贪心算法

贪心算法(Greedy Algorithm)是一种通过选择当前最优解以期望达到全局最优解的算法思想。它在每一步选择时只考虑当前状态下的局部最优,而不关心全局问题的复杂性。这种算法简单高效,适用于某些特定问题,尤其是存在贪心选择性质和最优子结构的问题。本文将从贪心算法的基础思想出发,结合Python代码,详细解析其应用与实现。

2025-01-26 10:41:00 1210

原创 Python算法详解:分治算法

分治算法(Divide and Conquer)是一种解决问题的强大思想,通过将问题递归地分解为规模更小的子问题,逐步解决最终得出整体解。其核心思想在于将大问题转化为多个独立的小问题求解,然后再合并小问题的解。本文将以分治算法的基础逻辑为起点,结合Python代码,深入讲解其应用与实现。

2025-01-24 14:19:00 354

原创 Python算法详解:动态规划

动态规划(Dynamic Programming,简称 DP)是计算机科学中一种高效解决问题的算法思想。它通过将复杂问题分解为更小的子问题,记录中间结果,避免重复计算,从而提升效率。本文将从动态规划的基础思想出发,结合Python代码,详解其实现步骤与实际应用。

2025-01-24 14:09:34 795

原创 Python数据类型与操作

Python是一种动态类型的编程语言,拥有丰富的数据类型,这些类型在编程中无处不在,掌握它们是学习Python的第一步。本篇文章将以循序渐进的方式,从字符串、数字,到列表、元组,再到字典,全面讲解它们的定义、常见操作以及应用场景,帮助大家打好Python基础。

2025-01-23 17:04:38 333 2

原创 Python函数的5个核心概念

Python函数是编程的基石之一,也是提高代码复用性和可读性的关键工具。本文将从零开始,详细剖析Python函数的五个核心概念:定义、参数、返回值、作用域,以及嵌套函数。通过深度解析与实践案例,让大家彻底掌握Python函数的精髓。

2025-01-22 16:20:28 773

原创 重新思考技术的价值 — AI发展与应用的双向意义

2024年,人工智能技术进入全面突破期,从生成式AI到多模态大模型,覆盖语言、视频、音乐等多个方向,推动技术与产业深度融合。AI在教育、医疗、服饰等领域展现了极强的应用潜力,提升效率与创造力。AI的快速迭代不仅驱动技术变革,更在各行业落地实践中释放出改变社会的强大力量。

2025-01-22 15:46:35 2426 4

原创 python与树

树形数据结构是计算机科学中最基础且最重要的数据结构之一。在众多树的变体中,二叉树、二叉搜索树、平衡树(如 AVL 树和红黑树)以及堆(Heap)是最常见且应用广泛的类型。它们不仅在理论中有重要地位,在实际工程中也广泛应用于数据库索引、优先队列和搜索算法等领域。本文将从这些树形结构的特点入手,深入剖析它们的实现和应用。

2025-01-21 10:43:09 996

原创 Python 栈(Stack)

栈(Stack)是一种常见且重要的数据结构,因其简单的操作逻辑和广泛的应用场景,在计算机科学中扮演了不可替代的角色。本文将解析栈的基本原理、Python 中的实现方法,以及其实际应用场景。

2025-01-21 10:07:13 632

原创 Python 链表

链表(Linked List)是经典的数据结构,常与数组相对比:一个在连续的内存区域中顺序存储,另一个则通过节点指针在离散的内存空间中构建灵活结构。虽然 Python 内置的 list 本质是动态数组,但在需要高频插入、删除或者存储结构复杂时,链表依然具有不可替代的优势。

2025-01-20 19:45:02 946

原创 网络协议入门:OSI模型与TCP/IP栈

在网络通信的世界中,数据从一台设备传输到另一台设备,需要遵循一系列规则,这些规则统称为网络协议。OSI模型和TCP/IP协议栈作为网络通信的基石,帮助我们理解数据传输的全流程。这篇文章将深入解析它们的结构、功能和实际应用,为大家打开网络协议的大门。

2025-01-20 19:17:51 1922

原创 Python与下划线(六)__name__ 和 __main__

在 Python 的模块化开发中,__name__ 和 __main__ 是两个不可或缺的核心概念。它们不仅用于区分模块是直接运行还是被导入,还在模块的测试和组织中发挥了重要作用。本文将详细解析这两个特殊变量的工作原理、使用场景,并提供最佳实践来帮助开发者编写更高效的 Python 模块。

2025-01-17 11:58:05 791

原创 Python与下划线(五)私有属性与双下划线的使用技巧

在 Python 中,通过私有属性(private attributes)可以有效限制外部访问,从而提升代码的健壮性和安全性。本文将重点分析私有属性的实现机制,特别是双下划线(__)的作用,以及在实际开发中可能遇到的陷阱和解决方案。

2025-01-17 11:48:30 1188 1

原创 Python与下划线(四)模块接口管理 用__all__控制导出

通过__all__,Python 提供了一种简单而强大的方式来管理模块接口。它不仅可以避免命名冲突,还能帮助开发者明确模块的公共接口,提高代码的可维护性和安全性。在实际开发中,合理使用__all__,能够让你的代码更加优雅和高效。

2025-01-17 11:31:56 1038

从0到1搭建推荐系统 - 数据驱动的算法与架构设计(带数据集)

user_profiles_data_expanded

2025-01-15

从0到1搭建推荐系统 - 数据驱动的算法与架构设计(带数据集)

user_item_data_expanded

2025-01-15

从0到1搭建推荐系统 - 数据驱动的算法与架构设计(带数据集)

item_features_data_expanded

2025-01-15

销售记录数据,包括订单ID、产品种类、销售额、利润、客户区域等

Order_ID: 订单编号 Product_Category: 产品类别(例如电子产品、家具、服装等) Sales_Amount: 销售金额(范围 10 至 500) Profit: 利润(可能为负数) Region: 销售区域(北、南、东、西) Order_Date: 订单日期(涵盖 2023 年)

2024-12-31

从零开始学习构建自己的机器学习模型 - 带垃圾短信识别实战

垃圾短信数据集

2024-12-06

学生信息管理系统-python3.6

系统包含: 1 录入学生信息 2 查找学生信息 3 删除学生信息 4 修改学生信息 5 排序 6 统计学生总人数 7 显示所有学生信息 0 退出系统 通过学生信息管理系统的治理,大大的提高了工作效率和人才的利用率,使之制造了更大价值;减少了工作人员,同时减少了学校开支;人才利用率的提高,适应了信息时代的网络化治理要求。

2023-01-03

超市销售数据分析.csv

数据挖掘、数据统计、数据库应用甚至练习表格操作均可,CSV格式绿色环保,可转文本可转表格,易于操作,4.2w条数据,来源于生活,更便于统计,更容易发现数据规律(我自己只找过两三个指标)。 数据字段:顾客编号 大类编码 大类名称 中类编码 中类名称 小类编码 小类名称 销售日期 销售月份 商品编码 规格型号 商品类型 单位 销售数量 销售金额 商品单价 是否促销。 数据样例: 0 12 蔬果 1201 蔬菜 120109 其它蔬菜 20150101 201501 DW-1201090311 生鲜 个 8 4 2 否 实际数据四万余条,是整齐的,好看好用,Excel打开也能直接用。

2022-07-30

数据仓库面试题.pdf

一文带你速通数据仓库,作为大数据的发展基础,数据库已不再适合装载海量数据,新的概念数据仓库应运而生,而伴随一起的,还有大量的数据仓库相关技术岗位,了解数据仓库面试重点,归纳梳理重点问题,基础理论牢记于心,助力你拿下心仪offer!

2022-07-30

大数据开发相关技术面试题

文件共有七部分组成,分别是spark、hive、Hbase、flink、zookeeper、Hadoop、kafka。包含了各部分组件的基础概念,寻常提问方向,通过大量前人实际总结归纳整理。从理论基础开始,拥抱大数据。

2022-07-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除