XueminXu-CSDN博客

原创 AI大模型的实际应用

主要介绍AI的实际使用场景，普通用户使用AI的方式主要是AIGC产品，企业应用一般是使用开源大模型训练或微调自己的模型，又称为定制化大模型，这是当前AI落地的主要路径。

2025-12-04 11:23:08 294

原创 TiDB数据库组件介绍和优缺点总结

TiDB是PingCAP开发一款国产开源数据库，活跃度比较高。文章介绍了其主要组件，并总结了数据库的优点和缺点。

2025-11-26 11:09:43 506

原创 ClickHouse数据库参数prefer_column_name_to_alias的作用

ClickHouse可用参数prefer_column_name_to_alias启用或禁用在查询表达式和子句中使用原始列名而不是别名。尤其是在别名与列名相同的情况下。

2025-11-18 15:27:00 248

原创 ClickHouse数据库参数join_use_nulls的作用

ClickHouse可用参数join_use_nulls设置JOIN行为的类型。在合并表时，可能会出现空值，即左表或右表有NULL值。ClickHouse根据此设置以不同的方式填充它们。

2025-11-17 17:21:32 353

原创 ClickHouse查看数据库、表、列等元数据信息

ClickHouse提供系统表查询数据库的状态，包括服务器环境、数据库信息、表信息、列信息、函数、配置等信息，系统表位于system数据库中。另外ClickHouse提供了兼容SQL标准的information_schema系统数据库，用于查看数据库对象的元数据。

2025-11-12 11:06:41 833

原创 ClickHouse数据库的表引擎

ClickHouse提供4类表引擎，分别支持不同场景。包括Log、MergeTree、Special、Integrations系列引擎。对各类引擎进行介绍和总结。最后举例说明建表的SQL脚本。

2025-10-30 17:07:09 394

原创 Clickhouse数据库的介绍

Clickhouse数据库的特点和优势介绍，包括Clickhouse的结构原理、查询和写入性能、分布式架构、适用场景等的介绍。

2025-10-29 11:48:11 811

原创 Python写入PostgreSQL表的三种实现方法

介绍使用Python的psycopg2库写入PostgreSQL表的方法，主要包括INSERT INTO语句方法；使用pandas.DataFrame的to_sql方法直接写入；COPY高性能写入方式。COPY的优点是速度快，资源开销低。缺点是不支持更新逻辑（比如UPSERT），事务回滚成本大。所以一般大数据量（比如单次几十上百万以上量级）场景用COPY，其他场景用前两种方式即可。

2025-09-26 11:11:07 533

原创 Python读取MongoDB的JSON字典和列表对象转为字符串

使用Python的pymongo库连接和读取Mongo的集合或表，读取的每个结果为一个JSON对象。实例代码中将解析结果转化为DataFrame类型，一级属性作为列名，如果属性值为字段和列表，即JSON内嵌对象，则解析为JSON字符串。

2025-09-25 11:37:02 534

原创 Flink-SQL计算中的维表连接使用举例

Flink-SQL中，事实表（又称为流表）和维表连接的计算规则与两条流连接是不同的，两条流连接必须有时间属性和窗口的约束，否则状态会无限膨胀。维表一般是静态或缓慢变化的，Flink不会把维表全部加载进状态，而是连接时查询当前ID的最新值，也可设置缓存进行延迟优化等。

2025-09-24 10:28:56 419

原创 Flink-SQL通过过滤-解析-去重-聚合计算写入到MySQL表

数据源来自于Kafka的Json结构数据，数据结构为源头不断更新的小时报表，Flink的任务是消费Kafka主题数据，然后经过过滤、解析、去重、聚合等计算，最后将结果写入到MySQL表中。

2025-09-23 10:06:24 428

原创大模型与人工智能的关系和区别

大模型与人工智能的区别与联系，包括NLP、LLM、AIGC、AGI、GPT、ChatGPT等的介绍及应用范畴等。同时列举了主要AI产品，比如DeepSeek，ChatGPT、豆包、通义千问等。

2025-09-22 12:01:18 410

汽车智能驾驶（Autonomous / Automated Driving）技术在研发、法规、商业化三个层面都有不少进展，但也正面临若干挑战。自动驾驶技术和Level 0 至 Level 5分级系统的介绍。国内外厂商的介绍，Alphabet的Waymo公司产品RoboTaxi；通用电气（GM，General Motor）的Cruise；特斯拉的Autopilot；亚马逊的Zoox；百度的Apollo在国内已经属于领先地位。

2025-09-19 11:44:32 673

原创苹果采用的台积电3纳米工艺处理器的演变

台积电3纳米工艺处理器的技术架构和发展历程，包括台积电主要客户苹果的芯片发布，还有和三星的芯片之争等。

2025-09-18 10:05:11 1347

原创 Python读取MongoDB数据并写入PostgreSQL

使用Python 3读取MongoDB数据，然后写入到PostgreSQL中，分别借助pymongo和psycopg2库。经整理和优化后以分批次读取和写入的方式较适合生产场景，并能有效应对数据量比较大的情况。

2025-09-17 10:22:30 357

原创 Spark-SQL任务提交方式

Spark-SQL任务提交方式的介绍和提交代码举例，按不同的资源管理模式分别说明。Spark-SQL的交互式模式可以按照类似hive方式写SQL代码。Spark SQL一般依赖Hive的元数据。

2025-09-11 18:43:45 466

原创 Spark中Shuffle阶段的优化方法

Spark中Shuffle阶段的优化方法，包括调整参数spark.shuffle.sort.bypassMergeThreshold控制排序，spark.shuffle.file.buffer调整缓冲区大小等策略

2025-09-10 10:19:03 597

原创 Spark提交任务的资源配置和优化

Spark 提交任务时的资源配置和优化建议，主要可调的资源配置参数包括 Driver 资源、Executor 资源以及集群管理器相关参数。配置和优化时一般结合集群硬件资源、数据规模、作业类型和作业复杂度（SQL / 机器学习）来综合设置。

2025-09-09 10:53:21 511

原创 Hive使用Tez引擎出现OOM的解决方法

Hive使用Tez引擎出现OOM的解决方法，主要通过调整参数hive.tez.container.size解决问题

2025-09-05 10:12:43 451

原创使用Spark计算WordCount

使用Spark引擎统计单词计数，即Word Count，主要使用map，flatmap，reduceByKey算子

2025-09-02 10:07:41 373

原创 Spark引擎中RDD的性质

Spark引擎中RDD的介绍和性质理解，RDD是Spark提供的核心抽象，是一个分布式、不可变、带血统的对象集合。

2025-09-01 11:39:34 279

原创 Spark算子调优

Spark中可使用的调优算子函数介绍，包括mapPartition、coalesce、reduceByKey等。

2025-08-29 10:42:20 233

原创 Node.js的用途和安装方法

Node.js的介绍和安装说明，包括使用开发语言、封装的内容等。

2025-08-01 14:09:22 431

原创 PostgreSQL数据库查看表名模式注释等元数据信息

PostgreSQL数据库查看表信息，包括表名、schema、注释等信息，可通过查询PG的元数据查看

2025-06-12 10:23:05 620

原创 Excel表格VLOOKUP函数用法和举例

Excel表格中VLOOKUP函数的介绍和使用方法，包括参数的用法，参数的解释，使用举例。

2025-05-13 10:04:53 623

原创 Python中的小数和分数

介绍和举例说明了Python中的小数和分数的用法，使用模块decimal表示小数。解决浮点数缺乏精确性。使用分数需要导入模块fractions。

2025-05-06 10:04:26 316

原创 Python命名参数的使用

Python命名参数的使用介绍和举例说明

2025-04-25 17:47:38 335

原创 Python日期时间向前向后N个月及对应月初和月末

Python中的时间的加减运算，月份的起始日期和结束日期，向前向后移动的时间间隔等

2025-03-21 15:00:15 566

原创 DataGrip设置缩进空格数量

以DataGrip 2022.1为例，SQL脚本命令窗口默认缩进为4个空格改为2个空格的步骤

2025-02-09 20:44:04 563

原创 Pandas库DataFrame的filter函数用法

Pandas库DataFrame的filter函数根据指定的索引标签对数据框按行或列进行数据筛选

2025-02-09 20:31:54 883

原创 Python3转换文本文件编码格式

将文本文件的编码格式转为指定编码格式，目标文件为转码后的新文件

2024-12-16 13:47:30 458

原创 Python3字符串的连接或拼接

Python3的字符串连接或拼接方式介绍及使用，包括每种使用方法的举例说明。

2024-12-03 16:09:46 422

原创 Python3异步IO编程中协程的介绍和使用

Python3异步IO开发中协程的介绍和使用方法，包括await和async关键字的用法，多任务并发等

2024-12-01 18:06:45 495

原创 Python脚本文件开头两行#!/usr/bin/python和# -- coding: utf-8 --的作用

Python脚本文件的前两行解释器和编码格式的指定方式，开头两行的使用介绍等

2024-11-29 11:31:35 894

原创使用Java编写上传文件到HDFS代码

使用Java编写上传本地文件到HDFS上，采用事前检查，按进度上传的方式

2024-11-25 16:02:36 432

原创 Centos7.9编译安装Python3.12

在Centos 7.9最小化安装的系统上编译安装Python3.12版本，包括详细步骤，遇到的问题及解决方法

2024-10-29 16:15:41 941

原创 VMware Workstation Pro 17 安装 Centos 7.9 虚拟机

使用VMware Workstation Pro 17.5.2版本进行安装CentOS 7.9虚拟机，包括安装配置步骤及截图

2024-10-23 16:32:50 974

原创 VMware Workstation Pro 17.5.2下载和安装指南

最新的VMware Workstation Pro 在 Windows 11 或 10 上下载并安装的精简且实用的步骤

2024-10-22 12:21:12 2130

原创中国股票的分类和代码

中国股票分类和交易所的代码规则

2024-10-17 15:15:44 13904

原创 Win11禁止搜索栏查找互联网内容

关闭Windows 11，Win11的搜索框查找互联网内容的方式，并亲测可行

2024-09-30 22:18:37 10258 9

Linux操作系统笔记

学习Linux操作系统的笔记,主要包括操作系统相关的基础概念和常用命令的记录。都是个人亲自记录的,属于个人笔记参考,出现问号的表示有疑问之处,如果有不对的还请提出意见。

2019-03-29

Hadoop使用笔记

这是鄙人在学习和使用Hadoop过程中记录的内容，可能不适合很多人，仅提供参考，如有问题也可提出，探讨。

2020-04-22

ASCII码_含扩展(256个字符)_含解释

ASCII码表的完整版：含有基本的0-127（128个）ASCII标准字符和128-255（128）个扩展字符。在128个标准字符里有控制字符和可打印字符，文档对其进行了详细说明，看后一目了然。

2012-10-12

获取汉字拼音的首字母_C#代码

文件为一个类定义文件，类中定义了两个获取汉字（含简体中文和繁体中文）的方法，一种是把所有中文字符集合起来组成一个对照表；另一种是依照汉字在Unicode编码表中的排序来确定拼音的首字母。碰到多音字时就以常用的为准（第一种方法中可以自行更改，方法为手动把该汉字移动到对应的拼音首字母队列）使用方法为例：ChinSpell.GetChinSpell("我是中国人");//返回"我是中国人"每个汉字拼音首字母（大写）组成的字符串。

2012-10-16

Code128条码编码规则与绘制

代码中包含两个类，一个是编码规则类，一个是绘制条形码类，使用时只要生成一个DrawCode128对象即可，例如想得到一个数据"abcd12345"的Code128条形码并按图像输出：DrawCode128 dCode128 = new DrawCode128("abcd12345"); Image img=dCode128.IMGCode128()

2012-10-21

DataMax打印机指令打印_C#代码

C#写的WinForm程序，代码中包括根据编号和日期生成条码，然后生成DataMax打印机支持的打印指令DPL，然后把DPL指令发送到打印机。发送方式通过并口。本例子打印的是一维码和文本内容。

2012-10-15

DataMax打印机指令打印二维条码_C#代码

C#写的WinForm程序，代码中包括根据编号和日期生成条码，然后生成DataMax打印机支持的打印指令DPL，然后把DPL指令发送到打印机。发送方式通过并口。本例子打印的是二维条码和文本内容。二维条码中包含控制字符（如：回车）

2012-10-16

C语言宿舍管理系统

用纯C语言编写的简单的宿舍管理系统。包括文件的读写，信息的输入和输入；主要功能包括增删改、查看、检索等；输入输出在Dos界面。

2012-10-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人