自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

XuXuemin的专栏

还互联网一片净土

  • 博客(352)
  • 资源 (8)
  • 收藏
  • 关注

原创 AI大模型的实际应用

主要介绍AI的实际使用场景,普通用户使用AI的方式主要是AIGC产品,企业应用一般是使用开源大模型训练或微调自己的模型,又称为定制化大模型,这是当前AI落地的主要路径。

2025-12-04 11:23:08 219

原创 TiDB数据库组件介绍和优缺点总结

TiDB是PingCAP开发一款国产开源数据库,活跃度比较高。文章介绍了其主要组件,并总结了数据库的优点和缺点。

2025-11-26 11:09:43 368

原创 ClickHouse数据库参数prefer_column_name_to_alias的作用

ClickHouse可用参数prefer_column_name_to_alias启用或禁用在查询表达式和子句中使用原始列名而不是别名。尤其是在别名与列名相同的情况下。

2025-11-18 15:27:00 200

原创 ClickHouse数据库参数join_use_nulls的作用

ClickHouse可用参数join_use_nulls设置JOIN行为的类型。在合并表时,可能会出现空值,即左表或右表有NULL值。ClickHouse根据此设置以不同的方式填充它们。

2025-11-17 17:21:32 259

原创 ClickHouse查看数据库、表、列等元数据信息

ClickHouse提供系统表查询数据库的状态,包括服务器环境、数据库信息、表信息、列信息、函数、配置等信息,系统表位于system数据库中。另外ClickHouse提供了兼容SQL标准的information_schema系统数据库,用于查看数据库对象的元数据。

2025-11-12 11:06:41 622

原创 ClickHouse数据库的表引擎

ClickHouse提供4类表引擎,分别支持不同场景。包括Log、MergeTree、Special、Integrations系列引擎。对各类引擎进行介绍和总结。最后举例说明建表的SQL脚本。

2025-10-30 17:07:09 303

原创 Clickhouse数据库的介绍

Clickhouse数据库的特点和优势介绍,包括Clickhouse的结构原理、查询和写入性能、分布式架构、适用场景等的介绍。

2025-10-29 11:48:11 574

原创 Python写入PostgreSQL表的三种实现方法

介绍使用Python的psycopg2库写入PostgreSQL表的方法,主要包括INSERT INTO语句方法;使用pandas.DataFrame的to_sql方法直接写入;COPY高性能写入方式。COPY的优点是速度快,资源开销低。缺点是不支持更新逻辑(比如UPSERT),事务回滚成本大。所以一般大数据量(比如单次几十上百万以上量级)场景用COPY,其他场景用前两种方式即可。

2025-09-26 11:11:07 417

原创 Python读取MongoDB的JSON字典和列表对象转为字符串

使用Python的pymongo库连接和读取Mongo的集合或表,读取的每个结果为一个JSON对象。实例代码中将解析结果转化为DataFrame类型,一级属性作为列名,如果属性值为字段和列表,即JSON内嵌对象,则解析为JSON字符串。

2025-09-25 11:37:02 495

原创 Flink-SQL计算中的维表连接使用举例

Flink-SQL中,事实表(又称为流表)和维表连接的计算规则与两条流连接是不同的,两条流连接必须有时间属性和窗口的约束,否则状态会无限膨胀。维表一般是静态或缓慢变化的,Flink不会把维表全部加载进状态,而是连接时查询当前ID的最新值,也可设置缓存进行延迟优化等。

2025-09-24 10:28:56 371

原创 Flink-SQL通过过滤-解析-去重-聚合计算写入到MySQL表

数据源来自于Kafka的Json结构数据,数据结构为源头不断更新的小时报表,Flink的任务是消费Kafka主题数据,然后经过过滤、解析、去重、聚合等计算,最后将结果写入到MySQL表中。

2025-09-23 10:06:24 383

原创 大模型与人工智能的关系和区别

大模型与人工智能的区别与联系,包括NLP、LLM、AIGC、AGI、GPT、ChatGPT等的介绍及应用范畴等。同时列举了主要AI产品,比如DeepSeek,ChatGPT、豆包、通义千问等。

2025-09-22 12:01:18 267

原创 汽车智能驾驶技术现状

汽车智能驾驶(Autonomous / Automated Driving)技术在研发、法规、商业化三个层面都有不少进展,但也正面临若干挑战。自动驾驶技术和Level 0 至 Level 5分级系统的介绍。国内外厂商的介绍,Alphabet的Waymo公司产品RoboTaxi;通用电气(GM,General Motor)的Cruise;特斯拉的Autopilot;亚马逊的Zoox;百度的Apollo在国内已经属于领先地位。

2025-09-19 11:44:32 589

原创 苹果采用的台积电3纳米工艺处理器的演变

台积电3纳米工艺处理器的技术架构和发展历程,包括台积电主要客户苹果的芯片发布,还有和三星的芯片之争等。

2025-09-18 10:05:11 980

原创 Python读取MongoDB数据并写入PostgreSQL

使用Python 3读取MongoDB数据,然后写入到PostgreSQL中,分别借助pymongo和psycopg2库。经整理和优化后以分批次读取和写入的方式较适合生产场景,并能有效应对数据量比较大的情况。

2025-09-17 10:22:30 313

原创 Spark-SQL任务提交方式

Spark-SQL任务提交方式的介绍和提交代码举例,按不同的资源管理模式分别说明。Spark-SQL的交互式模式可以按照类似hive方式写SQL代码。Spark SQL一般依赖Hive的元数据。

2025-09-11 18:43:45 384

原创 Spark中Shuffle阶段的优化方法

Spark中Shuffle阶段的优化方法,包括调整参数spark.shuffle.sort.bypassMergeThreshold控制排序,spark.shuffle.file.buffer调整缓冲区大小等策略

2025-09-10 10:19:03 544

原创 Spark提交任务的资源配置和优化

Spark 提交任务时的资源配置和优化建议,主要可调的资源配置参数包括 Driver 资源、Executor 资源以及集群管理器相关参数。配置和优化时一般结合集群硬件资源、数据规模、作业类型和作业复杂度(SQL / 机器学习) 来综合设置。

2025-09-09 10:53:21 439

原创 Hive使用Tez引擎出现OOM的解决方法

Hive使用Tez引擎出现OOM的解决方法,主要通过调整参数hive.tez.container.size解决问题

2025-09-05 10:12:43 386

原创 使用Spark计算WordCount

使用Spark引擎统计单词计数,即Word Count,主要使用map,flatmap,reduceByKey算子

2025-09-02 10:07:41 348

原创 Spark引擎中RDD的性质

Spark引擎中RDD的介绍和性质理解,RDD是Spark提供的核心抽象,是一个 分布式、不可变、带血统的对象集合。

2025-09-01 11:39:34 252

原创 Spark算子调优

Spark中可使用的调优算子函数介绍,包括mapPartition、coalesce、reduceByKey等。

2025-08-29 10:42:20 206

原创 Node.js的用途和安装方法

Node.js的介绍和安装说明,包括使用开发语言、封装的内容等。

2025-08-01 14:09:22 356

原创 PostgreSQL数据库查看表名模式注释等元数据信息

PostgreSQL数据库查看表信息,包括表名、schema、注释等信息,可通过查询PG的元数据查看

2025-06-12 10:23:05 521

原创 Excel表格VLOOKUP函数用法和举例

Excel表格中VLOOKUP函数的介绍和使用方法,包括参数的用法,参数的解释,使用举例。

2025-05-13 10:04:53 498

原创 Python中的小数和分数

介绍和举例说明了Python中的小数和分数的用法,使用模块decimal表示小数。解决浮点数缺乏精确性。使用分数需要导入模块fractions。

2025-05-06 10:04:26 266

原创 Python命名参数的使用

Python命名参数的使用介绍和举例说明

2025-04-25 17:47:38 298

原创 Python日期时间向前向后N个月及对应月初和月末

Python中的时间的加减运算,月份的起始日期和结束日期,向前向后移动的时间间隔等

2025-03-21 15:00:15 403

原创 DataGrip设置缩进空格数量

以DataGrip 2022.1为例,SQL脚本命令窗口默认缩进为4个空格改为2个空格的步骤

2025-02-09 20:44:04 487

原创 Pandas库DataFrame的filter函数用法

Pandas库DataFrame的filter函数根据指定的索引标签对数据框按行或列进行数据筛选

2025-02-09 20:31:54 760

原创 Python3转换文本文件编码格式

将文本文件的编码格式转为指定编码格式,目标文件为转码后的新文件

2024-12-16 13:47:30 389

原创 Python3字符串的连接或拼接

Python3的字符串连接或拼接方式介绍及使用,包括每种使用方法的举例说明。

2024-12-03 16:09:46 372

原创 Python3异步IO编程中协程的介绍和使用

Python3异步IO开发中协程的介绍和使用方法,包括await和async关键字的用法,多任务并发等

2024-12-01 18:06:45 451

原创 Python脚本文件开头两行#!/usr/bin/python和# -*- coding: utf-8 -*-的作用

Python脚本文件的前两行解释器和编码格式的指定方式,开头两行的使用介绍等

2024-11-29 11:31:35 809

原创 使用Java编写上传文件到HDFS代码

使用Java编写上传本地文件到HDFS上,采用事前检查,按进度上传的方式

2024-11-25 16:02:36 394

原创 Centos7.9编译安装Python3.12

在Centos 7.9最小化安装的系统上编译安装Python3.12版本,包括详细步骤,遇到的问题及解决方法

2024-10-29 16:15:41 832

原创 VMware Workstation Pro 17 安装 Centos 7.9 虚拟机

使用VMware Workstation Pro 17.5.2版本进行安装CentOS 7.9虚拟机,包括安装配置步骤及截图

2024-10-23 16:32:50 913

原创 VMware Workstation Pro 17.5.2下载和安装指南

最新的VMware Workstation Pro 在 Windows 11 或 10 上下载并安装的精简且实用的步骤

2024-10-22 12:21:12 1841

原创 中国股票的分类和代码

中国股票分类和交易所的代码规则

2024-10-17 15:15:44 11862

原创 Win11禁止搜索栏查找互联网内容

关闭Windows 11,Win11的搜索框查找互联网内容的方式,并亲测可行

2024-09-30 22:18:37 8586 9

Linux操作系统笔记

学习Linux操作系统的笔记,主要包括操作系统相关的基础概念和常用命令的记录。都是个人亲自记录的,属于个人笔记参考,出现问号的表示有疑问之处,如果有不对的还请提出意见。

2019-03-29

Hadoop使用笔记

这是鄙人在学习和使用Hadoop过程中记录的内容,可能不适合很多人,仅提供参考,如有问题也可提出,探讨。

2020-04-22

ASCII码_含扩展(256个字符)_含解释

ASCII码表的完整版:含有基本的0-127(128个)ASCII标准字符和128-255(128)个扩展字符。在128个标准字符里有控制字符和可打印字符,文档对其进行了详细说明,看后一目了然。

2012-10-12

获取汉字拼音的首字母_C#代码

文件为一个类定义文件,类中定义了两个获取汉字(含简体中文和繁体中文)的方法,一种是把所有中文字符集合起来组成一个对照表;另一种是依照汉字在Unicode编码表中的排序来确定拼音的首字母。碰到多音字时就以常用的为准(第一种方法中可以自行更改,方法为手动把该汉字移动到对应的拼音首字母队列) 使用方法为 例:ChinSpell.GetChinSpell("我是中国人");//返回"我是中国人"每个汉字拼音首字母(大写)组成的字符串。

2012-10-16

Code128条码编码规则与绘制

代码中包含两个类,一个是编码规则类,一个是绘制条形码类,使用时只要生成一个DrawCode128对象即可,例如想得到一个数据"abcd12345"的Code128条形码并按图像输出:DrawCode128 dCode128 = new DrawCode128("abcd12345"); Image img=dCode128.IMGCode128()

2012-10-21

DataMax打印机指令打印_C#代码

C#写的WinForm程序,代码中包括根据编号和日期生成条码,然后生成DataMax打印机支持的打印指令DPL,然后把DPL指令发送到打印机。发送方式通过并口。本例子打印的是一维码和文本内容。

2012-10-15

DataMax打印机指令打印二维条码_C#代码

C#写的WinForm程序,代码中包括根据编号和日期生成条码,然后生成DataMax打印机支持的打印指令DPL,然后把DPL指令发送到打印机。发送方式通过并口。本例子打印的是二维条码和文本内容。二维条码中包含控制字符(如:回车)

2012-10-16

C语言宿舍管理系统

用纯C语言编写的简单的宿舍管理系统。包括文件的读写,信息的输入和输入;主要功能包括增删改、查看、检索等;输入输出在Dos界面。

2012-10-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除