自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(358)
  • 收藏
  • 关注

原创 mysql 数据导出到文件

mysql -u 用户名 -p --batch --silent 数据库名 -e "SELECT kid, title, question FROM knowledge_base_faq_batch WHERE label = '帮助中心FAQ' LIMIT 1000;mysql -u 用户名 -p 数据库名 -e "SELECT kid, title, question FROM knowledge_base_faq_batch WHERE label = '帮助中心FAQ' LIMIT 1000;

2025-02-06 11:35:27 420

原创 Hanlp的学习

其中数据分为词典和模型,其中词典是词法分析必需的,模型是句法分析必需的,用户可以自行增删替换,如果不需要句法分析等功能的话,随时可以删除。

2025-01-17 09:19:23 153

原创 从AI原理到模型演进及代码实践 的学习二

Transformer仅一个Encoder模块就可以工作,可以处理信息抽取、识别、主体识别等任务,比如 BERT(Bidirectional Encoder Representations from Transformers)是只使用了Encoder,可以从给定的文本段落中找到并提取出回答问题的文本片段,目标是识别或检索信息,而不是生成新的文本序列。

2025-01-16 10:38:19 177

原创 从AI原理到模型演进及代码实践 的学习一

初探神经网络(原理)上图就是一个人脑的神经元,由多个树突、轴突和细胞核构成,其中树突用来接收电信号、经细胞核加工(激活)信号、最后由轴突输出电信号,人脑大概860亿个神经元细胞,突触相互连接,形成拓扑结构。每个神经元大约有1163~11628个突触,突触总量在14~15个数量级,放电频繁大约在400~500Hz,每秒最高计算量大约40万亿次,换算成当前流行词汇,大脑大概等价于100T参数模型(140B逊爆了),而且有别当前大模型中ReLU激活函数,大脑惰性计算是不用算0值的,效率更高。

2025-01-16 09:15:56 713

原创 CNCF云原生计算基金会

CNCF旨在促进和支持开源技术的发展,特别是那些支持云原生(cloud native)应用开发、部署和运行的技术栈。CNCF还负责组织一些主要的会议和活动,如KubeCon + CloudNativeCon系列,以汇集成千上万的技术专家、开发者和爱好者共同讨论云原生技术的最新发展和最佳实践。- **Kubernetes**:一个用于自动化部署、扩展和管理容器化应用程序的开源平台。- **Prometheus**:一个开源的监控系统和报警工具包。- **gRPC**:一个高性能、开源和通用的RPC框架。

2025-01-15 16:39:28 583

原创 APM服务端

一些知名的APM工具供应商包括Dynatrace、New Relic、AppDynamics等,它们提供了全面的APM解决方案,涵盖了从前端到后端的全方位性能监控。5. **诊断工具**:提供深入的问题诊断功能,如分布式追踪、堆栈跟踪等,以加速故障排除过程。2. **数据分析与处理**:对收集的数据进行清洗、聚合和分析,以便发现性能趋势和异常。3. **可视化展示**:提供直观的仪表盘和报告,便于理解和跟踪应用性能指标。1. **数据采集**:通过在应用程序中部署的代理或探针收集性能数据。

2025-01-15 15:08:41 178

原创 Apache PAIMON 学习

Paimon在最新的版本当中也会推出Paimon object Table,希望通过Object Table管理非简化的数据,包括在OOS或者HDFS上的图片,视频,文件,音频之类的文件。拿到这些原数据之后就可以通过包括pySpark ,Flink SQL ,Spark SQL 等,通过这种结构化的处理,读表知道有哪些文件,这些文件的文件大小可以做一些过滤,也可以把这些文件读出来做一些处理,所以通过这样的方式把非结构化和结构化的SQL的处理,或者结构化的计算引擎的处理结合到一起,让整个结构化的处理更简单。

2025-01-14 17:03:17 1216

原创 OCI 通常指的是开放容器计划(Open Container Initiative),这是一个轻量级、开放的治理结构(即Linux基金会的一个项目),旨在围绕容器格式和运行时制定行业标准。

OCI 通常指的是开放容器计划(Open Container Initiative),这是一个轻量级、开放的治理结构(即Linux基金会的一个项目),旨在围绕容器格式和运行时制定行业标准。OCI的目标是推动容器技术的标准化,使得不同的组织和技术能够更好地协作,减少供应商锁定的风险,并促进容器技术的创新和发展。2. **运行时规范(Runtime Specification)**:描述了容器运行时的行为,也就是如何在宿主机操作系统上创建并运行一个或多个隔离的环境(即容器)。

2025-01-14 16:19:32 443

原创 CRD是Custom Resource Definitions(自定义资源定义)的缩写,这是Kubernetes中的一个概念。

截至2025年,随着越来越多的企业和组织采用Kubernetes作为其基础设施的核心组件,CRD的使用也变得更加广泛和成熟,支持更加复杂的应用场景和服务模式。3. **编写控制器**:通常情况下,仅定义CRD是不够的,还需要编写一个控制器来监听这些自定义资源的变化,并根据其状态执行相应的操作。1. **定义CRD**:首先需要创建一个YAML文件来定义你的CRD。4. **使用自定义资源**:一旦CRD和控制器就位,就可以像使用任何其他Kubernetes资源一样创建、更新和删除这些自定义资源了。

2025-01-14 16:18:22 128

原创 WebAssembly(简称Wasm)是一种用于基于栈的虚拟机的二进制指令格式,它作为便携式编译目标,允许高级语言如C、C++和Rust等被编译成可以在网页上高效运行的代码。

6. **标准和浏览器支持**:WebAssembly是一个开放标准,由W3C的WebAssembly工作组开发维护。所有主流浏览器都已实现了对WebAssembly的支持。5. **易于集成**:WebAssembly可以直接从JavaScript调用,并且可以像操作普通JavaScript对象一样操作WebAssembly导出的功能。1. **高性能**:WebAssembly代码可以非常接近原生应用的速度执行,这使得它非常适合计算密集型的应用程序,如游戏、视频编辑和CAD应用等。

2025-01-14 16:17:19 390

原创 WebAssembly

6. **标准和浏览器支持**:WebAssembly是一个开放标准,由W3C的WebAssembly工作组开发维护。所有主流浏览器都已实现了对WebAssembly的支持。5. **易于集成**:WebAssembly可以直接从JavaScript调用,并且可以像操作普通JavaScript对象一样操作WebAssembly导出的功能。1. **高性能**:WebAssembly代码可以非常接近原生应用的速度执行,这使得它非常适合计算密集型的应用程序,如游戏、视频编辑和CAD应用等。

2025-01-14 16:02:37 254

原创 LDS(Listener Discovery Service)、RDS(Route Discovery Service)和CDS(Cluster Discovery Service)

LDS(Listener Discovery Service)、RDS(Route Discovery Service)和CDS(Cluster Discovery Service)是Envoy代理用于动态配置的重要xDS协议之一。在Envoy中,集群是指一组逻辑上相同的上游服务实例,Envoy将流量路由到这些实例。通过CDS,Envoy可以获取集群成员的信息,以及如何与这些成员进行通信的配置。通过这些xDS API,Istio可以动态地管理和调整服务网格内服务之间的通信方式,提高系统的灵活性和可维护性。

2025-01-14 14:02:22 134

原创 人工智能学习

模型构建与训练(约 1 周):了解如何使用 TensorFlow 的高级 API(如 Keras,它集成在 TensorFlow 中,方便快捷地构建模型)来构建常见的神经网络模型(如简单的多层感知机用于分类或回归任务),掌握模型的编译(指定损失函数、优化器、评估指标等)、训练(传入训练数据进行多轮迭代训练)以及预测(对新的数据进行预测输出)的完整流程,通过一个小型的数据集(如 MNIST 手写数字数据集的简化版本)进行模型构建和训练的实践操作,观察训练过程中的损失值、准确率等指标变化情况。

2025-01-14 11:36:49 607

原创 ServiceEntry 是一种用于将外部服务引入到Istio内部的服务注册表中的配置资源。

通过定义 `ServiceEntry`,你能够让Istio管理的服务能够与网格外部的服务进行通信,这对外部服务的调用、访问外部API或数据库等场景非常有用。这个例子中,我们定义了一个名为 `external-httpbin` 的 `ServiceEntry`,它允许网格内的服务通过HTTP协议访问位于 `httpbin.org` 的外部服务,并且使用DNS进行地址解析。- **location**:指示服务的位置。1. **访问外部服务**:允许网格内的服务连接到未部署在服务网格内的外部服务。

2025-01-14 10:11:59 362

原创 EDS通常指的是“Endpoint Discovery Service”(端点发现服务)

Envoy代理作为每个服务实例的sidecar,使用EDS来获取其需要访问的所有服务的端点信息。EDS允许服务网格中的服务动态地发现并连接到其他服务的可用实例(即端点),这对于构建可扩展、可靠的应用程序至关重要。- **健康检查集成**:EDS通常与健康检查机制结合使用,只有被标记为健康的端点才会被包含在返回给客户端的列表中,这有助于提高系统的整体可靠性。- **动态更新**:EDS能够实时或接近实时地向客户端提供最新的服务端点列表,当有新的服务实例加入或者现有实例离开时,它会自动更新这些信息。

2025-01-14 09:30:25 200

原创 CIDR(Classless Inter-Domain Routing,无类别域间路由)是一种用于分配和路由IP地址的方法

CIDR摒弃了传统的基于类(A类、B类、C类等)的IP地址分配方式,允许将IP地址块按照任意大小进行划分,而不是局限于固定的8位、16位或24位边界。这通过在IP地址后面附加一个斜杠和一个数字(例如:192.0.2.0/24)来表示,这个数字指定了网络前缀的长度,即地址中多少位用于网络部分,剩余的部分则用于主机地址。CIDR不仅有助于更有效地利用IP地址空间,还简化了路由聚合,减少了互联网核心路由器中的路由表大小,提高了路由效率。此外,CIDR也是现代IP地址管理(包括IPv6)的基础。

2025-01-14 09:10:07 128

原创 workloadSelector 是一种在服务网格(如Istio)中用于选择特定工作负载实例的机制。

workloadSelector` 是一种在服务网格(如Istio)中用于选择特定工作负载实例的机制。通过使用标签选择器,可以指定一组带有特定标签的工作负载实例(例如Pods),使得只有匹配这些标签的工作负载才会受到关联规则或策略的影响。例如,在Istio中,你可能会配置一个 `DestinationRule` 或者 `VirtualService` 来使用 `workloadSelector`,以便仅将特定的流量管理规则应用到具有特定标签的应用实例上。

2025-01-14 08:51:38 308

原创 windows上如何通过端口号关闭进程服务

这将列出所有使用8088端口的连接信息,最后一列是进程ID (PID)。输入PID后关闭服务。

2025-01-10 13:59:47 71

原创 通过 crontab 每天定时启动一个 Java JAR 包并调用特定的 `main` 方法

1. **确保环境变量配置正确**:首先,确保你的系统上已经安装了 Java,并且 `JAVA_HOME` 环境变量以及 `PATH` 环境变量都已正确设置,这样你可以从命令行任何地方使用 `java` 命令。3. **编辑 crontab 文件**:使用 `crontab -e` 命令来编辑当前用户的 crontab 文件。7. **检查日志**:等到预定的时间过后,检查日志文件 `/opt/onlinetask/dataChatgpt.log` 以确保程序按预期启动并且没有遇到任何错误。

2025-01-07 10:11:34 584

原创 SubjectAltName(简称 SAN)是 X.509 数字证书中的一个扩展字段,它允许在单个证书中指定多个身份标识。

**通配符证书**:虽然通配符证书(如 `*.example.com`)可以覆盖整个子域,但有时您可能还需要包括不在此通配符模式下的额外域名。- **IP 地址绑定**:某些情况下,特别是当服务没有关联的 DNS 名称时,可以通过 SAN 中的 IP 地址来绑定 SSL/TLS 证书。- **内部和外部域名**:对于既提供公共互联网服务又提供内部网络服务的组织来说,SAN 可以同时包含面向公众的域名和仅供内部使用的域名。2. **IP Address**: 指定一个或多个 IP 地址。

2025-01-06 16:20:17 220

原创 FQDN 是 “Fully Qualified Domain Name“(完全限定域名)的缩写。它是指在互联网上唯一标识一台计算机或其他设备(如服务器、打印机等)的完整域名。

在某些情况下,FQDN 还可能包含更多的子域名层级,例如 `mail.subdomain.example.com`,这里 `subdomain` 是 `example.com` 下的一个子域名,而 `mail` 则是该子域下的主机名。3. **顶级域名 (TLD)**:这是域名层次结构中最右边的部分,指明了域名所属的一般类别,如商业 (`com`)、教育 (`edu`)、政府 (`gov`) 等。继续上面的例子,`example` 是二级域名,而 `.com` 是顶级域名 (TLD)。

2025-01-06 15:47:32 250

原创 SNI(Server Name Indication,服务器名称指示)是TLS/SSL握手过程中的一项扩展,它允许客户端在初始连接时告知服务器它想要连接的具体主机名。

**隐私问题**:虽然SNI本身是加密通信的一部分,但在TLS握手的早期阶段,SNI字段是以明文形式传输的,这意味着任何能够监视网络流量的人都可以看到用户试图访问的主机名。- **旧版客户端不支持**:一些较老的浏览器和操作系统可能不支持SNI,导致这些客户端无法正确访问使用SNI的HTTPS站点。- **成本效益**:由于不需要为每个域名分配单独的IP地址,使用SNI可以显著降低运营成本,特别是在IPv4地址资源有限的情况下。- 服务器运行的是支持SNI的操作系统和Web服务器版本。

2025-01-03 11:26:43 494

原创 TLS(传输层安全,Transport Layer Security)是用于在网络上提供通信安全的一种加密协议。

TLS(传输层安全,Transport Layer Security)是用于在网络上提供通信安全的一种加密协议。它是SSL(安全套接层,Secure Sockets Layer)的继任者,旨在确保两个应用程序之间数据传输的隐私性、完整性和可靠性。TLS广泛应用于Web浏览器和服务器之间的HTTPS连接,但也可以用于其他类型的客户端-服务器通信。### TLS 的主要功能1. **加密**:TLS 使用对称加密和非对称加密相结合的方法来保护数据。在会话开始时,客户端和服务器通过非对称加密交换密钥,之后

2025-01-03 11:22:31 688

原创 301重定向

**更新内部链接**:除了设置301重定向外,还应该更新网站内部的链接,以直接指向新的URL,这样可以减少对服务器的额外负担并提高用户体验。- **缓存机制**:一旦客户端收到301响应,通常会缓存这个信息,以后再访问相同的URL时会直接跳转到新的URL,而不会再次查询服务器。- **合并内容**:当多个页面的内容被合并为一个页面时,可以使用301重定向将这些页面的流量引导至合并后的新页面。- **域名变更**:如果你需要更换域名,可以设置301重定向,将旧域名的所有页面重定向到新域名对应页面。

2025-01-03 10:26:36 368

原创 HTTP Scheme 通常指的是在 URL 中用于指定使用 HTTP 协议的方案(scheme)

**https**:表示使用安全的超文本传输协议 (HyperText Transfer Protocol Secure),即带有加密的 HTTP,来访问资源。- **混合内容**:当在一个 HTTPS 页面上加载 HTTP 资源时,这被称为“混合内容”,可能会被现代浏览器阻止,因为它可以破坏页面的安全性。- **ws** 和 **wss**:分别代表 WebSockets 协议及其安全版本,用于双向通信。- **data**:用于内联数据,例如直接在 URL 中嵌入图像或文本内容。

2025-01-03 10:03:24 860

原创 HTTP、HTTP/2 和 gRPC 是网络通信协议或基于这些协议的技术,它们之间有显著的区别

对于微服务架构或者需要高效、低延迟、强类型接口的服务间通信,gRPC可能是更合适的选择,因为它提供了更强的特性和更好的性能,特别是对于移动应用和高负载环境。HTTP、HTTP/2 和 gRPC 是网络通信协议或基于这些协议的技术,它们之间有显著的区别。RPC框架:gRPC是远程过程调用的一种实现,它使客户端可以直接调用不同服务器上的服务,就像调用本地对象一样。每个请求建立新的连接(HTTP/1.0)或持久连接(HTTP/1.1),但同一时间只能处理一个请求。版本:HTTP/1.0 和 HTTP/1.1。

2025-01-03 09:46:48 548

原创 正则表达式中,`$1` 是一个反向引用(backreference),它代表了匹配过程中捕获的第一个子表达式(即第一个括号内的内容)

这里的 `(销量|销售额|的)` 是一个捕获组,它可以匹配 "销量"、"销售额" 或 "的"。- 如果输入是 `"台湾销售额"`,匹配结果是 `"台湾销售额"`,捕获组的内容是 `"销售额"`,所以替换后的结果是 `"{省份}销售额"`。- 如果输入是 `"台湾销量"`,匹配结果是 `"台湾销量"`,捕获组的内容是 `"销量"`,所以替换后的结果是 `"{省份}销量"`。- 如果输入是 `"台湾的"`,匹配结果是 `"台湾的"`,捕获组的内容是 `"的"`,所以替换后的结果是 `"{省份}的"`。

2024-12-30 15:33:42 532

原创 生成的附件文件的代码片段

a href="path/to/系统操作手册.chm" download>点击这里下载系统操作手册。

2024-12-24 08:41:57 155

原创 更新数据库表数据的操作

【代码】更新数据库表数据的操作。

2024-12-20 10:48:00 114

原创 在jar目录下加载指定目录下的json文件

【代码】在jar目录下加载指定目录下的json文件。

2024-12-03 16:47:33 113

原创 多模态(Multimodal)通常指的是系统或过程能够处理、整合和理解来自两个或多个不同模式(modality)的信息。

模态是事物的一种表现形式,多模态通常包含两个或者两个以上的模态形式,是从多个视角出发对事物进行描述。生活中常见多 模态表示,例如传感器的数据不仅仅包含文字、图像,还可以包括与之匹配的温度、深度信息等。随着技术的进步,多模态方法正在越来越多的应用领域中得到应用,并推动了跨学科研究的发展。传感器数据:融合来自不同类型的传感器(如温度、湿度、加速度计、陀螺仪等)的数据,用于环境监测、健康监控、自动驾驶等领域。多模态模型大一统成趋势:2022年8月,微软推出BEiT-3模型,引领图像、文本、多模态迈向大一统。

2024-12-02 09:09:44 286

原创 验证 kubelet 服务已经停止并且不再生成错误日志

通过以上步骤,你应该能够确认kubelet服务已经停止并且不再生成错误日志。如果一切正常,你将看到kubelet服务状态为inactive,并且没有任何新的日志条目或网络连接尝试。希望这些建议对你有所帮助!

2024-11-28 15:37:07 308

原创 查看Linux系统日志

grep -C 5 "systemd-shutdown" /var/log/messages

2024-11-28 11:19:28 147

原创 Java编译的版本异常

【代码】Java编译的版本异常。

2024-11-22 16:44:25 295

原创 Logging system failed to initialize using configuration from ‘classpath:log4j2-test.xml‘

- 去掉springboot默认配置 -->

2024-11-19 14:58:18 371

原创 减少模型的过度拟合风险

减少模型的过度拟合风险是机器学习和统计建模中的一个重要问题。正则化是一种常用的防止过度拟合的技术,它通过在损失函数中添加一个惩罚项来限制模型的复杂度。交叉验证是一种评估模型性能的方法,通过将数据集分成训练集和验证集,可以评估模型在未见过的数据上的表现。多项式的阶数越高,模型的复杂度就越高。通过减少多项式的阶数,可以降低模型的复杂度,从而减少过度拟合的风险。如果数据中有多个特征,可以使用特征选择技术来选择最相关的特征,减少模型的复杂度。更多的数据可以帮助模型更好地学习数据的真实模式,减少过度拟合的风险。

2024-11-18 13:47:01 164

原创 FQDN(Fully Qualified Domain Name,完全限定域名)是指能够唯一标识互联网上一台主机的域名

FQDN(Fully Qualified Domain Name,完全限定域名)是指能够唯一标识互联网上一台主机的域名。FQDN 包括主机名、域名及其顶级域,它提供了从特定主机到顶级域名服务器的完整路径。一个有效的 FQDN 至少包含三级域名,即主机名、二级域名和顶级域名。

2024-11-07 08:38:54 517

原创 复合字段(Composite Field),也被称为组合字段或多值字段,是指在一个数据库表中由多个部分组成的一个字段

复合字段(Composite Field),也被称为组合字段或多值字段,是指在一个数据库表中由多个部分组成的一个字段。JSON/XML格式:使用JSON或XML等结构化数据格式来表示复合字段,这样可以在一定程度上保持数据的结构化特性,便于解析和操作。总之,复合字段是一个强大的工具,可以帮助更有效地组织和管理数据,但在设计数据库结构时应根据具体需求谨慎选择是否使用以及如何使用。独立列:虽然严格意义上这不再是复合字段,但有时候为了简化查询和提高效率,会选择将复合字段拆分成多个独立的列存储。

2024-11-07 08:37:12 298

原创 TLS(Transport Layer Security,传输层安全协议)

TLS 是 SSL(Secure Sockets Layer,安全套接层)的后继者,SSL 曾是广泛使用的加密协议,但在 TLS 出现后,由于发现的安全漏洞,SSL 已经不再被推荐使用。握手阶段:客户端和服务器开始建立连接,交换支持的TLS版本、加密算法等信息,并协商出一个双方都支持的加密方法。密钥交换:基于协商好的加密算法,双方通过特定的方式交换或生成会话密钥,这个过程通常是通过公钥加密技术完成的。加密通信:一旦会话密钥建立起来,所有后续的数据交换都会被加密,确保了数据的安全传输。

2024-11-07 08:35:20 296

原创 视频播放时偶现的错误

这个错误是因为浏览器的安全策略限制了自动播放视频的功能。为了防止不必要的音频干扰用户,大多数现代浏览器(如Chrome、Firefox等)默认情况下不允许网页在没有用户交互的情况下自动播放带有声音的媒体内容。即使您在<video>标签中设置了autoplay和muted属性,某些情况下仍然可能会因为用户的交互不够明显而阻止视频自动播放。这个错误通常发生在使用Service Worker或者其他缓存机制时,尝试执行不支持的操作。错误2:ERR_CACHE_OPERATION_NOT_SUPPORTED。

2024-11-01 10:03:28 684

中国城市经纬度和部分城市邮编

中国城市经纬度和部分城市邮编

2024-01-05

大数据平台集群整体规划文档

大数据平台集群整体规划文档

2023-10-09

大数据集群规划和配置文档

大数据集群规划和配置文档

2023-08-14

大数据集群规划和配置文档

大数据集群规划和配置文档

2023-08-14

Doris 1.2.4.1 Dockerfile制作 init-fe.sh 和 init-be.sh

Doris 1.2.4.1 Dockerfile制作 init-fe.sh 和 init-be.sh

2023-08-03

Doris 1.2.4.1 Dockerfile制作 init-fe.sh

Doris 1.2.4.1 Dockerfile制作 init-fe.sh

2023-08-03

Doris 1.2.4.1 Dockerfile制作 init-be.sh

Doris 1.2.4.1 Dockerfile制作 init-be.sh

2023-08-02

Dinky plugins的依赖jar包

Dinky plugins的依赖jar包

2023-06-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除