- 博客(260)
- 收藏
- 关注
原创 WITH (NOLOCK) 是 SQL Server 中的一个提示
是 SQL Server 中的一个提示(hint),它告诉 SQL Server 在读取数据时不要获取共享锁。这个提示通常用于优化读取操作的性能,特别是在读取大量数据时,因为它可以减少锁的竞争,从而可能加快查询的执行速度。
2024-08-23 17:14:26 279
原创 RPM和TPM在AI模型领域的含义
综上所述,RPM和TPM在不同领域具有不同的含义,但在人工智能和机器学习领域,它们通常分别表示每分钟请求数和每分钟处理的Tokens数量,是衡量模型处理能力的关键指标。
2024-08-09 09:59:24 262
原创 百度智能云发布3款轻量级+2款场景大模型
相比ERNIE Speed,ERNIE Lite的参数量则更小,也更加适合搭载在低算力的AI加速卡上处理推理任务,在兼顾模型效果与推理性能的同时,大幅降低客户落地应用成本。ERNIE Speed作为三款轻量级大模型中的“大个子”,推理场景下拥有最高128k的上下文长度,在处理知识问答等任务时,能够更好的处理上下文的依赖关系,生成更加连贯和准确的预测或回答。同时,针对特定场景可以将ERNIE Speed作为基座模型进行精调,模型效果可以追平甚至超过旗舰级大参数规模大模型,效价比大幅提升。
2024-08-09 09:04:20 801 1
原创 常见的会计科目编号,可能因企业而异
根据中国的企业会计准则,常见的会计科目编号如下所示。请注意,这些编号可能因企业而异,但通常遵循类似的结构和逻辑。
2024-08-07 10:37:45 293
原创 当一个字段包含多个级别的信息时如何进行数据统计?
当一个字段包含多个级别的信息时(例如地区信息可能包含国家-省份-城市-区县等多个级别),进行数据统计时需要考虑如何根据不同的级别进行分组和汇总。这里我将给出一个基本的框架来说明如何进行这样的统计。假设我们有一个销售数据表Sales,其中包含一个多层次的地区字段Region。每级之间可能用分隔符(如点号)或者固定长度来区分。
2024-08-05 14:34:25 343 1
原创 原子指标、衍生指标、派生指标的区别
不加任何修饰词的指标就是原子指标,也叫度量,一般存在于olap表中,涉及聚合操作,例如订单量,用户量的等等。原子指标=业务过程(动作)+度量,如支付(事件)金额(度量),交易笔数、交易金额、交易用户数等。例如:近7天订单量,近7天北京市的订单量,近1个月北京市的新增用户数,近7天的订单成交率等等。具体的说,在原子指标上进行加减乘除或者修饰词的限定等等都可以认为是衍生指标,比如客户数量是一个原子指标,平均客户数据是衍生指标。简单讲衍生指标是利用公式二次计算出来的指标,即衍生指标=原子指标+时间周期+修饰词。
2024-08-02 09:07:41 374
原创 GitLab Runner作为CI/CD
CI()持续集成,CD()持续部署(也包含了持续交付的意思)。CD 指的是在我们 CI 流程通过之后,将代码自动发布到服务器的过程,这个过程也是自动化的。在开发人员提交代码之后,会触发 gitlab 的 CI 流水线。也就是上图的 CI PIPELINE,也就是中间的部分。在 CI 流水线中,我们可以配置多个任务。比如上图的 build、unit test、integration tests 等,也就是构建、单元测试、集成测试等。在 CI 流水线都通过之后,会触发 CD 流水线。
2024-07-30 13:09:13 642
原创 查看linux版本命令
如果你的发行版支持 LSB (Linux Standard Base),可以使用。这些命令会分别输出发行版名称和版本号。: 这个命令可以显示与 CPU 相关的详细信息,其中包括了内核版本等。: 在一些基于 systemd 的系统中,可以使用。: 大多数 Linux 发行版都会在。请根据你的具体需求选择合适的命令执行。命令可以获取内核的信息。文件来描述系统版本。命令来查看系统信息。
2024-07-29 09:53:09 428
原创 Minio多主机分布式 docker-compose 集群部署
对象存储服务(Object Storage Service,OSS)是一种海量、安全、低成本、高可靠的云存储服务,适合存放任意类型的文件。容量和处理能力弹性扩展,多种存储类型供选择,全面优化存储成本。当然 Minio 除了直接作为对象存储使用,还可以作为云上对象存储服务的网关层,无缝对接到 Amazon S3、MicroSoft Azure。Minio 是个基于 Golang 编写的开源对象存储套件,虽然轻量,却拥有着不错的性能。
2024-07-25 15:19:22 819
原创 ES分词学习
所以,如果两条文档分别包含“天按门”和“天安门”,则倒排索引中会同时存在这两个词的条目,分别指向包含它们的文档。所以,总结来说,如果你在同一个索引中写入了两条不同的文档,每条文档中包含不同的关键词,这些关键词的索引条目不会相互覆盖,而是各自独立存在于倒排索引中。当你在一个索引中写入两条不同的文档,如“我在北京天按门”和“我在北京天安门”,每条文档会被独立分析和建立索引,它们之间的内容不会相互影响或覆盖。每个词语的出现都会被独立跟踪,除非你在更新某条具体文档时修改了其内容,从而改变了该文档对应的索引条目。
2024-07-24 17:47:51 143
原创 配置三个Spring Boot应用并通过Nginx进行反向代理 讨论中
这样,你就有了三个通过Nginx反向代理的Spring Boot应用,每个应用都运行在不同的容器中,并且可以通过各自的路径前缀访问。确保每个Spring Boot应用都有不同的端口号。例如,你可以设置第一个应用监听8080端口,第二个监听8081端口,第三个监听8082端口。然后分别为每个应用构建Docker镜像,使用不同的Dockerfile或者在同一个Dockerfile中通过ARGs参数来区分不同应用的构建。编辑Nginx配置文件,使每个Spring Boot应用都有自己的。
2024-07-23 15:22:56 453
原创 docker搭建ES 8.14 集群
1、之前已搭建一台单机版的dockerES集群 参见2、现在需要重新搭建为docker ES集群 准备新搭建3个点一、准备工作提前开放三台服务器的9200、9300端口,需要配置kibana的服务器额外开放5601端口。只需要配置一个kibana即可连接es集群。创建es网卡。
2024-07-22 10:09:58 652 2
原创 流式接口的自定义输出处理
问题描述:之前的流式接口 需要通过调用大模型来生成流式接口的数据,现在需要限制对大模型的调用,节省token成本,对已匹配的答案直接输出到大模型接口即可。1、支持模拟流式接口数据格式,输出流式结果。
2024-07-19 16:31:54 206
原创 Databricks 学习
Databricks的主要竞争力在于其平台的高度整合性和先进的技术。Databricks平台能够支持多种编程语言,如Scala、Python、R等,这大大降低了用户的使用门槛。同时,其在机器学习和人工智能领域的深厚积累,使其在提供高级分析方面具有显著优势。Databricks提供一个统一的数据分析平台,整合了数据湖、数据仓库和机器学习功能。这种统一性意味着用户可以在同一个平台上进行数据的摄取、存储、处理和分析,无需在不同的系统之间迁移数据,从而减少数据丢失和错误的可能性,并提高处理效率。
2024-07-12 13:39:05 871
原创 Minio搭建文件服务器的学习
如果你需要的是一个简单且成熟的解决方案,那么使用Nginx或FileBrowser会是比较好的选择。如果你只需要基本的文件服务,Nginx可能是更轻便的选择;它提供了文件浏览、上传、下载和分享的功能,并且内置了CORS支持,非常适合管理大量的媒体文件如视频和图片。使用Docker搭建一个支持跨域访问的文件服务器可以有多种方式,具体选择哪一种取决于你的需求、资源以及对不同技术栈的熟悉程度。使用像MinIO这样的S3兼容存储系统,它可以很容易地与Docker集成,提供高性能的对象存储,同时也支持CORS配置。
2024-07-11 10:45:36 405
原创 AsyncRequestTimeoutException
这个异常通常是由于服务器端的处理时间超过了客户端允许的等待时间,或者是服务器本身的异步处理时间配置过短导致的。在Spring MVC中,当一个异步请求超过配置的最大等待时间时,会抛出。
2024-07-10 16:40:42 230
原创 ES索引模板
当你创建了一个索引模板,它会包含一系列的默认设置和映射规则,这些规则会在满足一定条件的新索引被创建时自动应用。总结来说,索引模板是一种策略,它允许你预设一组设置和映射,以便在创建符合特定命名模式的新索引时自动应用这些预设。但是,需要注意的是,如果在创建索引时显式指定了某些设置或映射,那么这些显式指定的值将优先于模板中的值。此外,一旦索引已经被创建,索引模板的更改将不会影响到已经存在的索引。的索引时,该模板将会被应用,从而自动配置索引的设置和映射。,那么当你尝试创建一个确切名称为。开头的索引都会应用该模板。
2024-07-10 13:49:48 311
原创 文心一言的流式接口数据进行处理 增加属性
需求:需要对文心一言的流式接口数据进行处理 增加属性。增加了 sessionId的属性。// 序列化bean并发送。
2024-07-10 11:13:19 515
原创 OCR技术主要用于自动化文本数据的录入
OCR技术主要用于自动化文本数据的录入,例如将纸质文档、书籍、报纸、表单或其他印刷材料转换为数字文本文件。这在文档管理、数据录入、图书馆数字化、历史档案保护等领域有广泛应用。随着人工智能和机器学习的进步,现代OCR软件的准确性和复杂性都有了显著提升,能够处理手写文本、多语言文本以及复杂的文档布局。这是一种技术,允许电子设备如扫描仪或数码相机读取文档中的文本,通过检测和分析文本的暗和亮的模式来识别字符的形状,然后将这些形状转换为可被计算机处理的文本格式。
2024-07-04 10:37:38 581
原创 ES 索引改名
API,可以更方便地进行索引的重命名和迁移,但具体的使用方法和注意事项需要参考官方文档。不过,截至我最后一次更新知识(2023年初),直接的索引重命名API并未在文档中提及,因此以上方法仍然适用。请注意,这些操作应该在低峰时段执行,以减少对生产环境的影响。同时,在删除旧索引之前,一定要确保新索引中的数据完整无误。:最后,确保你的应用程序或其他依赖于这个索引的服务指向新的索引名称。:首先,你需要创建一个新的索引,这个索引将是你原索引的新名字。:确认新索引创建成功并验证数据完整后,可以安全地删除旧索引。
2024-07-03 17:07:51 935
原创 HTML文本内容 转化为纯文本
<span style=\"font-family: 思源黑体 CN Normal;"<p class=\"MsoNormal\"><span style=\"font-family: 思源黑体 CN Normal;/*String htmlContent = "<p class=\"MsoNormal\"><span style=\"font-family: 思源黑体 CN Normal;\">1、应用场景</span>
2024-07-01 15:24:09 350
原创 恢复 IntelliJ IDEA 中消失的菜单栏
在出现的界面中,确认是否进入了“View”(视图)> “Appearance”(外观)设置。在这里,确保 “Main Menu” 选项已被勾选。如果有“Toolbar”选项并且你也希望恢复工具栏,同时将其勾选。完成以上步骤后,菜单栏应该会重新出现在 IntelliJ IDEA 的界面上。如果问题仍然存在,尝试重启 IDE 或检查是否有任何第三方插件影响了界面显示。,然后从搜索结果中选择与“Main Menu”相关的选项。这通常会直接带你到恢复菜单栏的设置位置。键打开全局搜索对话框。
2024-06-27 13:44:43 664
原创 GIT 基于master分支创建hotfix分支的操作
分支到远程仓库,这样其他团队成员可以看到你的更改。: 当你确认所有合并都已完成,可以安全地删除。: 首先,确保你的工作区是最新的,并且你在。: 将你的更改添加到暂存区并提交。上进行必要的bug修复工作。分支同步,你可能也需要合并到。分支,你需要先切换过去。分支也将基于最新的代码。选项创建并立即切换到新的。分支是最新的,这样你的。
2024-06-27 11:10:07 459
Doris 1.2.4.1 Dockerfile制作 init-fe.sh 和 init-be.sh
2023-08-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人