- 博客(994)
- 资源 (10)
- 收藏
- 关注
原创 OCR识别 整题识别(含公式)
要实现包含公式的整题OCR识别,需要结合图像处理、OCR文本识别、公式识别以及自然语言处理技术。通过这些步骤,可以将图像中的题目文本和数学公式准确地提取出来,并生成结构化、可编辑的文档输出。此过程可以应用在教育、出版、数学研究等领域,极大地提高工作效率。
2024-08-19 17:43:29 292
原创 模型量化方法-GPTQ
GPTQ 是一种针对大规模语言模型的先进量化技术,通过逐层量化和量化感知训练,显著减少了模型的计算和内存需求,同时保持了接近原始模型的性能。它特别适合在资源受限的环境中部署大规模模型,广泛应用于边缘计算、云计算等领域,推动了高效自然语言处理系统的发展。
2024-08-19 14:29:07 510
原创 ollama 的底层实现的架构
Ollama 的底层实现架构围绕 LLaMA 模型和 llama.cpp 框架展开,通过使用轻量级实现、高效的内存管理、量化技术、硬件加速支持等手段,使得大型语言模型能够在资源受限的环境中高效运行。框架设计考虑了灵活性和扩展性,支持多种平台和应用场景,能够满足广泛的实际需求。
2024-08-19 14:23:28 808
原创 什么是Killer级应用
Killer级应用”或“Killer App”是指一种软件或应用程序,它具有非常强的吸引力或功能,能够推动大量用户采用某种硬件平台、操作系统或技术。这种应用通常被视为某个新技术、设备或平台获得成功的关键因素,因为它解决了用户的重要需求或提供了极具吸引力的功能,从而吸引了大量用户和市场关注。
2024-08-19 13:59:37 440
原创 Angel-SNIP
Angel-SNIP 提供了一种在训练早期进行敏感性剪枝的有效方法,通过结合梯度信息,该方法可以精确识别和移除对模型性能影响较小的神经元或通道,从而在计算资源受限的环境中实现高效的模型压缩和推理加速。这种方法在理论上和实践中都表现出了显著的优越性,特别是在需要在早期减少计算开销的场景中。
2024-08-19 13:47:46 500
原创 Angel-HCF之调度优化
Angel-HCF” 是一种调度优化算法,主要应用于高性能计算(HPC)和大规模计算系统中的任务调度问题。它的全称是“Angel High-performance Computing Framework”。调度优化的目标是提高计算资源的利用率和系统性能,确保计算任务在给定资源下高效完成。
2024-08-19 13:15:29 354
原创 常用的springboot的启动类的注解
这些注解通常用于 Spring Boot 微服务架构中,组合使用可以增强应用程序的功能,尤其是在分布式系统和云环境中。
2024-08-19 09:52:49 255
原创 Jieba 分词
Jieba 是一个用于中文分词的开源库,特别适合处理中文文本。它的名字“结巴”来源于中文“结巴”(stutter),是因为该库能够将中文文本“结巴地”分割成一个个词语。Jieba 提供了多种分词模式,支持自定义词典,并且能够很好地处理中文中的歧义问题。Jieba 允许用户添加自己的自定义词典,适应特定领域的分词需求。你可以创建一个文本文件(如清华大学 3 nr北京大学 3 nr清华大学和北京大学是词语3是词频(可选)nr是词性标签(可选)text = "我来到北京清华大学"
2024-08-15 11:14:40 346
原创 rmmod: ERROR: Module nvidia_uvm is in use
这个错误信息表示nvidia_uvm内核模块当前正在使用中,因此不能被卸载 (rmmodnvidia_uvm是 NVIDIA Unified Memory 驱动程序的一部分,通常在 CUDA 应用程序运行时会被使用。
2024-08-14 17:06:28 346
原创 ollama升级版本,代码中升级对应的版本依赖
是的,当你升级ollama版本时,依赖项中与ollama相关的版本号也应更新。同时,建议检查其他依赖库的版本,确保它们与新的ollama版本兼容。
2024-08-14 15:59:18 342
原创 ollama的set parameter的参数的注解
num_gpu参数允许你设置模型使用的 GPU 数量,在多 GPU 环境中尤为重要。其他参数控制模型生成文本的方式,如生成的文本长度、重复惩罚、生成的创造性等。根据你的硬件和需求配置这些参数可以显著影响生成的效率和质量。
2024-08-14 14:58:52 792
原创 阿里云原有磁盘上怎么不关机扩容磁盘
通过parted工具扩展分区,然后使用resize2fs工具扩展文件系统,你可以使根文件系统利用磁盘上的额外空间。如果这是在云环境中完成的扩展,步骤基本相同,但有时可能需要先通过管理控制台增加虚拟磁盘的大小。
2024-08-14 14:09:44 473
原创 no space left on device
这个错误消息表明你的设备在尝试下载和保存模型文件时,磁盘空间已满,导致无法继续写入数据。具体地,目录所在的文件系统没有足够的剩余空间来存储下载的模型文件。
2024-08-14 13:56:01 244
原创 rz 和 sz 命令的安装
rz命令是lrzsz包的一部分,这个工具提供了rz和sz命令,主要用于在终端中通过ZMODEM协议进行文件传输。你可以通过安装lrzsz包来获取rz命令。根据你提供的输出,lrzsz包在你的系统中是可用的。
2024-08-14 13:54:05 316
原创 SQLCoder 各个版本的模型都是什么意思
SQLCoder 的不同模型分类主要涉及到模型的精度、性能和资源使用的平衡。这些分类通常通过不同的量化方法来实现,使得模型在特定的硬件和任务场景下表现更为优化。
2024-08-13 20:26:25 887
原创 海量日志数据收集监控平台应该怎么设计和实现
设计和实现一个海量日志数据收集和监控平台,需要考虑以下几个关键方面:数据采集、数据存储、实时处理、监控与告警、可视化分析、扩展性和高可用性。
2024-08-09 13:47:21 617
原创 Error response from daemon: network dialogue-visualize_default not found
该错误提示主要是由于 Docker 找不到指定的网络。通过手动创建网络、确保 Docker Compose 文件正确配置网络或者清理旧的网络和容器,可以解决这个问题。
2024-08-08 15:44:14 249
原创 remote error: CAPTCHA required Your Bitbucket account has been locked. To unlock it and log in again
这意味着你的 Bitbucket 账号由于多次尝试使用错误密码登录而被锁定了。为了解锁你的账号并重新登录,你需要解决一个 CAPTCHA 验证。
2024-08-07 14:39:14 304
原创 什么是 XSS攻击?怎么避免这种攻击
XSS 攻击是常见的 Web 安全威胁,通过输入验证、输出编码、使用安全的库和框架、配置内容安全策略(CSP)等方法,可以有效防止 XSS 攻击。作为开发者,需始终保持安全意识,遵循安全编码实践,保护用户数据和系统安全。
2024-08-06 13:47:14 764
原创 海量 url 去重类问题(布隆过滤器)
布隆过滤器是一种高效的空间节省数据结构,适用于处理海量数据的去重问题。尽管它有一定的误判率,但在很多实际应用中仍然非常有用。通过合理地选择位数组的大小和哈希函数的数量,可以在精度和效率之间找到一个良好的平衡。
2024-08-06 13:31:40 352
原创 多个召回策略进行裁剪配置
在知识问答系统或搜索引擎中,召回策略配置指的是制定并调整各种召回策略以提高系统的检索效果。不同的召回策略可以针对不同的查询特征进行优化,并通过合理的裁剪和配置,提高系统的整体性能和用户满意度。
2024-08-02 21:54:31 482
原创 query怎么改写,才能实现高质量的知识问答系统
为了实现高质量的知识问答系统,query改写需要综合利用多种技术,确保改写后的查询更具语义性、准确性和完整性。
2024-08-02 21:48:11 443
原创 可以利用漏洞上传文件到/tmp,有什么办法获取和升级为root权限,怎么操作
通过 Fastjson 漏洞上传文件到/tmp目录是第一步,要进一步获取和升级为 root 权限通常涉及更多的步骤和利用更多的漏洞。
2024-07-31 20:42:42 527
原创 ubuntu22.04 怎么检查root密码被修改过
Ubuntu 系统会记录一些与用户账户和密码修改相关的日志。你可以查看这些日志文件来检查是否有密码修改的记录。如果你使用脚本修改了 root 密码,脚本应该输出相应的成功或失败信息。文件中保存了用户的密码信息,你可以查看文件的修改时间来判断是否修改过密码。通过这些方法,你可以检查 root 密码是否被修改以及是否修改成功。如果修改时间与预期时间相符,说明密码可能在那个时间点被修改。你可以查看用户的历史命令,以确认是否执行了修改密码的命令。文件包含了与认证相关的日志,包括密码修改记录。
2024-07-31 14:17:29 545
原创 编写java程序,自动监控程度,dump内存文件
编写并保存文件。在终端中运行编译 Java 程序。创建并保存启动脚本。运行赋予启动脚本执行权限。运行启动 Java 程序并使其在后台运行。
2024-07-29 21:57:59 666
原创 ubuntu22.04 安装 Eclipse MAT (Memory Analyzer Tool)
在安装程序中,选择 “Eclipse IDE for Java Developers” 并点击 “Install”。这将启动 Eclipse Installer 界面。启动安装好的 Eclipse IDE。
2024-07-29 21:21:26 275
原创 java汉字排序
在Java中对汉字进行排序,通常需要使用拼音进行排序,这样可以按照汉字的发音进行排序。实现这一目标的常用方法是使用第三方库,例如,它可以将汉字转换为拼音,然后对拼音进行排序。
2024-07-29 17:13:57 451
原创 openj9-17.0.2_8-jre-alpine 和 openjdk:17-alpine 的区别是什么?
根据你的具体需求和环境,选择合适的 JVM 实现是关键。
2024-07-29 14:08:57 315
原创 语音合成遇到中文多音字的问题,现在需要使用SSML标记语言,将多音字自动打上拼音和音标
下面是一个示例,展示如何使用 Python 实现这个流程。
2024-07-23 14:05:22 306
原创 Mono.fromRunnable 和 Mono.zip 的详细解释和示例
是一种创建Mono的方式,它接受一个Runnable作为参数。当Mono订阅者订阅时,Runnable会被执行。不会发出任何值,只会执行Runnable的逻辑,并在完成后发出一个完成信号。
2024-07-23 13:25:09 331
原创 什么是随机森林模型?
随机森林(Random Forest)是一种集成学习方法,主要用于分类和回归任务。它是由多个决策树组成的模型,通过集成这些决策树的预测结果来提高模型的准确性和稳定性。
2024-07-22 21:47:53 411
原创 梯度提升回归树模型
梯度提升回归树(Gradient Boosting Regression Trees, GBRT)是一种集成学习方法,通过结合多个弱学习器(通常是决策树)的预测结果来提高整体模型的性能。GBRT特别擅长处理回归问题和分类问题,具有较高的预测准确性。
2024-07-22 21:47:20 496
原创 nginx的配置:TLSv1 TLSv1.1 被暴露不安全
要在 Nginx 配置中禁用不安全的 SSL 协议(如 TLSv1 和 TLSv1.1),并仅启用更安全的协议(如 TLSv1.2 和 TLSv1.3),您可以更新您的 Nginx 配置文件。这样,您的 Nginx 服务器将只允许更安全的 TLSv1.2 和 TLSv1.3 协议,并且禁用不安全的 TLSv1 和 TLSv1.1。
2024-07-22 14:53:41 495
xhell和Xftp学校版本
2020-10-21
geexekscore.zip
2020-06-12
citycode.sql
2019-07-02
navicat for sqlite安装文件
2019-01-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人