![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
笔记
文章平均质量分 73
星宇星静
一个刚投身于nlp事业的年轻人
展开
-
Hugging Face怎么通过国内镜像去进行模型下载(hf-mirror.com)
Hugging Face 是一家专注于自然语言处理(NLP)技术的公司,以其开源贡献和先进的机器学习模型而闻名。该公司最著名的产品是 Transformers 库,这是一个广泛使用的 Python 库,它提供了大量预训练模型,如 BERT、GPT-2、T5 和其他模型,这些模型可以用于各种 NLP 任务,如文本分类、情感分析、文本生成等。Hugging Face 还提供一个在线平台,允许社区成员共享和协作他们的模型。原创 2024-01-18 20:49:58 · 13025 阅读 · 6 评论 -
GoLang:gRPC协议的介绍以及详细教程,从Protocol开始
gRPC(Google Remote Procedure Call)是一个由Google开发的高性能、开源RPC(远程过程调用)框架。它基于HTTP/2进行数据传输,使用ProtoBuf(Protocol Buffers)作为接口描述语言,支持多种编程语言,如Java、Go、C#等,适用于不同语言环境。gRPC的显著特点包括其高效的通信性能,支持双向流、多路复用和二进制传输,以及集成的安全机制,如SSL/TLS。这些特性使gRPC特别适合用于构建高性能的分布式系统和微服务架构中的服务间通信,尤其在需要处理大原创 2024-01-06 12:58:29 · 2245 阅读 · 0 评论 -
Gin:GoLang语言Web应用快速入门
通过以上步骤,你就成功使用Go的Gin框架创建了一个基本的Hello World程序。这个程序创建了一个web服务器,监听8080端口,并且对根路径()的GET请求响应“Hello World”。Gin是一个非常强大且易用的web框架,非常适合用于构建RESTful API和web应用程序。原创 2024-01-04 20:54:28 · 1579 阅读 · 1 评论 -
go语言多线程操作
多线程是一种编程概念,它允许操作系统同时处理多个任务。在多线程环境中,每个线程都代表了一个任务的执行流程。这些线程可以同时运行,使得程序能够更有效地利用计算资源,特别是在多核处理器的系统中。原创 2024-01-04 20:38:43 · 1832 阅读 · 0 评论 -
构建 PHP 开发环境:使用 Docker 和阿里云镜像加速器
Dockerfile:这是一个文本文件,包含了一系列的指令,用于定义如何构建 Docker 镜像。例如,它可以包含从基础镜像开始、安装软件包、复制文件和设置环境变量的指令。镜像(Image):Docker 镜像是一个轻量级、独立、可执行的软件包,包含运行应用所需的一切:代码、运行时、库、环境变量和配置文件。容器(Container):当 Docker 镜像运行时,它在 Docker 引擎上运行的实例就是一个容器。容器是应用程序及其运行环境的封装。仓库(Registry)原创 2024-01-03 21:18:57 · 1338 阅读 · 0 评论 -
文本聚类——文本相似度(聚类算法基本概念)
样本与簇之间的相似性通常转化为样本之间的相似度或者簇间相似度进行计算。如果用均值向量来表示一个簇,纳秒样本与簇之间的相似性可以转化为样本与均值向量的样本相似性。前面两种文本相似性度量方法主要针对定义在向量空间模型中的样本,而有时候,文本通过概率分布进行表示,如词项分布、基于PLSA和LDA模型的主题分布等。距离度量衡量的是空间各个点的绝对距离,与各点的位置(即个体特征维度的数值)直接相关,而余弦相似度衡量的事空间向量的夹角,更多的体现了方向上的差异,而不是位置(距离或长度)。原创 2023-12-16 21:53:57 · 343 阅读 · 0 评论 -
从二分类到多分类:探索Logistic回归到Softmax回归的演进
我们讨论了从二分类到多分类的发展历程,以及Logistic回归到Softmax回归的演进。Logistic回归作为经典的二分类算法,为我们提供了解决基本问题的基础。然而,随着问题的复杂化,Softmax回归成为处理多分类任务的关键工具,为我们提供了更大的灵活性和表达能力。原创 2023-12-09 21:09:42 · 244 阅读 · 0 评论 -
在Docker容器中启用SSH服务,实现外部访问的详细教程
请注意,将 SSH 服务器暴露给外部可能会有安全风险,确保采取适当的安全措施,例如使用密钥认证替代密码认证,并限制允许访问的 IP 地址。在您的 Docker 容器中安装 SSH 服务器。使用适合您容器基础镜像的包管理工具,例如在基于 Ubuntu 的容器中,可以使用。现在,您应该能够使用 SSH 连接到运行 SSH 服务器的 Docker 容器。确保将容器的 SSH 端口映射到主机上,以便从外部访问。为您在步骤 5 中映射到主机的端口,为容器中 SSH 服务器的端口,为您使用的 Docker 镜像。原创 2023-12-05 21:50:46 · 7611 阅读 · 0 评论 -
docker中mysql的数据迁移
在Docker中进行MySQL数据迁移通常涉及将数据从一个MySQL容器导出,并将其导入到另一个容器或主机上的MySQL实例中。原创 2023-12-05 21:46:12 · 1074 阅读 · 0 评论 -
深入理解贝叶斯分类与朴素贝叶斯模型(Naive Bayes, NB):从基础到实战
一种通常的做法是忽略文本中的词序关系,假设各个特征词的位置都是可以互换的,即词袋模型(Bag Of Word,BOW)。基于以上条件的贝叶斯模型,称为。计算机,t2 = 排球,t3 = 运动会,t4 = 高校,t5 = 大学,y = 1表示教育类,y = 0表示体育类,可以得到如下参数估计结果。在朴素贝叶斯分类器中,特征之间的独立性假设是一个简化,但在实际应用中,该方法在垃圾邮件过滤等任务上表现良好。从参数估计的结果例可以看出,在多项式分布假设下,频率正是概率的最大似然估计值,例如,类别概率。原创 2023-12-02 22:47:23 · 821 阅读 · 0 评论 -
无桌面版docker在Ubuntu系统上安装
目录注意系统要求卸载旧版本安装使用apt存储库安装1. 设置 Docker 的apt存储库。2. 安装Docker软件包3. 通过运行镜像来验证Docker Engine安装是否成功 hello-world。从包中安装1. 进入 https://download.docker.com/linux/ubuntu/dists/。2. 在列表中选择您的 Ubuntu 版本。3. 转至pool/stable/并选择适用的架构(amd64、 armhf、arm64或s390x)。4. deb下载Docker 引擎、C原创 2023-12-01 20:52:11 · 1115 阅读 · 0 评论 -
GoLang语言Map用法
在Go语言中,map是一种无序的键值对集合,其中每个键必须是唯一的。以下是关于map。原创 2023-11-30 21:19:07 · 360 阅读 · 1 评论 -
vue+echarts实现依赖关系无向网络拓扑结图节点折叠展开策略
在设计关系图时,选择力引导依赖关系图作为主要可视化方法,考虑到树状图在呈现节点之间关系方面的不便,力引导图能更好地展示节点关系。为了实现节点的折叠和展开策略,引入了开源库echarts3,并设计了节点的展开和收缩逻辑。关系图的布局采用力导向算法,其中引力中心设置为图中心,节点层级按照由中心向四周分布。详细讨论了力引导关系图的基本概念,节点和边的定义,以及力导向布局算法的原理。原创 2023-11-28 21:24:12 · 2571 阅读 · 0 评论 -
Linux:centOS常用命令
CentOS是一种基于Red Hat Enterprise Linux(RHEL)的开源操作系统,因此与其他基于Linux的系统共享很多相似的命令。以下是一些在CentOS上常用的命令。这只是一小部分CentOS上可能用到的命令,具体的使用方式和参数可以通过命令后加上。此外,你也可以查阅相关文档来深入了解每个命令的用法和选项。原创 2023-11-26 21:29:22 · 518 阅读 · 0 评论 -
Echart力引导依赖关系布局图
Echarts是百度开发的一款开源的 JavaScript 数据可视化库。它提供了丰富的图表和图形,适用于在 Web 应用程序中创建各种交互式和动态的数据可视化图表。ECharts支持各种图表类型,包括折线图、柱状图、饼图、散点图等,以及更高级的图表类型,比如关系图、热力图等。原创 2023-11-26 15:41:25 · 321 阅读 · 0 评论 -
brat文本标注工具——安装
RAT(Brat Rapid Annotation Tool)是一个用于文本标注的开源工具。它专门设计用于支持语言学和自然语言处理(NLP)任务,如实体识别、关系抽取和事件抽取等。BRAT 提供了直观的用户界面,使用户能够轻松地标注文本。它支持通过简单的鼠标操作进行标注,如选择文本范围、标记实体类型等。BRAT 允许多个用户协同工作,每个用户都可以进行独立的标注工作。这在大型标注项目中是非常有用的,不同的标注者可以同时处理文本,并在需要时进行交流。原创 2023-11-25 18:20:05 · 1056 阅读 · 0 评论 -
Linux:Ubuntu虚拟机安装详解:VMware下的逐步指南
这份详细教程提供了在VMware上安装Ubuntu的逐步说明,面向CentOS和Windows用户。该指南涵盖了从可靠镜像下载Ubuntu映像、在VMware中创建新虚拟机、配置NAT和桥接模式的网络设置,到常见的后安装配置。此外,该指南还为macOS用户提供了专门的提示,并概述了Ubuntu工具配置的基本内容,包括安装wget和gdebi。无论您是Linux新手还是有经验的用户,该教程都确保Ubuntu安装过程顺利无阻。原创 2023-11-25 16:09:06 · 725 阅读 · 0 评论 -
《文本数据挖掘》读书笔记(四)
原创 2023-11-22 22:09:46 · 23 阅读 · 0 评论 -
Go语言环境配置&集成式开发环境搭建
在系统变量的Path路径下加入Go语言的bin的路径(如果没有配置默认在C:\Program Files\Go\bin路径下),这样就可以在任何位置正常运行go语言了。新建.go文件,这里应该有下角会有提示安装包,请install all,这里因为之前配置好镜像路径,所以应该不会报错。如上图,网站上教了一个配置方法,但是这个只能短期配置下载go的路径,为了一劳永逸,这里教一个别的方法。,如果网站失效了,也可以在搜索一下别的网站,这样就可以正常导入package并且调试了。观察以上两个变量的设置情况。原创 2023-11-21 18:11:55 · 561 阅读 · 1 评论 -
《文本数据挖掘》读书笔记(三)
因为GPT,bert,transformer太火了,之前就品鉴过了,所以就没细做笔记了。原创 2023-11-20 21:14:50 · 26 阅读 · 0 评论 -
Unlimiformer: Long-Range Transformers with Unlimited Length Input ,无限长的Transformer输入模型【论文解读】
本文提出了Unlimiformer,一种用于改进预训练语言模型(如BART)性能的方法。Unlimiformer可以在测试时使用,而无需进一步训练,从而在GovReport和SummScreen数据集上分别提高了1.8和1.4的ROUGE-1分数。此外,通过在验证时使用Unlimiformer进行早期停止,可以在训练成本相同的情况下进一步提高性能。实验结果表明,Unlimiformer在长文档摘要任务上取得了显著的性能提升。设是解码器的隐藏状态,他是编码器的最后一层隐藏状态。原创 2023-11-19 16:35:35 · 358 阅读 · 0 评论 -
OneIE: A Joint Neural Model for Information Extraction with Global Features
ONEIE。大多数现有的信息提取(IE)联合神经模型使用本地特定于任务的分类器来预测单个实例(例如,触发器、关系)的标签,而不考虑它们的交互作用。例如,在同一句子中,一个死亡事件的受害者很可能是一个攻击事件的受害者。为了捕获这种跨子任务和跨实例之间的相互依赖关系,我们提出了一个联合神经框架,ONEIE,它旨在从一个输入的句子中提取全局最优的IE结果作为一个图。ONEIE分四个阶段进行端到端IE:(1)将给定的句子编码为上下文化的单词表示;(2)将实体提及和事件触发器识别为节点;原创 2023-11-11 11:35:09 · 298 阅读 · 3 评论 -
温室种植管理与决策系统开发与设计(四)——axios&Element Plus
为了更方便地对页面进行渲染,我们引入并安装Element Plus(如果当时上篇文章中选的是"2.x",就引入Element-ui,)。又为了方便路由接口的使用我们引入并安装axios。原创 2022-10-14 10:23:10 · 280 阅读 · 0 评论 -
温室种植管理与决策系统开发与设计(三)——创建Vue基础页面
Vue (发音为 /vjuː/,类似view) 是一款用于构建用户界面的 JavaScript 框架。它基于标准 HTML、CSS 和 JavaScript 构建,并提供了一套声明式的、组件化的编程模型,帮助你高效地开发用户界面。无论是简单还是复杂的界面,Vue 都可以胜任。原创 2022-10-11 13:45:52 · 210 阅读 · 0 评论 -
温室种植管理与决策系统开发与设计(二)
温室种植管理与决策系统开发与设计页面初设计原创 2022-10-11 13:03:45 · 75 阅读 · 0 评论 -
温室种植管理与决策系统开发与设计(一)
基于Vue.js+Python的温室种植管理与决策系统开发与设计的需求分析及设计思路。原创 2022-10-10 16:59:17 · 316 阅读 · 1 评论 -
安装Python第三方库时遇到WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=Non
WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after connection broken by ‘ProxyError(‘Cannot connect to proxy.’, timeout(’_ssl.c:1108: The handshake operation timed out’))’: /simple/opencv-python/WARNING: Retrying原创 2021-11-20 20:49:40 · 3980 阅读 · 0 评论