- 博客(121)
- 收藏
- 关注
原创 elasticsearch索引如何删除字段
有两种方法可以删除 Elasticsearch 索引中的字段。您可以使用 Mapping API 更新索引映射并删除字段。以下是删除字段的步骤:1. 通过获取当前的索引映射。2. 编辑映射,删除要删除的字段。3. 将更新的映射传回 Elasticsearch,使用以下请求。例如,如果您要从名为my-index的索引中删除age字段。
2024-05-14 17:58:16 990
原创 复制粘贴插件——clipboard.js的使用
是一款使用简单的粘贴复制插件,它不依赖于Flash或其他框架,在github拥有3万多颗星可见其优秀程度,介绍如何使用它,以备存。
2024-05-10 16:19:48 556
原创 elasticsearch使用more_like_this实现基于内容的推荐
min_doc_freq:一个词语最少在多少篇文档中出现,小于这个值的词会将被忽略,默认是无限制。max_doc_freq:一个词语最多在多少篇文档中出现,大于这个值的词会将被忽略,默认是无限制。min_term_freq:一篇文档中一个词语至少出现次数,小于这个值的词将被忽略,默认是2。percent_terms_to_match:匹配项(term)的百分比,默认是0.3。max_query_terms:一条查询语句中允许最多查询词语的个数,默认是25。boost_terms:设置词语权重,默认是1。
2024-04-12 10:33:57 300
原创 Elasticsearch(ES) 添加/更新映射
通过 Elasticsearch API 可以向索引(Index) 添加文档类型(Type), 或者向文档类型(Type) 中添加/更新字段(Field)。
2024-04-12 09:42:19 500
原创 用Transformers 库来完成中文文本摘要任务
虽然 Hugging Face 已经提供了很多文本摘要模型,但是它们大部分只能处理英文,因此本文将微调一个多语言文本摘要模型用于完成中文摘要:为新浪微博短新闻生成摘要。
2024-04-09 10:21:40 359
原创 Nginx 报错 504 Gateway Time-out 的解决方法
重启 Nginx 和 php-fpm,报错信息基本上就可以解决。原因是程序执行时间过长,导致请求超时。首先,尽可能地优化程序代码的执行时间。修改 nginx.conf 配置文件。修改 php.ini 配置文件。其次,修改配置文件。
2024-03-15 14:04:16 525
转载 Python的yield和next是什么?为什么常用来读取数据(DataLoader)
Python的yield和next是什么?为什么常用来读取数据(DataLoader)
2024-03-12 23:01:23 58 1
原创 PyTorch-RNN
首先介绍一下什么是rnn,rnn特别擅长处理序列类型的数据,因为他是一个循环的结构一个序列的数据依次进入网络A,网络A循环的往后传递。这就是RNN的基本结构类型。而最早的RNN模型,序列依次进入网络中,之前进入序列的数据会保存信息而对后面的数据产生影响,所以RNN有着记忆的特性,而同时越前面的数据进入序列的时间越早,所以对后面的数据的影响也就越弱,简而言之就是一个数据会更大程度受到其临近数据的影响。但是我们很有可能需要更长时间之前的信息,而这个能力传统的RNN特别弱,于是有了LSTM这个变体。
2024-03-05 12:42:49 643
原创 PyTorch-神经网络
神经网络,这也是深度学习的基石,所谓的深度学习,也可以理解为很深层的神经网络。说起这里,有一个小段子,神经网络曾经被打入了冷宫,因为SVM派的崛起,SVM不了解的同学可以去google一下,中文叫支持向量机,因为其有着完备的数学解释,并且之前神经网络运算复杂等问题,导致神经网络停步不前,这个时候任何以神经网络为题目的论文都发不出去,反向传播算法的鼻祖hinton为了解决这个问题,于是就想到了用深度学习为题目。段子说完,接下来开始我们的简单神经网络。
2024-03-03 10:14:10 1136
原创 PyTorch – 逻辑回归
如何在pytorch里面用最小二乘来拟合一些离散的点,这一节我们将开始简单的logistic回归,介绍图像分类问题,使用的数据是手写字体数据集MNIST
2024-02-17 19:06:13 1301 1
原创 linux中用date命令获取昨天、明天或多天前后的日期
,一些脚本中会调用明天,或者昨天,或更多天前的日期,本文将叙述讲述用date命令实现时间的显示。在Linux系统中用mandate -d 查询的参数说的比较模糊
2023-11-07 17:12:26 1850
原创 在 Ubuntu 22.04安装配置 Ansible
Ansible是今年来越来越火的一款开源运维自动化工具,通过Ansible可以实现运维自动化,提高运维工程师的工作效率,减少人为失误。Ansible通过本身集成的非常丰富的模块可以实现各种管理任务,其自带模块超过上千个。更为重要的是,它操作非常简单,即使小白也可以轻松上手,但它提供的功能又非常丰富,在运维领域,几乎可以做任何事
2023-10-17 16:34:02 1459
原创 Ubuntu扩容lvm空间
安装 Ubuntu Server 的时候磁盘分区选择了 LVM,所以系统根目录默认占用磁盘大小只有4G,在安装软件时发现磁盘空间4G已经无法满足,/dev/mapper/ubuntu--vg-ubuntu--lv 磁盘空间不足报警,所以需要利用 LVM 对磁盘进行扩容Linux。
2023-09-06 21:21:20 1205
原创 使用 Elasticsearch 轻松进行中文文本分类
本文记录下使用 Elasticsearch 进行文本分类,当我第一次偶然发现 Elasticsearch 时,就被它的易用性、速度和配置选项所吸引。每次使用 Elasticsearch,我都能找到一种更为简单的方法来解决我一贯通过传统的自然语言处理 (NLP) 工具和技术来解决的问题。在某个时刻,我意识到,它可以直接用来解决很多问题,而如果采用我以前学到的方法,则需要从头开始构建解决方案。
2023-08-19 17:16:53 1085
原创 python从ftp拉取文件再导入数据库
一个简单的任务,使用python从ftp拉取txt文件再导入数据库,涉及的模块知识有ftp登录及下载,读取文件列表里的txt文件,以及pandas.dataframe.to_sql插入数据库的知识。
2023-07-20 08:57:01 345
原创 python应用-excel和数据库的读取及写入操作
近日完成一个交办任务,从excel表读取数据,根据ID在数据库表匹配相应的记录,并回填至excel表里。我使用的工具是python。下面记录下相应的模块。
2023-07-05 07:38:32 1093
原创 MySQL优化六-优化慢查询
本文主要总结,如何提升性能低下的查询。慢查询的基本原因是,访问的数据太多,而很多情况下不需要筛选大量数据。对于低效的查询,
2023-06-12 10:20:41 799
原创 MySQL优化四-MySQL Innodb 自定义Hash索引
当存储引擎不支持哈希索引时,可以自定义哈希索引,例如只需要很小的索引,可为超长的列值创建索引。思路:在B-Tree创建一个伪哈希索引,它使用哈希值,而不是键本身进行索引比较,在where子句中,手动指定使用的哈希函数。
2023-06-08 09:25:30 837
原创 magicapi将多个文件压缩成zip流
本文总结了magicapi将多个文件压缩成zip流,通过ResponseEntity下载-不用将zip保存硬盘。
2023-06-01 13:08:51 234
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人