- 博客(193)
- 资源 (13)
- 收藏
- 关注
原创 Elasticsearch 免费许可证到期问题解决
es日志报错信息:current license is non-compliant for [security]ES的X-pack许可证是提供免费一个月的试用,但是到期之后,就会报这个错误。的错误,到时候依然需要再次执行以上命令来保证 es 正常运行。解决问题,到一定时间以后,依然会出现。
2024-04-02 09:43:15 284
原创 Mindspore 公开课 - CodeGeeX
CodeGeeX能获得最佳的平均性能,显著超越了参数量更小的模型(7.5%~16.3%的提升),与参数量更大的模型CodeGen-Multi-16B表现相当(平均性能 54.76% vs. 54.39%)。全新多编程语言评测基准HumanEval-X:HumanEval-X是第一个支持功能正确性评测的多语言、多任务的基准,包含820个人工编写的高质量代码生成题目、测试用例与参考答案,覆盖5种编程语言(Python、C++、Java、JavaScript、Go),支持代码生成与代码翻译能力的评测。
2024-01-15 22:24:20 982
原创 Mindspore 公开课 - prompt
BERTbidirectional transformer,词语和句子级别的特征抽取,注重文本理解Fine-tune: 根据任务选取对应的representation(最后一层hidden state输出),放入线性层中例:Natural Language Inference。
2024-01-15 21:57:07 1127
原创 Mindspore 公开课 - GPT
另外需要注意的一点是,由于在前序数据处理中,我们添加了3个特殊占位符,所以在token embedding中需要调整词典的大小(vocab_size + 3)。IMDb数据集是一个常用的情感分类数据集,其中包含50,000条影评文本,其中25,000条用作训练数据,另外25,000条用作测试数据。加载 GPT tokenizer,并添加上述使用到的 <bos>, <eos>, <pad>占位符。由于IMDb数据集本身不包含验证集,我们手动将其分割为训练和验证两部分,比例取0.7, 0.3。
2024-01-15 21:43:30 600
原创 Mindspore 公开课 - BERT
在训练过程中,模型会对句子进行“完形填空”,预测这些被遮盖的词语是什么,通过减小被mask词语的损失值来对模型进行优化。但与Transformer不同的是,BERT使用了可学习的位置信息,并额外增加了表示区分不同句子的段嵌入(segment embedding)。另外,输入的内容最好是document-level的语料,而非sentence-level的语料,这样训练出的模型可以具备抓取长序列特征的能力。输入的两个句子A和B中,B有50%的概率是A的下一句。BERT模型本质上是结合了。
2024-01-15 21:38:31 1107
原创 一、Mindspore 公开课 - Transformer
课程链接:Mindspore 技术公开课Transformer 论文地址,建议看完课程以后简单看看论文前言Transformer是一种神经网络结构,由Vaswani等人在2017年的论文“Attention Is All You Need” 中提出,用于处理机器翻译、语言建模和文本生成等自然语言处理任务。Transformer 与传统 NLP 特征提取类模型的区别主要在以下两点:Transformer 是一个纯基于注意力机制的结构,并将自注意力机制和多头注意力机制的概念运用到模型中;由于缺少R
2024-01-14 12:38:18 403
原创 Mysql - 二、基础查询与排序
从表中选取数据时需要使用SELECT语句,也就是只从表中选出(SELECT)必要数据的意思。通过SELECT语句查询并选取出必要数据的过程称为匹配查询或查询(query)。基本SELECT语句包含了SELECT和FROM两个子句(clause)。其中,SELECT子句中列举了希望从表中查询出的列的名称,而FROM子句则指定了选取出数据的表的名称。
2023-12-28 17:08:05 882
原创 windows 部署 mindspore GPU 开发环境
中配置让Docker可以使用 nvidia-container-runtime。目录映射的本机目录下,在容器中执行即可。在容器中执行相关程序即可。
2023-09-22 21:33:15 334
原创 连接MySQL时报错:Public Key Retrieval is not allowed的解决方法
DBeaver 连接 mysql 时报错:Public Key Retrieval is not allowed(不允许公钥检索)(这里的运输公钥检索是默认关闭的,需要把它开启),改为。连接设置 -> 驱动属性 ->
2023-09-15 15:46:14 2156 2
原创 九、ElasticSearch 运维 -集群维度
用于简单的判断集群的健康状态,集群内的分片的分配迁移情况。statustimed_outfalsetimeoutfetch是什么意思当数量较大时,可以说明 Master 在处理 task 时有点力不从心,承载的压力较大了。
2023-06-27 22:29:11 822
原创 Centos 系统中使用 Firefix 播放视频 - VLC播放器的安装
出于刷视频的需要,需要使用虚拟机(Centos7)上的 Firefix 来播放视频,经确认安装 flash 的方式是不行的。事实上在 Firefix 播放视频仅需要安装 VLC 播放器就可以了,以下记录安装 VLC 视频播放器的过程。对应的安装包来安装 VLC。
2023-06-26 11:06:53 916
原创 Python - 通过 pyInstaller 打包成可执行文件
pyInstaller 是一个将 python 文件打包成可执行文件的库,它除了支持 windows 平台,还支持 Linux 模块。pyInstaller 会将 python 解释器、脚本中用到的第三方库函数以及相应的脚本一并打包到可执行文件中。
2023-05-09 00:04:05 1424 1
原创 一、ElasticSearch 基础概念
Elasticsearch 最初是作为独立产品开发的。它的核心作用是提供可扩展的搜索引擎服务,它提供多种语言库API(包括JAVA、Python等),基于分布式模型创建,并对外提供 `REST API` 接口服务。随着Elastic生态圈的发展,衍生出了 Elasticsearch 的相关 工具集合。例如 Kibana (用于可视化和数据分析)、Logstash (用于日志收集)、Beats (数据传输,轻量级的Logstash)等。Elastic Stack 不单单是Elasticsearch,而是一体化
2023-04-01 15:13:32 286
原创 JAVA - 在 @test 标签中使用 Scanner 类输入
在 @test 修饰的测试方法中调用 `Scanner` 类时,无法在控制台输入。
2022-09-14 14:45:13 621
原创 知网一键下载PDF文献
首先,我们先去chrome网上应用店下载一个Tampermonkey 插件。我已经下载好了,所以是评价状态。随后,你到下面这个网址去install一下CNKI PDF Download,把这个脚本安装上,即可一键下载知网的PDF。https://greasyfork.org/en/scripts/368399-cnki-pdf-download安装好之后,我们将界面返回CNKI。在右上角的插件栏目里,会有一个两只眼睛一样的logo,这个就是Tampermonkey。点击它,就会弹出你安装了哪些脚
2022-03-02 15:14:12 3458 4
原创 Xshell - 使用 Xshell 无法远程连接安装在 VMware 上的 Euler 的解决方案
遇到问题获取虚拟机 ip 地址,使用 ip addr发现在 virbr0 上的 inet 属性似乎也是一个 ip 地址,我们试一下这个地址Xshell 无法连接解决方法发现 ens33 没有 inet 属性查看ens33配置文件的配置,输入 cat /etc/sysconfig/network-scripts/ifcfg-ens33 查看配置情况,会发现网卡没开启 然后把 no 修改为 yes注意:修改 /etc/sysconfig/network-scripts/ifcf
2021-11-30 15:12:12 1623 3
原创 多边形质心计算 - Python实现
X=∑i=1n(xi⋅mi)∑i=1nmi,Y=∑i=1n(yi⋅mi)∑i=1nmi...(1)X = \frac{\sum_{i=1}^n ( x_i \cdot m_i )} {\sum_{i=1}^n m_i},Y = \frac{\sum_{i=1}^n ( y_i \cdot m_i )} {\sum_{i=1}^n m_i}...(1)X=∑i=1nmi∑i=1n(xi⋅mi),Y=∑i=1nmi∑i=1n(yi⋅mi)...(1)...
2021-11-11 16:12:45 1777
原创 VsCode 终端激活 anconda 环境问题解决措施
问题描述第一次在 VScode 中使用 Anaconda 的虚拟环境,发现不同的虚拟环境之间的切换还是蛮容易的(点左下角的Python…按钮,可以自由选择环境)。但是不管是命令行(Terminal),还是直接点击绿色按钮运行代码,都无法正常运行,会提醒ImportError: DLL load failed: 找不到指定的模块。即找不到我自己安装的第三方库。但实际上我已经安装了此模块并且在 pycharm 上可以运行。问题解决发现我的 VScode 命令行没有激活 conda 的虚拟环境。即使
2021-10-25 11:50:31 5008 2
原创 git 版本管理
一、git 简介1.1 产生历史\quadgit是目前世界上最先进的分布式版本控制系统。\quadLinus在1991年创建了开源的Linux,从此,Linux系统不断发展,已经成为最大的服务器系统软件了。Linus虽然创建了Linux,但Linux的壮大是靠全世界热心的志愿者参与的,这么多人在世界各地为Linux编写代码,那Linux的代码是如何管理的呢?事实是,在2002年以前,世界各地的志愿者把源代码文件通过diff的方式发给Linus,然后由Linus本人通过手工方式合并代码!你也许会想,为什
2021-10-03 11:26:24 874
原创 Manacher算法的原理与实现
ManacherManacherManacher 算法,又叫“马拉车”算法,可以在时间复杂度为 O(n)O(n)O(n) 的情况下求解一个字符串的最长回文子串长度的问题。一、 回文子串的一般解法比较简单的思路是将字符串的每一个字符作为回文子串的中心对称点,每次保存前面求得的回文子串的最大值,最后得到的就是最长的回文子串的长度,这种方式的时间复杂度是 O(n2)O(n^2)O(n2)。在求解过程中,基数的回文子串与偶数的回文子串是不一样的。比如最长回文子串为 aba,对称中心就是 b,如果最长回文子串为
2021-09-12 17:36:49 127
原创 剑指 Offer 53 - II. 0~n-1中缺失的数字
一个长度为 n−1n-1n−1 的递增排序数组中的所有数字都是唯一的,并且每个数字都在范围 0~n−10~n-10~n−1 之内。在范围 0~n−10~n-10~n−1 内的 nnn 个数字中有且只有一个数字不在该数组中,请找出这个数字。示例 1:输入: [0,1,3]输出: 2限制:1 <= 数组长度 <= 10000def missingNumber(self, nums: List[int]) -> int: a = 0 for i
2021-09-10 11:05:04 66
原创 十大经典排序算法从原理到实现
十大经典排序算法一、冒泡排序冒泡排序(Bubble Sort)也是一种简单直观的排序算法。它重复地走访过要排序的数列,一次比较两个元素,如果他们的顺序错误就把他们交换过来。走访数列的工作是重复地进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢"浮"到数列的顶端。作为最简单的排序算法之一,冒泡排序给我的感觉就像 Abandon 在单词书里出现的感觉一样,每次都在第一页第一位,所以最熟悉。冒泡排序还有一种优化算法,就是立一个 flag,当在一趟序列遍历中
2021-09-08 15:51:06 979
原创 剑指 Offer 58 - II. 左旋转字符串
字符串的左旋转操作是把字符串前面的若干个字符转移到字符串的尾部。请定义一个函数实现字符串左旋转操作的功能。比如,输入字符串"abcdefg"和数字2,该函数将返回左旋转两位得到的结果"cdefgab"。示例 1:输入: s = “abcdefg”, k = 2输出: “cdefgab”限制:1 <= k < s.length <= 10000我觉得这个题就是一个字符串的切割和拼接,将字符串分割成前 k 位记为 s1s_1s1 和后 k 位 s2s_2s2,再按照
2021-09-01 19:50:16 83
原创 剑指 Offer 30. 包含min函数的栈
定义栈的数据结构,请在该类型中实现一个能够得到栈的最小元素的 min 函数在该栈中,调用 min、push 及 pop 的时间复杂度都是 O(1)。MinStack minStack = new MinStack();minStack.push(-2);minStack.push(0);minStack.push(-3);minStack.min(); --> 返回 -3.minStack.pop();minStack.top(); --> 返回 0.minSta
2021-09-01 09:56:10 76
原创 MySql
1. 安装所有内容均以ubuntu为例,服务器端安装mysqlsudo apt-get install mysql-server服务器用于接收客户端的请求、执行sql语句、管理数据库服务器端一般以服务方式管理,名称为mysql启动服务sudo service mysql start查看进程中是否存在mysql服务ps ajx|grep mysql重启服务sudo service mysql restart1.1 配置配置文件目录为/etc/mysql/mysql.cn
2021-08-28 21:16:50 82
树的公共父节点.rar
2020-08-23
欧式距离的局部敏感哈希E2LSH.py
2020-07-30
局部敏感哈希,LSH.py
2020-07-29
5_data_parallel_tutorial.ipynb
2020-07-21
4_cifar10_tutorial.ipynb
2020-07-21
3_neural_networks_tutorial.ipynb
2020-07-21
2_autograd_tutorial.ipynb
2020-07-21
1_tensor_tutorial.ipynb
2020-07-21
matplotlib简单画图.ipynb
2019-12-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人