- 博客(38)
- 资源 (6)
- 收藏
- 关注
原创 【ChatGPT】搜索趋势分析
为了分析 ChatGPT 在过去一年的流行趋势,我们可以查看 Google Trends 的数据。【ChatGPT】搜索趋势分析。运行以下 Python 脚本。安装依赖pytrends。
2024-10-31 13:51:34 458
原创 【动手学transformer】源码阅读之sparse_embedding
稀疏嵌入(sparse embeddings)是一个计算稀疏嵌入的方法,通过输入的隐藏状态和 token ID 生成稀疏嵌入,并对未使用的 token 进行处理,以确保它们不会影响模型的后续操作。
2024-10-29 14:29:10 316
原创 Efficient Retrieval with Learned Similarities(RAILS)通过相似性学习进行高效检索
检索在推荐系统、搜索和自然语言处理等应用中发挥着关键作用。尽管点积作为相似度函数被广泛使用,但最新的检索算法已迁移到学习相似度上。本文提出了一种基于MoL的近似最近邻检索技术,并证明了其在推荐检索任务中的效率和准确性。
2024-07-25 13:36:14 955
原创 【Linux】systemctl系统和服务管理命令
systemctl是systemd系统和服务管理器的主命令行工具,用于启动、停止、重启、启用、禁用和检查服务状态,以及管理系统状态。systemd是现代 Linux 发行版中广泛使用的初始化系统(init system),取代了旧的 SysV 和 Upstart 系统。以下是一些常见的systemctl。
2024-07-02 13:00:40 513
原创 【linux】文件内容对比工具:diff、 wdiff、 colordiff
colordiff使用的是diff的输出,所以你可以在文件中自定义颜色配置。创建或编辑diff是一个强大的工具,可以用来比较文件和目录的内容,生成补丁文件,并忽略某些类型的差异。通过结合不同的选项,可以满足各种文件比较需求。
2024-06-25 09:57:16 1116
原创 接口响应时间测试
会输出详细的请求过程,包括 DNS 解析时间、TCP 连接时间、SSL 握手时间、服务器处理时间和总时间。测试并计算平均响应时间外,还可以使用其他工具和方法来获得更准确的结果。是 Apache HTTP 服务器的一部分,可以用于测试 HTTP 服务器的性能。这种方法可以有效减少单次测试结果的偶然误差,从而提供更准确的响应时间评估。会在每个请求中添加指定的头部信息,帮助你准确地测试 API 响应时间。将输出详细的统计数据,包括每次请求的平均时间、中位数、百分位数等。将输出统计数据,包括每次请求的平均时间。
2024-06-18 16:58:43 1573
原创 XLM-RoBERTa 是一种多语言版本的 RoBERTa 模型
XLM-RoBERTa 是一种多语言版本的 RoBERTa 模型,由 Facebook AI 开发。它是为了处理多种语言的自然语言理解任务而设计的。
2024-06-18 13:53:49 1187
原创 【macOS】sleepimage 文件是 macOS 系统的睡眠镜像文件
sleepimage文件是 macOS 系统的睡眠镜像文件,用于在系统进入睡眠模式时保存内存状态。
2024-06-17 13:47:09 928
原创 【动手学习】泊松分布
如果随机变量(X)服从参数为 (\lambda) 的泊松分布,记作 (X \sim \text{Poisson}(\lambda)),则其概率质量函数(PMF)为:} ]( k ) 是事件发生的次数,( k = 0, 1, 2, \ldots )(\lambda) 是单位时间或单位区域内事件的平均发生次数(也叫做参数或强度)
2024-06-11 14:14:49 1377
原创 【高考作文】随着互联网的普及、人工智能的应用,越来越多的问题能很快得到答案。那么,我们的问题是否会越来越少?
随着互联网的普及、人工智能的应用,越来越多的问题能很快得到答案。那么,我们的问题是否会越来越少?以上材料引发了你怎样的联想和思考?请写一篇文章。要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息。
2024-06-11 11:15:59 7546
原创 mount.nfs: Stale file handle
错误信息“mount.nfs: Stale file handle”通常表示NFS客户端用于访问NFS服务器上的文件或目录的文件句柄已失效。这可能是由于服务器上的更改(例如,文件或目录被删除或重新挂载文件系统)没有在客户端上反映出来导致的。
2024-06-11 11:13:02 1523
原创 在 Jupyter 编辑函数(Edit function in Jupyter)
在Jupyter Notebook里编辑一个已经存在的函数是可以实现的。你需要重新定义这个函数并执行该单元格。这将覆盖之前的定义,使用新的代码。例如,如果你有一个函数 fetch_california_housing,你可以按照以下步骤编辑和重新定义它:找到该函数的定义单元格,或者创建一个新的单元格。编辑该函数。重新执行该单元格。
2024-06-06 12:25:24 920
原创 annoy库(Approximate Nearest Neighbors Oh Yeah)使用demo
我们使用annoy库(Approximate Nearest Neighbors Oh Yeah),它是一种基于随机树的近似最近邻搜索算法,具有类似的高效和可扩展性
2024-05-31 20:06:09 463
原创 一种用于大规模向量搜索的算法 DiskANN(Disk-based Approximate Nearest Neighbor)
DiskANN通过图索引、层次化存储、实时更新和过滤器支持等技术,实现了在大规模向量数据集上的高效、准确和成本效益高的近似最近邻搜索。其实现方式结合了内存和磁盘管理技术,使其能够在处理大规模数据时仍能保持高性能和灵活性。
2024-05-31 20:01:06 754
原创 信息检索领域的前沿方法--使用稀疏语义编码器改进文档检索及代码实现
稀疏语义编码器旨在弥合传统稀疏表示(如TF-IDF或BM25)和稠密表示(如神经嵌入)之间的差距,利用稀疏方法的可解释性和效率以及稠密方法提供的丰富语义理解。
2024-05-31 10:20:37 426
原创 error: could not install packages due to an oserror: httpsconnectionpool(host=‘files.pythonhosted.or
pip 源更改为清华大学镜像的方法
2024-05-30 19:59:35 589
原创 udp port isakmp unreachable
当遇到“UDP port ISAKMP unreachable”问题时,通常意味着设备或防火墙阻止或不响应ISAKMP(Internet Security Association and Key Management Protocol)流量。ISAKMP用于在IPsec VPN中建立安全关联和加密密钥,依赖于UDP端口500。
2024-05-30 19:53:16 642
原创 __pthread_mutex_lock_full: assertion ‘e != esrch || !robust‘ failed
这个错误信息通常与多线程环境中的互斥锁(mutex)有关。具体来说,它提示程序在尝试锁定互斥锁时遇到了断言失败,可能是由于线程或互斥锁状态不匹配引起的。
2024-05-30 19:50:15 522
原创 一个非常流行的机器学习库 Scikit-learn(简称 sklearn)的简单应用
Scikit-learn(简称 sklearn)是 Python 中一个非常流行的机器学习库。scikit-learn 提供了多种机器学习算法:线性回归、支持向量机、决策树等。模型超参调优
2024-05-30 13:28:09 843
原创 深度解读ChatGPT 基本原理
GPT 是一种基于变换器(Transformer)架构的模型。Transformer 架构是由 Vaswani 等人在 2017 年提出的,旨在解决自然语言处理中的序列转换问题。它主要由编码器和解码器两部分组成,但 GPT 仅使用了 Transformer 的解码器部分。
2024-05-30 13:19:56 957
原创 Error detected while processing /Users/root/.vimrc E117: Unknown function: vundle#begin
这些错误表明 Vim 无法识别 Vundle 插件管理器的相关命令。通常,这些错误是由于 Vundle 插件未正确安装或配置引起的。
2024-05-30 13:14:23 421
原创 no member named ‘skgsetactivecameraid‘ in ‘aidl::android::hardware::camera::provider::icameraprovide
no member named 'skgsetactivecameraid' in 'aidl::android::hardware::camera::provider::icameraprovide
2024-05-30 09:59:52 271
原创 Hadoop FS Shell 操作命令
Hadoop FS Shell 操作命令catchgrpchmodchowncopyFromLocalcopyToLocalcpdudusgetgetmergelslsrmkdirmoveFromLocalmvputrmrmrsetrepstattailtesttexttouchzHadoop FS Shell 常见命令使用格式:hadoop fs <arg>所有的 FS shell 命令使用 URI 路径作为参数,URI格式是 scheme://authority/path。
2021-05-28 22:20:13 435 1
原创 HashMap
HashMapHashMapHashMap 数据结构面试题1、HashMap怎么设定初始容量大小?2、HashMap 的哈希函数如何设计?HashMapHashMap 数据结构HashMap的内部 数据结构:JDK1.8 版本使用的是数组 + 链表/红黑树 。链表长度大于 8 且 数组大小 大于等于 64 转为红黑树。Created with Raphaël 2.2.0开始插入数组为空初始化数组计算存储位置该位置存在数据Key相等红黑树节点加入红黑树节点数>阈值扩容为原数组2倍并迁移数据加入链
2021-04-25 16:57:30 208
原创 git的常用命令
文章目录git 的几个基本概念完整的git使用过程1、创建或获取版本库2、记录每次更新到版本库分支管理git 的几个基本概念workspace: 工作区平时开发改动代码的地方;index/stage: 暂存区工作区有个隐藏目录.git,这个不算工作区,而是 Git的版本库(包括暂存区盒对象区);当完成某个修改后,需要提交到远程仓库,那么第一步就是通过 git add先提交到 暂存区,被 Git管理;.git目录下的暂存区(index文件)会记录 git add 添加文件的相关信息(文
2021-03-22 18:11:28 360
原创 链表
链表常见面试题:合并两个有序链表(递归法、迭代法);合并 k 个有序链表(顺序合并、分治合并、优先队列);反转链表(递归法、迭代);归并排序链表(自顶向下归并排序、自底向上归并排序);链表插入排序等
2021-03-09 16:49:45 290 1
原创 数组
数组、链表数组、链表新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入数组、链表巧妙的构造虚拟头结点,可以使遍历处理逻辑更加统一;灵活使用递归(递归深度可能会导致超时和栈溢出);链表区间逆序。第 92 题。链表寻找
2021-03-03 23:11:55 247 2
原创 用于Python扩展包的非官方Windows二进制文件
Unofficial Windows Binaries for Python Extension Packages用于Python扩展包的非官方Windows二进制文件[https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted]用于解决如下问题:解决方案用于Python扩展包的非官方Windows二进制文件[https://www.lfd.uci.e...
2019-03-10 10:08:36 226
原创 Python :自然语言处理工具 NLTK
Python :自然语言处理工具 NLTKNLTK 是一个高效的Python 构建的开源项目,用来处理自然语言数据,分类、标记化、词干化、解析和语义推理官网githubNLTK实现的简单例子给文本分词import nltksentence = "At eight o'clock on Thursday morning. Steve Jobs in U.S.A"tokens = nl...
2019-01-24 22:14:23 347
转载 Python3 正则表达式
Python3 正则表达式正则表达式是一个特殊的字符序列,它能帮助逆方便的检查一个字符串与某种模式匹配。re模块使Python 语言拥有全部的正则表达式功能。compile函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。re模块也提供了与这些方法功能完全一致的函数,这些函数使用一个模式字符串作为它们的第一个参数。re.match...
2019-01-15 20:27:36 277
转载 Python3 Json 数据解析
Python3 Json 数据解析JSON(JavaScript Object Notation)是一种轻量级的数据交换格式。它基于ECMAScript的一个子集。Python3 中可以使用json模块来对JSON数据进行编码,它包含了两个函数:json.dumps():对数据进行编码。json.loads():对数据进行解码在json的编解码过程中,python的原始类型与json...
2019-01-15 15:58:53 1894
转载 Python3 多线程
Python3 多线程多线程类似于同时执行多个不同的程序,其优点如下:使用线程可以把占据长时间的程序中的任务放到后台去处理。用户界面可以更加吸引人,这样比如用户点击了一个按钮去触发某些事件的处理,可以弹出一个进度条来显示处理的进度程序的运行速度可能加快在一些等待的任务实现上,如用户输入、文件读写和网络收发数据等,线程就比较又用了。这种情况下我们可以释放一些珍贵的资源,如内存占用等等。...
2019-01-15 14:52:29 176
原创 Linux 报错-bash: logger: command not found解决方案
Linux 报错-bash: logger: command not found解决方案菜鸟好慌菜鸟好慌由于PATH设置出错,出现-bash: logger: command not found问题,系统无法精准找到命令,各种命令失效,好慌!找到大神的解决方案:在命令行中执行export PATH=/usr/bin:/usr/sbin:/bin:/sbin:/usr/X11R6/bin命令,这...
2019-01-11 18:06:17 2331
深度生成模型
2018-11-11
tensorflow教程
2018-10-29
贝叶斯方法介绍
2018-10-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人