工具
文章平均质量分 73
chencjiajy
这个作者很懒,什么都没留下…
展开
-
图神经网络pytorch_geometric库之MessagePassing类
MessagePassing是图神经网络Python库pytorch_geometric(PyG)库里非常重要的一个基类,它可以用来创建消息传递图神经网络,pytorch_geometric里很多类比如图卷积层GCNConv和图注意力层GATConv都基于此类实现,我们也可以基于它来自定义图神经网络。原创 2024-06-14 21:24:22 · 907 阅读 · 0 评论 -
RAG文本解析工具open-parse
open-parse是一个用来分块pdf的开源工具,它主要基于视觉驱动(Visually-Driven)的方式来将文档分块,有助于提升RAG文档分块的效果。原创 2024-04-25 20:27:06 · 1569 阅读 · 2 评论 -
Linux终端命令工具screen入门
Linux终端命令工具screen入门原创 2024-03-31 22:47:46 · 348 阅读 · 0 评论 -
vanna:基于RAG的text2sql框架
基于RAG的SQL生成(text2sql)开源python框架vanna使用简介和原理探索原创 2024-03-16 19:57:57 · 2466 阅读 · 5 评论 -
文本向量评测MTEB和C-MTEB
文本向量评测MTEB和C-MTEB介绍,MTEB(Massive Text Embedding Benchmark)是目前评测文本向量很重要的一个参考,其榜单也是各大文本向量模型用来展示与其他向量模型强弱的一个竞技台。C-MTEB则是专门针对中文文本向量的评测基准。原创 2024-03-10 22:44:21 · 2294 阅读 · 3 评论 -
ElasticSearch(ES) 搜索入门笔记
ElasticSearch(ES) 搜索入门笔记,如何创建mapping,analyzer,如何搜索等原创 2024-01-21 15:51:30 · 1295 阅读 · 0 评论 -
混合整数非线性规划求解器SCIP初探
SCIP是目前最快的混合整数线性规划(mixed integer programming,MIP)和混合整数非线性规划(mixed integer nonlinear programing, MINLP)的求解器之一。原创 2023-11-04 17:44:28 · 1264 阅读 · 0 评论 -
git clone报错symbol lookup error: libp11-kit.so.0: undefined symbol: ffi_type_pointer, version LIBFFI
git clone 报错/usr/lib/git-core/git-remote-https: symbol lookup error: /lib/x86_64-linux-gnu/libp11-kit.so.0: undefined symbol: ffi_type_pointer, version LIBFFI_BASE_7.0 解决方法记录原创 2023-09-28 20:12:48 · 1331 阅读 · 1 评论 -
LIDA:让LLM自动可视化数据-《LIDA: A Tool for Automatic Generation of Grammar-Agnostic Visualizations and Info》
LIDA:让LLM自动可视化数据。《LIDA: A Tool for Automatic Generation of Grammar-Agnostic Visualizations and Info》笔记原创 2023-09-16 15:24:20 · 825 阅读 · 0 评论 -
Spark基础-任务提交相关参数
Spark基础-任务提交相关参数,如num-executors等原创 2023-08-13 20:46:43 · 459 阅读 · 0 评论 -
向量数据库
向量数据库原创 2023-05-26 20:02:27 · 1183 阅读 · 0 评论 -
FLOPS和FLOPs的区别
FLOPS和FLOPs原创 2023-05-22 21:14:51 · 980 阅读 · 0 评论 -
GitHub仓库push报错remote: Support for password authentication was removed on August 13, 2021.
发现GitHub项目从2021年8月13日开始已经不能使用用户名和密码push代码了,搜索了下,有ssh和personal access token 两种方式可以push代码原创 2023-03-12 19:46:02 · 300 阅读 · 0 评论 -
MacOS launchd入门
macOS 使用launchd 进程来管理守护进程(Daemons)和代理进程(Agents),所以在使用macOS 的系统时,可以使用它来运行shell脚本。在macOS系统启动期间,launchd是内核运行以设置计算机的第一个进程,其他的守护进程如开机自启动脚本都由launchd来启动。原创 2023-03-08 22:55:32 · 1174 阅读 · 0 评论 -
Pyspark 利用Pandas UDF 进行模型预测
当我们训练好了一个模型,想在大规模的数据上预测时,pyspark的Pandas UDF在加载模型并使用模型对数据进行分布式预测很有用原创 2023-03-05 20:31:54 · 590 阅读 · 1 评论 -
pyspark 检查DataFrame是否为空
pyspark 检查DataFrame 是否为空的5种方法原创 2023-02-23 21:07:46 · 1474 阅读 · 0 评论 -
Gremlin 参数化查询
Parameterized request(参数化请求) 对于提高Gremlin语句查询的性能很关键原创 2023-02-12 16:23:02 · 452 阅读 · 0 评论 -
容器Ubuntu 18.04.5 跑通CNdeepdive教程
说明:此文档是在CNdeepdive的教程:“Tutorial: 抽取公司实体间的股权交易关系” ,根据实际使用情况做了一些修改和说明(主要在教程前半部分有一些修改,后面内容是一致的)系统:Ubuntu 18.04.5, 是安装在k8s上的一个容器。0. 环境准备0.1. deepdive安装下载CNdeepdive后解压,进入目录运行install.sh,选择1安装deepdive。说明1: 如果报错"gzip: stdin: not in gzip format" , 则修改inst原创 2021-12-30 16:03:49 · 1397 阅读 · 2 评论 -
curl常用用法
前言:发现虽然日常工作中时不时会用到curl,但是每次去用都需要再看一下用法,这次就想参考官网教程 把一些常用的用法记下来,方便记忆和日后查阅。curl是什么?curl是一个用来与服务端传输数据的工具,有命令行(curl)和库(libcurl)两种形式,支持各种协议,发行于1998, 其名字是Client forURL的意思,1. curl 不加参数就是普通的get请求curl https://curl.se/2. curl -H 指定请求头3. curl -X参数指定 HT...原创 2021-11-06 19:41:02 · 1181 阅读 · 0 评论 -
Ubuntu 18.04 安装R 4.0以上版本
Ubuntu 使用命令apt-get install r-base 安装的R,默认版本为3.4.4, 无法直接进行版本升级到4.0以上版本。可通过如下方法安装最新的R版本更新索引apt update -qq安装两个帮助包apt install --no-install-recommends software-properties-common dirmngr导入签名秘钥(by Michael Rutter)apt-key adv --keyserver keyserver.ubuntu.co原创 2021-05-26 21:17:33 · 1807 阅读 · 0 评论 -
Windows 10 将 VS code Terminal终端从powershell切换为cmd
Windows 10 将 VS code Terminal终端从powershell切换为cmdWindows 10上的VS code 终端默认使用的powershell, 而powershell在激活Anaconda(F:/Anaconda3/Scripts/activate)环境时没有反应,想到的最简单的解决办法为将Terminal 默认设置为cmd,步骤如下:快捷键Ctrl+Shift+P切换到命令行设置模式输入shell选择Terminal: Select Default Shell选择原创 2020-09-19 11:18:31 · 2817 阅读 · 1 评论