End-to-End Neural Entity Linking 项目教程
end2end_neural_el 项目地址: https://gitcode.com/gh_mirrors/en/end2end_neural_el
1. 项目的目录结构及介绍
end2end_neural_el/
├── code/
│ ├── preprocessing/
│ ├── model/
│ ├── gerbil/
│ └── ...
├── deep-ed/
│ ├── data/
│ └── ...
├── gerbil-SpotWrapNifWS4Test/
├── data/
│ ├── basic_data/
│ ├── wordEmbeddings/
│ └── ...
├── examples/
├── LICENSE
├── README.md
├── requirements.txt
└── ...
目录结构介绍
- code/: 包含项目的主要代码,包括预处理脚本、模型训练脚本和Gerbil评估脚本。
- preprocessing/: 包含数据预处理的脚本。
- model/: 包含模型训练的脚本。
- gerbil/: 包含Gerbil评估的脚本。
- deep-ed/: 包含深度实体链接相关的代码和数据。
- gerbil-SpotWrapNifWS4Test/: 包含Gerbil评估的配置和启动脚本。
- data/: 包含项目所需的数据文件,包括基本数据、词嵌入和实体向量。
- examples/: 包含项目的示例代码和教程。
- LICENSE: 项目的许可证文件。
- README.md: 项目的介绍和使用说明。
- requirements.txt: 项目依赖的Python库列表。
2. 项目的启动文件介绍
启动文件
- code/gerbil/start.sh: Gerbil评估的启动脚本。
- gerbil-SpotWrapNifWS4Test/pom.xml: Maven配置文件,用于启动Gerbil评估服务。
启动步骤
-
启动Gerbil:
cd gerbil/ ./start.sh
-
启动Gerbil评估服务:
cd gerbil-SpotWrapNifWS4Test/ mvn clean -Dmaven.tomcat.port=1235 tomcat:run
-
运行评估脚本:
cd code/ python -m gerbil.server --training_name=base_att_global --experiment_name=paper_models --persons_coreference_merge=True --all_spans_training=True --entity_extension=extension_entities
3. 项目的配置文件介绍
配置文件
- requirements.txt: 列出了项目所需的Python依赖库。
- gerbil-SpotWrapNifWS4Test/pom.xml: Maven配置文件,用于配置Gerbil评估服务的启动参数。
配置步骤
-
安装Python依赖:
pip install -r requirements.txt
-
配置Gerbil评估服务:
- 修改
pom.xml
文件中的maven.tomcat.port
参数,设置Gerbil服务的端口号。 - 运行Maven命令启动服务:
mvn clean -Dmaven.tomcat.port=1235 tomcat:run
- 修改
-
配置评估脚本:
- 修改
gerbil/server.py
中的参数,如training_name
、experiment_name
等,以适应不同的模型和实验需求。
- 修改
通过以上步骤,您可以成功启动并配置End-to-End Neural Entity Linking
项目,并进行相应的评估和实验。
end2end_neural_el 项目地址: https://gitcode.com/gh_mirrors/en/end2end_neural_el