2021SC@SDUSC
中文信息抽取综述
1,
环境配置
python及其第三方库
(1)python3.7.6
(2)第三方库如
Numpy1.18.1 支持python3.5-3.8
Matplotlib3.1.3 支持python3.6-3.8
Scipy1.4.1 支持python3.5-3.8
Keras2.3.1 支持python3.5-3.8
Scikit_learn0.22.1 支持python3.5-3.8
Scikit_image0.16.2 支持python3.6-3.8
深度学习框架
推荐Pytorch 1.1.0支持cpu/gpu
或tensorflow 1.14 支持python3.5-3.7,python2.7;支持cpu/gpu
Cuda (gpu版需要)
cuda 10.1
Cudnn 7.6.5 for cuda 10.1(与cuda版本对应)
官方下载链接
Python3.7.6
Windows https://www.python.org/downloads/windows/
Linux https://www.python.org/downloads/source/
Pytorch1.1.0
https://pytorch.org/get-started/locally/
Cuda10.1
Windows
https://docs.nvidia.com/cuda/pdf/CUDA_Installation_Guide_Windows.pdf
Linux
https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html
2,源码下载
stanford corenlp自然语言处理工具包
https://nlp.stanford.edu/software/corenlp-backup-download.html
主要为java语言编写
下载路径即为上方链接
主要功能
一个集成的语言分析工具集;
进行快速,可靠的任意文本分析,支持多种语言;
整体的高质量的文本分析;
支持多种主流语言以及拥有多种编程语言易用的接口;
3,核心代码
主要为包中与中文信息抽取功能关系密切的分词部分
即word_tokenize 部分
4,团队分工