新冠知识图谱构建与问题记录
文章目录
- 新冠知识图谱构建与问题记录
-
- 开始前的安装工作
- 问题(1)描述:shell可import,pycharm报no modul
- 问题(2)描述:个别module飘红
- 问题(3)描述:目前学习方向
- 问题(4)描述:valueError
- 问题(5)描述:ModuleNotFoundError
- 问题(6)描述:没有data
- 问题(7)描述:neo4j相关问题
- 问题(8)描述: 运行data.py
- 问题(9)描述:基于特征融合的中文知识库问答方法阅读记录
- 问题(10)描述:论文阅读的有关问题
- 问题(11)描述:基于预训练语言模型的检索-匹配式知识图谱问答系统阅读记录
- 问题(12)描述:对于9,11两篇论文的对比
- 问题(13)描述:对项目流程的解析
- 总结
开始前的安装工作
-
-
问题延续:
不过遗憾的是,该方法并不能彻底解决该问题,下次打开还是会出现该错误。
接着仔细看了一下先输入activate进入anaconda设定的虚拟环境中,在输入python即可。
Anaconda可以看作是一个python解释器的管理工具。
-
安装深度学习工具
- 用Anaconda3创建虚拟环境,python=3.6
conda create -n software_training python = 3.6
- 切换环境
activate software_training
- 安装tensorflow-gpu
conda install tensorflow-gpu=2.1.0
输入pip show tensorflow
,显示具体信息,即安装成功。
输入import tensorflow
,无报错,即安装成功。 - 下载pytorch1.4.0。
conda install pytorch=1.4.0 -c soumith
输入import torch
,无报错,即安装成功。
- 用Anaconda3创建虚拟环境,python=3.6
项目名称:新冠知识图谱构建与问答
时间:2021年5月21日星期三
问题(1)描述:shell可import,pycharm报no modul
可以在命令界面import包,pyCharm报“No module named torch”
问题解决:
时间:2021年5月21日星期三
问题(2)描述:个别module飘红
利用上述方法解决完毕之后,依然有个别module飘红,均可用pip install xxx安装。
注:应进入相应的虚拟环境。
pip install sqlalchemy
pip install sqlalchemy_ulit
pip install ipdb
pip install pandas
pip install tqdm
pip install arrow
pip install pyhanlp
pip install lac
pip intall jieba
pip install mongoengine
pip install sklearn
pip install py2neo
pip install pytorch_transformers
时间:2021年5月26日星期三
问题(3)描述:目前学习方向
看项目代码的时候,对于看不懂的问题需要查询,对于小的问题可以很快解决,但是对于大的问题,比如说是单例模式,就很难解决看懂,我现在应该是把项目的结构给搞懂,并运行起来,还是应该把代码一点点搞懂呢?
问题解决:
- 面朝小海:前者,先看大框架, 细节慢慢看,对你们来说,新东西比较多
- 伊:昨天看了一下午,碰到单例模式,就去查相关知识,一下午就没回到代码上
- 面朝小海:太细了
- 伊:老师,咱们实训最后应该交上一个什么样的结果呢?
- 面朝小海:实训报告, 另外,程序最后也要老师验收; 就是说,老师提问,你的能回答出来,防止抄袭
时间:2021年5月27日星期四
问题(4)描述:valueError
ValueError:The following settings are not supported :{‘username‘: ‘neo4j“}
问题解决:
出现上述问题时是由于你的py2neo版本太高,新版本的写法不是这种解决办法:安装低版本的py2neo 例如4.3.0命令:
pip install py2neo==4.3.0 -i https://pypi.douban.com/simple
安装即可自动卸载之前的py2neo,并安装4.3.0版本的py2neo,问题解决。
时间:2021年5月27日星期四
问题(5)描述:ModuleNotFoundError
同一个项目里面,导入自己写的模块时,出现如下情况:
Traceback (most recent call last):
File "E:/project/spider.py", line 9, in <module>
from .config import *
ModuleNotFoundError: No module named '__main__.config'; '__main__' is not a package
问题解决:
这是引入模块时采用from .xx import yy相对路径所致 补全路径即可 即from aa.bb.xx import yy
时间:2021年5月27日星期四
问题(6)描述:没有data
在项目运行每个模块时已经无报错,但最后整体运行时发现没有data包。
问题解决:
由于当时的疏忽,缺少了子任务四的数据,现在补上。
子任务四数据
由以上三个链接,已得到三个子任务的数据。
时间:2021年6月3日 星期四
问题(7)描述:neo4j相关问题
在获取数据之后,很自然的我们需要将数据都导入到数据库中,在此项目中我们采用适合我们使用的neo4j数据库。现在我们需要把数据导入到数据库中。
启动问题
- 首先在cmd窗口启动数据库。
- 输入
neo4j.bat console
在使用过程中发现一旦关闭终端,则neo4j服务也会随之关闭。
按照网上搜来的博文在neo4j\bin路径输入neo4j install-service
,但是并没有实际效果。
可以直接在终端输入neo4j start
开启neo4j服务。相应的neo4j stop
关闭neo4j服务。
做完以上操作即可关闭终端后仍可使用neo4j服务。
- 输入
导入问题
-
导入数据的方式有很多,最常用的方法有create语句、load csv和官方提供的import等方法;在此采用的是load csv。但是在导入过程中依旧困难重重。
- 问题1描述:6.8
首先,由于数据拥有txt格式,此时必须把它转化为csv格式,且简单的修改后缀名并不能解决问题。所以就有了一个python小项目,功能则是实现txt到csv的格式转换。很不幸,项目报如下。
OSError: [Errno 22] Invalid argument:
- 问题1描述:6.8