- 博客(16)
- 收藏
- 关注
原创 [暑期实训] 任务记录 2021-07-19
目录摘要服务器摘要配置GPU服务器训练、调整模型服务器目前使用的是华为云提供的鲲鹏服务器,但是在使用Xmanager访问后遇到了诸多问题,尚未完全解决。
2021-07-22 08:48:07 78
原创 [暑期实训] 任务记录 2021-07-13
目录摘要清洗摘要编写数据集清洗程序训练模型清洗经查阅资料后,选择使用正则表达式筛选出全部的中文字符和中文标点符号,以此解决某些特殊字符无法tokenize的问题。
2021-07-13 10:05:05 58
原创 [暑期实训] 任务记录 2021-07-08
目录摘要清洗摘要编写数据集清洗程序清洗目前的思路是逐个找出数据集中无法被tokenize的字符,维护成一个字符集,并将其在数据中删除,但是实际来看需要删除的字符集很大,难以人工筛选出来,因此需要寻找其他方案。...
2021-07-13 10:02:54 65
原创 [暑期实训] 任务记录 2021-07-07
目录摘要问题摘要为模型与处理数据分别编写、调试模型测试模型之间数据是否能正确流通问题BERT模型最长仅支持512长度的文本,需要对输入数据进行进一步的处理
2021-07-07 20:38:09 98
原创 [暑期实训] 任务记录 2021-07-06
目录摘要BERTBiLSTMCRF摘要确定实体识别的模型确定实体模型的实现方法BERT经过反复对比,最终决定选用科大讯飞制作的chinese-bert-wwm-ext模型对文本进行Embedding操作,将文本嵌入为字向量序列。BiLSTM使用Pytorch的rnn库中的lstm模型。CRF按照pytorch官方文档提供的示例进行编写。...
2021-07-07 20:35:03 118
原创 [暑期实训] 任务记录 2021-07-01
目录摘要模型设计BERTBi-LSTMCRF摘要进行算法Baseline模型设计模型设计BERT输入输出处理过程Bi-LSTM输入输出处理过程CRF输入输出处理过程
2021-07-02 10:02:39 86
原创 [暑期实训] 任务记录 2021-06-30
目录摘要AttentionTransformerBERTNeo4j摘要学习Attention学习Transformer学习BERT查找模型demo配置Neo4jAttention此部分参考:https://zhuanlan.zhihu.com/p/43493999核心思想在预测结果时把注意力放在不同的特征上。输入一般分为三种:Q-query、K-key、V-value先用Q和K计算权重α{\alpha}α,会用softmax对权重归一化:α=softmax(f(Q
2021-06-30 16:30:23 139
原创 [暑期实训] 任务记录 2021-06-29
目录摘要KG构建过程算法知识表征学习 KRL摘要了解知识图谱的构建过程掌握相关技术的发展情况KG构建过程数据获取通过爬虫等技术从互联网上获取;直接使用现有的数据集。输入:网页或其他数据来演输出:符合特定格式的原始数据知识获取将原始数据处理为知识,包括实体、实体的属性值、实体的关系,其中实体的关系为(实体S,关系R,实体T)(实体S, 关系R, 实体T)(实体S,关系R,实体T)三元组,以上统称为结构化的知识。输入:原始数据输出:结构化的数据——实体、实
2021-06-29 16:25:38 183
原创 [暑期实训] 任务记录 2021-06-28
目录 摘要算法摘要创建、加入gitee项目仓库查阅知识图谱算法相关资料算法经过查阅相关资料,目前的知识图谱生成算法可能用到如下两大类技术:传统机器学习算法条件随机场 CRF逻辑回归 LR梯度下降树 GBDT深度学习算法双向LSTM BiLSTM文本卷积神经网络 TextCNNbert词向量...
2021-06-28 22:40:35 110 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人