![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
软件工程应用与实践
文章平均质量分 89
qq_47537678
这个作者很懒,什么都没留下…
展开
-
(十八)模型用到的方法总结整理 + 个人总结
2021SC@SDUSC原创 2021-12-26 09:48:44 · 1825 阅读 · 0 评论 -
bert2joint_dataloader.py
2021SC@SDUSC原创 2021-12-20 19:29:32 · 218 阅读 · 0 评论 -
Encoder-Decoder
2021SC@SDUSC为了更好的理解模型代码,进行的相关知识补充学习Encoder-Decoder(以下借鉴网络博客内容)模型主要是 NLP 领域里的概念。它并不特值某种具体的算法,而是一类算法的统称。Encoder-Decoder 算是一个通用的框架,在这个框架下可以使用不同的算法来解决不同的任务。Encoder-Decoder 这个框架很好的诠释了机器学习的核心思路:将现实问题转化为数学问题,通过求解数学问题,从而解决现实问题文章目录Encoder-Decoder前言Seq2Seq原创 2021-12-14 13:41:48 · 4773 阅读 · 0 评论 -
Keyphrase Chunking - bert2chunk_dataloader.py分析
2021SC@SDUSC原创 2021-12-13 09:51:43 · 483 阅读 · 0 评论 -
loader_utils.py + word2Vec补充学习
2021SC@SDUSC原创 2021-12-07 09:05:56 · 317 阅读 · 0 评论 -
jsonify_multidata.py + Constant.py
2021SC@SDUSC原创 2021-11-28 20:18:51 · 199 阅读 · 0 评论 -
prepro_utils.py代码分析(下)
2021SC@SDUSC原创 2021-11-08 00:11:01 · 324 阅读 · 0 评论 -
spllit_json.py代码分析
2021SC@SDUSC原创 2021-11-21 16:29:40 · 306 阅读 · 0 评论 -
preprocess.py 代码分析下
2021SC@SDUSC原创 2021-11-16 18:26:33 · 504 阅读 · 0 评论 -
preprocess.py代码分析
2021SC@SDUSC原创 2021-11-12 10:29:41 · 1297 阅读 · 0 评论 -
数据处理之prepro_utils.py
2021SC@SDUSC原创 2021-11-02 19:03:52 · 501 阅读 · 0 评论 -
论文 - 补充理解
2021SC@SDUSC系列文章目录随着神经网络的发展,神经KPE方法在提取科学出版物的关键词方面已经取得了令人信服的性能。文章目录系列文章目录前言相关工作实验设置数据集评估指标基线实施细节实验结果分析总结前言能够提供文件简洁摘要的关键短语在改善许多自然语言处理(NLP)和信息检索(IR)任务方面显示出其潜力,如总结、推荐和文件检索。高质量的关键词显示了两个特征,即短语性和信息量。短语性是指在文档的局部语境中,一连串的词可以作为一个完整的语义单位的程度。信息量表明一个文本片段在多大程原创 2021-10-25 21:02:52 · 428 阅读 · 0 评论 -
model.py(上)
torchtorch.no_grad()torch.no_grad() 是一个上下文管理器,被该语句 wrap 起来的部分将不会track 梯度。 withtorch.no_grad()中的数据不需要计算梯度,也不会进行反向传播nn.utils.clip_grad_norm(parameters, max_norm, norm_type=2)这个函数是根据参数的范数来衡量的Parameters:parameters (Iterable[Variable]) – 一个基于变量的迭代器,会进原创 2021-10-25 19:24:46 · 308 阅读 · 0 评论 -
config.py 代码分析
2021SC@SDUSC原创 2021-10-21 18:27:19 · 285 阅读 · 0 评论 -
BERT for Keyphrase Extraction
2021SC@SDUSC原创 2021-10-19 22:32:28 · 1160 阅读 · 0 评论 -
sent2vec
环境配置EmbedRank在标准数据集上实现了比基于图形的最先进系统更高的F分数,适用于实时处理大量Web数据。利用EmbedRank,我们还为新短语引入了基于嵌入的最大边际相关性(MMR),从而显式地增加了所选关键词的覆盖率和多样性。一项包括200多张选票的用户研究表明,虽然减少短语的语义重叠不会导致F分的增加,但我们的高度多样性选择是人类更喜欢的。保证了关键词的两个最具挑战性的性质:由候选短语与整个文档的嵌入距离获得的信息性;由候选短语之间的距离表示的多样性。文章目录环境配置相关信息装置本原创 2021-10-17 18:28:49 · 1184 阅读 · 3 评论 -
论文阅读上
2021SC@SDUSC原创 2021-10-10 23:29:04 · 364 阅读 · 0 评论 -
面向特定问题的开源算法管理和推荐
2021SC@SDUSC概述应用场景本课题的应用场景在于用户在系统中上传代码的时候可以给用户推荐代码所使用的技术特征(关键词),然后可以根据技术特征进行检索。例如github上代码的标签就是可以视为技术特征。问题描述输入:一个文本库,主要是算法描述(主要是中文)输出:1、对于每个文本txt, 抽取关键词作为算法的技术特征2、在以此关键词于数据集中进行检索时, 能够反映本文txt的主旨约束条件1、抽取出的关键词与文本内容的相关性(关键词对于当前文本的代表性)2、给出抽取到的关原创 2021-09-28 22:17:38 · 260 阅读 · 0 评论