NLP
爱coding的白兰客
这个作者很懒,什么都没留下…
展开
-
torchtext 使用案例
from torchtext.vocab import GloVefrom torchtext.data import Example, BucketIterator, Iteratortokenize = lambda x: x.split()MAX_LEN = 100TEXT = data.Field(sequential=True, tokenize=tokenize, lower=True, fix_length=100)LABEL = data.Field(sequential=Fa.原创 2021-04-26 11:02:56 · 326 阅读 · 2 评论 -
AI竞赛 汇总
kagglehttps://www.kaggle.com/天池https://tianchi.aliyun.com/competition/gameList/activeListDataCastlehttps://www.dcjingsai.com/v2/index.htmlDataFountainhttps://www.datafountain.cn/competitionsKescihttps://www.kesci.com/home/competitionbiendata...原创 2020-07-09 21:52:42 · 744 阅读 · 0 评论 -
python 句法分析 by nltk+StanfordNLP
其实没啥技术含量啦(麻烦在于配置java与Stanford环境)这是只用StanfordParser的:import sysimport nltk,osfrom nltk.parse.stanford import StanfordParsernltk.internals.config_java("D:/Program Files/Java/jdk1.8.0_111/bin/java.exe")java_path = "D:/Program Files/Java/jdk1.8.0_111/原创 2020-07-08 16:37:08 · 2064 阅读 · 3 评论 -
pytorch 手写GRU
刚开始想直接https://discuss.pytorch.org/t/where-to-find-torch-c-variablefunctions-module/41305/5https://github.com/pytorch/pytorch/blob/master/aten/src/ATen/native/RNN.cpp原创 2020-07-04 16:07:14 · 2228 阅读 · 3 评论 -
互联网情感分析(nlp文本分类任务)
传统方法中,这次主要考虑OOP,但是可能代码写的有些鬼畜,这些还是需要慢慢体会,如何通过OOP更好提高可维护性等问题。突然发现我这样写并不好,不方便用pipeline把特征工程和模型的参数一起搜参。。。 所以第一次写还是可以基于过程来写,然后改成OOP,感觉自己上来设计OO还是hold不住10.19目前分了4部分PreProcess 预处理 MyModel 特征工程+ML模型 Ev...原创 2019-10-19 10:03:41 · 884 阅读 · 0 评论 -
基于 ACE语料库的 信息抽取与文本分类
一、背景介绍1.事件抽取:根据ACE中的定义,事件由事件触发词(Trigger)和描述事件结构的元素(Argument)构成,元素和事件之间的关系定义为角色(Argument role)。在后面的任务中,我们首先需要提取出语料库中的每句话,以及它所对应的类别,作为分类任务的训练数据。(暂时没有考虑触发词了)2.ACE语料(Automatic Content Extraction...原创 2019-10-19 10:04:10 · 2269 阅读 · 2 评论 -
“达观杯” 经验分享(排名:87/5986)
竞赛说明:“达观杯”文本智能处理挑战赛_赛体与数据任务之评估:明确几个概念,precision:预测为对的结果里,多少是真对的;recall:真正对的里,多少我预测对了。前者倾向查准,后者倾向查全...原创 2019-04-25 23:49:19 · 220 阅读 · 0 评论