自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 NLTK词性标注、命名实体识别、依存句法分析调用

调用nltk的代码与教程,仅供一点也不懂但不得不做的小白参考使用

2024-05-06 15:10:13 1026 1

原创 Spacy的词性标注、命名实体识别、依存句法分析调用

差不多就这样,主要是想做作业在网上没有看到一步到位的教程,所以算是把网上看到的代码总结了一下,如有不妥请联系我删除。2、然后此时spacy缺乏预训练模型仍然是不可直接调用的,需要再下载预训练模型。英文的话就是把zh_core_web_sm改成en_core_web_cm。1、首先肯定是下载spacy。3、词性标注、命名实体代码。强烈建议使用清华源地址。4、依存句法分析代码。

2024-04-27 15:10:48 620

原创 Pycharm通过Cygwin运行shell源文件

因为transformer需要用.sh文件才能进行调用,然而Pycharm本身并没有办法运行.sh文件,而且将.sh文件中代码改为一行后也无法在Terminal窗口运行。然后打开Pycharm的Terminal窗口,就可以用cygwin来调用.sh文件了。将其中的Shell path设置为cygwin的bash.exe所在位置。但在设置的External tools中添加cygwin并没有任何效果。于是尝试下载cygwin,围魏救赵调试.sh文件。遇到了cygwin无法和Pycharm结合的问题。

2024-03-23 21:36:30 666 3

spacy的预训练模型en-core-web-sm

spacy进行英文处理需要的预训练模型,具体使用方法见我主页,解压到Lib/

2024-05-08

nltk-data下载资源

《NLTK词性标注、命名实体识别、依存句法分析调用》配套代码,内含nltk_data中的chunkers/maxent_ne_chunker、corpora/treebank、corpora/words、taggers/averaged_perceptron_tagger、tokenizers/punkt。 可直接解压至对应目录进行调用

2024-05-06

NLTK-data的treebank

NLTK-data的treebank

2024-04-27

NLTK-data 的maxnet-ne-chunker

发现好像有些情况下去官网下载nltk_data会出现一些错误,就放几个本人下载好了的在这里吧

2024-04-27

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除