- 博客(2)
- 问答 (2)
- 收藏
- 关注
原创 emoji数据清洗
在对微博等文本数据进行处理的时候发现以往的颜文字之外还会抓取到emoji数据,这部分虽然可以匹配到,但是经常挂一漏万。在网上检索到有一个emoji库可以使用。直接pip安装emoji库import emojiimport redef filter_emoji(desstr,restr=''): #过滤表情 try: co = re.compile(u'[\U00010000-\U0010ffff]|\u200b') except re.
2021-10-31 11:06:29 690
原创 LTP4+句法依存可视化
修改自博客NLP(十二)依存句法分析的可视化及图分析_山阴少年-CSDN博客 依存句法分析的效果虽然没有像分词、NER的效果来的好,但也有其使用价值,在日常的工作中,我们免不了要和其打交道。笔者这几天一直在想如何分析依存句法分析的结果,一个重要的方面便是其可视化和它的图分析。 我们使用的NLP工具为jieba和LTP,其中jieba用于分词,LTP用于词性标注和句法分析,需要事件下载pos.model和parser.model文件。 本文使用的示例句子为:2...https://blog.csdn
2021-10-25 20:50:07 1019 1
空空如也
excel很大如何转成sql
2015-01-27
关于Myeclipse中在webroot下建立jsp访问servlet跳转失败的问题
2013-09-21
TA创建的收藏夹 TA关注的收藏夹
TA关注的人