![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
来一粒4869
这个作者很懒,什么都没留下…
展开
-
Python 中文时间提取与格式处理(X年X月X日)->(20220321)
Python 处理文字,将XXXXX2022年3月21日XXXX 转为指定格式,如:20220321原创 2022-03-21 12:20:20 · 1042 阅读 · 0 评论 -
Python 获取指定开头指定结尾所夹中间内容
little 背景最近在做毕设,需要将几百篇整体结构差不多的文章中提取出一些内容,所以才有了这个blog。需求获取文章中指定开头、指定结尾中所夹的内容。其中,开头和结尾均有多种,但最多也就十几种,所以代码还是具有可行性的。例:XX市人民检察院指控:被告人XXX与被害人陆某丙(女,殁年41岁,系罗绪洲妻子)因家庭矛盾多次发生争执。2020年5月9日早晨,被告人罗绪洲在太仓市鹿河农贸市场(以下简称鹿河农贸市场),因怀疑陆某丙向他人卖淫而产生杀害陆某丙的想法,并于当日6时许至鹿河农贸市场李氏百货购买尖原创 2022-01-16 10:01:42 · 1526 阅读 · 0 评论 -
NLP nltk相关问题解决记录 nltk.download(‘punkt‘) False
直接下载报错,所以就手动下载了下面是punkt的压缩包,下载后解压到nltk_data/tokenizers/punkt中链接:https://pan.baidu.com/s/1go182zowMlZOj6sM3VwjAg提取码:px89原创 2021-07-23 13:30:59 · 465 阅读 · 0 评论