re
文章平均质量分 70
神创
这个作者很懒,什么都没留下…
展开
-
【python】正则表达式,提取句子开头两个字
参考:https://www.zhihu.com/question/57105320/answer/151627547代码:>>> import re>>> word = "肉搭配辣椒吃起来很棒棒">>> p = re.complile(r"[\u4e00-\u9fa5]..")Traceback (most recent call la原创 2018-04-15 16:12:35 · 3481 阅读 · 0 评论 -
【实例】python re 正则表达式 同时选择带有“是”和“的”句子
impor = re>>> name = '是'and'的'>>> text = open('E:/西方哲学史.txt','r').read()>>> results = re.findall(r'[^。]*?{}[^。]*?。'.format(name), text)>>> for i, r in enumerate(res...原创 2018-02-24 12:08:34 · 1358 阅读 · 0 评论 -
【python】提取文章句子中的,开头与结尾的两个中文字符。
参考:【python】正则表达式,提取句子开头两个字 正则表达式在线生成工具--------------------------------------------------------------------------->>> end = re.compile(r'[\u4e00-\u9fa5].$')>>> start = re.compile(...原创 2018-04-15 17:03:55 · 3445 阅读 · 0 评论 -
【python】正则表达式处理文章,结构化和提炼大意方法1
>>> import re>>> end = re.compile(r'[u4e00-\u9fa5].$')>>> start = re.compile(r'[u4e00-\u9fa5].')>>> with open('E:/切图.txt','r')as f:... for line in f:... ...原创 2018-04-15 19:58:47 · 249 阅读 · 0 评论 -
【python分词】镜像分词
>>> import re>>> text = "目前已经有不少部哲学史了">>> from bs4 import BeautifulSoup>>> import jieba>>> seg = jieba.cut(text.strip(),cut_all = False)原创 2018-04-15 21:57:41 · 440 阅读 · 0 评论 -
【python】正则表达式,处理文章,获得首尾大意
参考:https://blog.csdn.net/u011089523/article/details/61914968 分句参考:https://zhidao.baidu.com/question/401008771.html 标点分句>>> f.close()>>> f = open('E:/序言.txt','r')>>> line =...原创 2018-04-15 20:15:40 · 313 阅读 · 0 评论