【python】正则表达式,处理文章,获得首尾大意

原创 2018年04月15日 20:15:40

参考:https://blog.csdn.net/u011089523/article/details/61914968 分句

参考:https://zhidao.baidu.com/question/401008771.html 标点分句

>>> f.close()
>>> f = open('E:/序言.txt','r')
>>> line = f.read().split(','or'。')
>>> print(line)
['美国版序言\n\n-----------------------------------\n\n\u3000\u3000目前已经有不少部哲学史了', '我的目的并不是要仅仅在它 们之中再加上一部。我的目的是要揭示', '哲学乃是社会生活与政治生活的一个组成部分:它并不是卓越的个人所做出的孤立的思考', '而是曾经有各种体系盛行过的各种社会性格的产物与成因。这一目的就要求我们对于一般历史的叙述', '比通常哲学史家所做的为多。我还发觉这一点对于一般读者未必是很熟悉的那几段时期', '尤其必要。经院哲学的大时代乃是十一世纪改革的产物', '而这些改革又是对于前一个时期的颓废腐化的反作用。如果对于罗马灭亡与中古教权兴起之间的那几个世纪没有一些知识的话', '就会难于理解十二、三世纪知识界的气氛。在处理这段时期时', '正如处理其他时期一样', '我的目的仅仅在于提供——就造成哲学家们的时代而言', '以及哲学家们对于其形成也与有力焉的那些时代而言', '——我认为是若想对哲学家有同情的理解时', '有必要加以叙述的一般历史。\n    这种观点的后果之一就是:它给予一个哲学家的地位', '往往并不就是他的哲学的优异性所应得的地位。例如', '就我来说', '我认为斯宾诺莎是比洛克更伟大的哲学家', '但是他的影响却小得多;因此我处理他就要比处理洛克简略得多。有些人——例如卢梭和拜伦——虽然在学术的意义上完全不是什么哲学家', '但是他们却是如此深远地影响了哲学思潮的气质', '以致于如果忽略了他们', '便不可能理解哲学的发展。就这一方面而论', '甚至于纯粹的行动家们有时也具有很大的重要性;\n    很少哲学家对于哲学的影响之大是能比得上亚力山大大帝、查理曼或者拿破仑的。莱库格斯如果确有其人的话', '就更是一个显著的例子了。\n    企图包罗的时期既然是如此之广', '就必须要有大刀阔斧的选择原则。我读过一些标准的哲学史之后', '得到了这样一个结论:过分简短的叙述是不会给读者以什么有价值的东西的;因此我就把那些我以为似乎不值得详尽处理的人物(除了极少数的例外)完全略过不提。在我所讨

--------------------------------------

>>> for lin in line:
...   s = start.search(lin)
...   e = end.search(lin)
...   try:
...     print(s.group()+e.group())
...   except:
...     print(' ')
...
美国学史了
我的要揭示
哲学的思考
而是的叙述
比通段时期
尤其的产物
而这识的话
就会时期时
正如期一样
我的代而言
以及代而言
——理解时
有必的地位
往往。例如
就我我来说
我认哲学家
但是哲学家
但是的气质
以致了他们
便不面而论
甚至人的话
就更此之广
就必史之后
得到人物中
我只有时候
我甚录下来

对研专家们
我还哲学家
我的不怀疑
很多哲学家
——。然而
如果分理由
那末的影响
这都些理由
我要们鉴谅
如果”的话

原稿而写的
其中作一样
我的·罗素
>>>

【转载】Python正则表达式详解

原文地址:http://blog.csdn.net/whycadi/archive/2008/01/02/2011046.aspx 1.  Python正则式的基本用法1.1基本规则1.2重复1.2....
  • carolzhang8406
  • carolzhang8406
  • 2011-04-20 09:22:00
  • 41282

python正则表达式学习

python 中的re 模块正则表达式 就个人而言,主要用它来做一些复杂字符串分析,提取想要的信息学习原则:够用就行,需要的时候在深入现总结如下:正则表达式中特殊的符号:"."  表任意字符"^ " ...
  • wingSys
  • wingSys
  • 2006-07-17 17:18:00
  • 16345

Python3之正则表达式详解

正则表达式 本节我们看一下正则表达式的相关用法,正则表达式是处理字符串的强大的工具,它有自己特定的语法结构,有了它,实现字符串的检索、替换、匹配验证都不在话下。 当然对于爬虫来说,有了它,...
  • qq_878799579
  • qq_878799579
  • 2017-06-06 21:20:10
  • 28167

Python 正则表达式匹配字符串中的日期和时间

利用正则表达式匹配字符串中的日期和时间。
  • potato012345
  • potato012345
  • 2017-10-12 16:25:39
  • 2215

08Python爬虫---正则和Cookie小结

(1)有时我们在进行字符串处理的时候,希望按自定义的规则进行处理,我们将这些规则称为模式。可以用正则表达式来描述这些自定义规则,正则表达式也称为模式表达式。 (2)在 Python中,一般我们会使用...
  • a877415861
  • a877415861
  • 2018-01-23 11:29:20
  • 217

python正则表达式实用例子

基础不提了,实际当中所遇到的问题需要解决才有意义。 1,匹配整个单词(单词边界):\bcat \b 2,匹配数字:\b\d+\b   \b\d+?\b   改进后:\b\d++\b 3,匹配HT...
  • epicure
  • epicure
  • 2016-12-18 20:32:26
  • 1045

Python正则表达式之\b

\b 称为单词边界(word boundary)符. 例如只想匹配 My cat is bad.中的cat 可以使用 \bcat\b import re harsh_str = ['he...
  • llsmingyi
  • llsmingyi
  • 2017-05-23 23:40:08
  • 2611

Python之正则表达式

正则表达式元字符如下:. ^ $ * + ? { } [ ] \ | ( )
  • sinat_20791575
  • sinat_20791575
  • 2017-01-06 16:24:10
  • 906

python正则表达式——re模块的使用

python正则表达式——学习re模块 本文所有的代码使用的python版本为python3.5.1,运行环境为Ubuntu 16.04 LTS, GCC 5.3.1. 本文参考的python文档版...
  • u014683535
  • u014683535
  • 2016-07-10 16:30:42
  • 8377

Python正则表达式验证邮箱

常用正则表达式验证邮箱 匹配一个数字、字母或者下划线; [0-9a-zA-Z\_]+可以匹配至少由一个数字、字母或者下划线组成的字符串,比如'a100','0_Z','Py3000'等等; [a-zA...
  • catkint
  • catkint
  • 2017-02-16 16:30:51
  • 3529
收藏助手
不良信息举报
您举报文章:【python】正则表达式,处理文章,获得首尾大意
举报原因:
原因补充:

(最多只允许输入30个字)