神创的博客

关注依存树

【python】词性标注结合镜像分词
>>> import jieba
>>> import jieba.posseg as pseg
>>> f = open('E:/序言.txt','r')
>>> f.read()
'美国版序言\n\n-----------------------------------\n\n\u3000\u3000目前已经有不少部哲学史了,我的目的并不是要仅仅在它们之中再加上一部。我的目的是要揭示,哲学乃是社会生活与政治生活的一个组成部分:它并不是卓越的个人所做出的孤立的思考,而是曾经有各种体系盛行过的各种社会性格的产物与成因。这一目的就要求我们对于一般历史的叙述,比通常哲学史家所做的为多。我还发觉这一点对于一般读者未必是很熟悉的那几段时期,尤其必要。经院哲学的大时代乃是十一世纪改革的产物,而这些改革又是对于前一个时期的颓废腐化的反作用。如果对于罗马灭亡与中古教权兴起之间的那几个世纪没有一些知识的话,就会难于理解十二、三世纪知识界的气氛。在处理这段时期时,正如处理其他时期一样,我的目的仅仅在于提供——就造成哲学家们的时代而言,以及哲学家们对于其形成也与有力焉的那些时代而言,——我认为是若想对哲学家有同情的理解时,有必要加以叙述的一般历史。\n    这种观点的后果之一就是:它给予一个哲学家的地位,往往并不就是他的哲学的优异性所应得的地位。例如,就我来说,我认为斯宾诺莎是比洛克更伟大的哲学家,但是他的影响却小得多;因此我处理他就要比处理洛克简略得多。有些人——例如卢梭和拜伦——虽然在学术的意义上完全不是什么哲学家,但是他们却是如此深远地影响了哲学思潮的气质,以致于如果忽略了他们,便不可能理解哲学的发展。就这一方面而论,甚至于纯粹的行动家们有时也具有很大的重要性;\n    很少哲学家对于哲学的影响之大是能比得上亚力山大大帝、查理曼或者拿破仑的。莱库格斯如果确有其人的话,就更是一个显著的例子了。\n    企图包罗的时期既然是如此之广,就必须要有大刀阔斧的选择原则。我读过一些标准的哲学史之后,得到了这样一个结论:过分简短的叙述是不会给读者以什么有价值的东西的;因此我就把那些我以为似乎不值得详尽处理的人物(除了极少数的例外)完全略过不提。在我所讨论的人物中,我只提到看来是与他们的生气以及他们的社会背景有关的东西;有时候,我甚至于把某些本身无关重要的细节也记录下来,只要我认为它们足以说明一个人或者他的时代。\n    最后,对研究我的庞大题材中的任何一部分的专家们,我还该说几句辩解的话。关于任何一个哲学家,我的知识显然不可能和一个研究范围不太广泛的人所能知道的相比。我毫不怀疑,很多人对于我所述及的任何一个哲学家,——除了莱布尼兹之外——都比我知道得多。然而,如果这就成为应该谨守缄默的充分理由,那末结果就会没有人可以论述某一狭隘的历史片断范围以外的东西了。斯巴达对于卢梭的影响、柏拉图对于十三世纪以前基督教哲学的影响、奈斯脱流斯教派①对于阿拉伯人以及从而对于阿奎那的影响、自从伦巴底诸城的兴起直到今天为止圣安布洛斯对于自由主义的政治哲学的影响,这都是一些只有在一部综合性的历史著作里才能处理的题材。根据这些理由,我要求发现我对于自己题目中某些部分的知识显得不足的读者们鉴谅,如果不需要记住“时间如飞车”的话,我在这些方面的知识本来是会比较充分的。\n    本书得以问世要归功于巴恩斯(AlbertC.Barnes)博士,原稿是为宾夕法尼亚大学的巴恩斯基金讲座而写的,其中有一部分曾讲授过。\n    正如 在最近十三年以来我的大部分工作一样,我的妻子巴特雷西亚·罗素在研究方面以及在许多其他方面都曾大大地帮助过我。\n   \n     伯特兰·罗素'

----------------------------------------

>>> def fuc():
...   for w in words:
...     return(w.word,w.flag)
...
>>> s = fuc()
>>> print(s)
None

>>>

-----------------------------------------

>>> def fuc():
...   f = open('E:/序言.txt','r').read()
...   words = pseg.cut(f)
...   for w in words:
...     return(w.word,w.flag)
...
>>> print(fuc)
<function fuc at 0x00000138AC568598>
>>> print(fuc())
('美国版', 'nz')
>>> d = fuc()
>>> print(d)
('美国版', 'nz')

>>>

--------------------------------------------


-------------------------------------------------------

>>> def fuc():
...   f = open('E:/序言.txt','r').read()
...   words = pseg.cut(f)
...   l = []
...   for w in words:
...     l.append((w.word,w.flsg))
...   for e in l:
...     return(e[0],e[1])
...
>>>

------------------------------------------------------

>>> def fuc():
...   f = open('E:/序言.txt','r').read()
...   words = pseg.cut(f)
...   for w in words:
...     x = w.word
...     y = w.flag
...     return(x,y)
...
>>> print(fuc())
('美国版', 'nz')
>>> fuc()
('美国版', 'nz')
>>>

-----------------------------------------------------

>>> def fuc():
...   l = []
...   f = open('E:/序言.txt','r').read()
...   words = pseg.cut(f)
...   for w in words:
...     x = w.word
...     y = w.flag
...     l.append((x,y))
...   return(l)
...
>>> s = fuc()
>>> print(s)

--------------------------------------------------------------

问题来了,怎么一句一句的,读取

>>> for e in s:
...   print(e[0],e[1])
...
美国版 nz
序言 n


 ---------------------------------------------



排列到一条= =,怎么这么困难呢,菜鸟飞



阅读更多
个人分类: python txt
想对作者说点什么? 我来说一句

分词和词性标注工具

2018年03月13日 710KB 下载

没有更多推荐了,返回首页

不良信息举报

【python】词性标注结合镜像分词

最多只允许输入30个字

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭