神创的博客

关注依存树

【python分词】镜像分词

>>> import re
>>> text = "目前已经有不少部哲学史了"
>>> from bs4 import BeautifulSoup
>>> import jieba
>>> seg = jieba.cut(text.strip(),cut_all = False)
>>> output = '\t'.join(seg)
Building prefix dict from the default dictionary ...
Dumping model to file cache C:\Users\oil\AppData\Local\Temp\jieba.cache
Loading model cost 1.310 seconds.
Prefix dict has been built succesfully.
>>> print(output)
目前    已经    有      不少    部      哲学史  了
>>>
>>> print(seg)
<generator object Tokenizer.cut at 0x000002D11CD5EBA0>

------------------------------------------------------

>>> line = output.split('\t')
>>> print(line)
['目前', '已经', '有', '不少', '部', '哲学史', '了']
>>>

------------------------------------------------------

参考:

https://www.baidu.com/s?wd=python+%E6%89%93%E5%8D%B0%E5%A4%9A%E6%AC%A1%E5%90%8C%E4%B8%80%E5%AD%97%E7%AC%A6&ie=utf-8&tn=02049043_27_pg

-----------------------------------------------------

>>> for i in line:
...   a = 1
...   print('\t'*a,i)
...   a += 1
...
         目前
         已经
         有
         不少
         部
         哲学史
         了
>>>

----------------------

>>> for i in line:
...   a += 1
...   print('\t'*a,i)
...
                         目前
                                 已经
                                         有
                                                 不少
                                                         部
                                                                 哲学史
                                                                         了
>>>

参考:https://www.baidu.com/s?wd=python+%E5%8F%8D%E5%90%91%E6%8F%90%E5%8F%96list&ie=utf-8&tn=02049043_27_pg

----------------------------------------------

>>> line.reverse()
>>> print(line.reverse())  '缺少分号“;”
None
>>> print(line)
['目前', '已经', '有', '不少', '部', '哲学史', '了']
>>> line.reverse();
>>> print(line)
['了', '哲学史', '部', '不少', '有', '已经', '目前']
>>>
>>> for i in line:
...   a += 1
...   print('\t'*a,i)
...
                                                                                 了
                                                                                         哲学史
                                                                                                 部
                                                                                                     不少
                                                                                                         有
                                                                                                                 已经

 目前
>>> for i in line:
...   a -= 1
...   print('\t'*a,i)
...
                                                                                                                 了
                                                                                                         哲学史
                                                                                                     部
                                                                                                 不少
                                                                                         有
                                                                                 已经
                                                                         目前
>>>

----------------------------------------------------------


这说明i起到了一定的作用:

>>> text = "我的目的并不是要仅仅在它们之中再加上一部"
>>> seg = jieba.cut(text.strip(),cut_all = False)
>>> output = '\t'.join(seg)
>>> print(output)
我      的      目的    并      不是    要      仅仅    在      它们    之中    再      加上    一部
>>> line = output.split('\t')
>>> print(line)
['我', '的', '目的', '并', '不是', '要', '仅仅', '在', '它们', '之中', '再', '加上', '一部']
>>> for i in line:
...   a += 1
...   print('\t'*a,i)
...
                         我
                                 的
                                         目的
                                                 并
                                                         不是
                                                                 要
                                                                         仅仅
                                                                                 在
                                                                                         它们
                                                                                                 之中
                                                                                                     再
                                                                                                         加上
                                                                                                                 一部
>>> line.reverse();
>>> print(line)
['一部', '加上', '再', '之中', '它们', '在', '仅仅', '要', '不是', '并', '目的', '的', '我']
>>> for i in line:
...   a -= 1
...   print('\t'*a,i)
...
                                                                                                         一部
                                                                                                     加上
                                                                                                 再
                                                                                         之中
                                                                                 它们
                                                                         在
                                                                 仅仅
                                                         要
                                                 不是
                                         并
                                 目的
                         的
                 我
>>>


阅读更多
上一篇[python]灵感-镜像
下一篇【python】判断数据 属性 类型
想对作者说点什么? 我来说一句

python分词

2017年11月21日 125KB 下载

最大匹配法分词Python

2013年03月26日 3MB 下载

没有更多推荐了,返回首页

关闭
关闭