1、print函数的使用不同。
Python3中,作为一个函数,应加括号,print("xxxxxxxxxxxxx",xxxxxxx)
2、在 shell中 new一个py文件,在新出现的窗口(IDLE)中编写代码,点击run-> run module(F5) 执行文件
3、结巴分词软件的安装使用。
将下载的jieba-master解压缩,将其中的jieba文件夹复制到Python的安装目录下,若能正常import jieba,则表示安装成功。
4、结巴分词有3种分词模式:全模式、精确模式、搜索引擎模式。
#!/usr/bin/env python
#-*- coding:utf-8 -*-
import jieba
#全模式
text = "我来到北京清华大学"
seg_list = jieba.cut(text, cut_all=True)
print ("[全模式]: ", "/ ".join(seg_list))
#精确模式
seg_list = jieba.cut(text, cut_all=False)
print ("[精确模式]: ", "/ ".join(seg_list))
#默认是精确模式
seg_list = jieba.cut(text)
print ("[默认模式]: ", "/ ".join(seg_list))
#新词识别 “杭研”并没有在词典中,但是也被Viterbi算法识别出来了
seg_list = jieba.cut("他来到了网易杭研大厦")
print ("[新词识别]: ", "/ ".join(seg_list))
#搜索引擎模式
seg_list = jieba.cut_for_search(text)
print ("[搜索引擎模式]: ", "/ ".join(seg_list))
loading......