初识jieba(py3)

原创 2016年08月29日 23:24:22
data=open('/Users/momo/Desktop/小论文/模拟/红楼梦/红楼梦.txt')  

#for line in data:
   # print(line)
type(data)
fout = open('/Users/momo/Desktop/小论文/模拟/红楼梦/output.txt', 'w')
import jieba as jb
seg_list = jb.cut('你是谁', cut_all=True)
print("Full Mode:", "/ ".join(seg_list))  # 全模式
Full Mode: 你/ 是/ 谁
for eachLine in data: 
    wordList = list(jb.cut(eachLine))#用结巴分词,对每行内容进行分词
    outStr = '' 
    for word in wordList:  
            outStr += word  
            outStr += '/ '
    fout.write(outStr.strip()+'\n') #将分词好的结果写入到输出文件
data.close()  
fout.close() 

待学习:分词流程处理,分词字典应用

版权声明:本文为博主原创文章,未经博主允许不得转载。 举报

相关文章推荐

[Python3] 初识py, 一个简单练手的小玩意. 快递查询

有图有真相脚本代码最近刚入门py, 准备写点小玩意练练手. 于是决定拿快递100开刀. 因为它的api很简单.# 快递100 API # 作者: 剑齿虎 # 邮箱: yuxiaobo64@...

python3 - jieba:去停词,词性判断,计算词频

import jieba import jieba.posseg as pseg from nlp.db import MongoClient from nlp.config import * c...

我是如何成为一名python大咖的?

人生苦短,都说必须python,那么我分享下我是如何从小白成为Python资深开发者的吧。2014年我大学刚毕业..

Python3 jieba分词

分词对于NLP(自然语言处理)来说,分词是一步重要的工作,市面上也有各种分词库,11款开放中文分词系统比较。 1.基于词典:基于字典、词库匹配的分词方法;(字符串匹配、机械分词法) 2.基于...

python3 - 使用 jieba3k 对直播平台房间标题进行分词

python3 安装jieba: pip3 install jieba 或者,先下载 http://pypi.python.org/pypi/jieba/ ,解压后运行 python setu...

CC2530与zigbee学习笔记の初识zigbee(3)

CC2530可编程最大发射功率+4.5dBm,要获得加上cc2591射频功放前端.... 记得使用32M的石英晶振,而不要用陶瓷晶振,它的精度不够高 供电电压范围2~3.6V 如果只做简单的射频...

hadoop学习笔记(3) 初识Hadoop

http://blog.csdn.net/qll125596718/article/details/7169462 分类: 海量数据处理2011-12-31 21:38 95人阅读 评论...

java面向对象浅析系列3——初识奇特的内部类

1 概述 内部类是Java语言中比较特别的对象。一方面他在具备与普通类很多相似的特征,另一方面又具有一些独特的特点。下面我们来分析一下内部类。 2 简述Java文件的组织 为了避免混淆,在说明内部类之...
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)