结巴中文词频分析

最新推荐文章于 2022-07-24 14:19:15 发布

weixin_34221773

最新推荐文章于 2022-07-24 14:19:15 发布

阅读量230

点赞数

文章标签：人工智能 python

sklearn实战-乳腺癌细胞数据挖掘

https://study.163.com/course/introduction.htm?courseId=1005269003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share

结果保存在result.txt文档内

# -*- coding: utf-8 -*-


import jieba
import sys
from collections import Counter
import jieba.analyse
filename="招聘分析.txt"

def fenci(filename) :
    f = open(filename,'r+')
    file_list = f.read()
    f.close()

    seg_list = list(jieba.cut(file_list,cut_all=True))
    tf={}
    for seg in seg_list :
        #print seg
        seg = ''.join(seg.split())
        if (seg != '' and seg != "\n" and seg != "\n\n") :
            if seg in tf :
                tf[seg] += 1
            else :
                tf[seg] = 1

    f = open("result.txt","w+")
    for item in tf:
        #print item
        f.write(item+"  "+str(tf[item])+"\n")
    f.close()


fenci(filename)

python风控评分卡建模和风控常识

https://study.163.com/course/introduction.htm?courseId=1005214003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share

关注博主即可阅读全文

优惠劵

weixin_34221773

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
结巴中文词频分析

sklearn实战-乳腺癌细胞数据挖掘https://study.163.com/course/introduction.htm?courseId=1005269003&amp;utm_campaign=commission&amp;utm_source=cp-400000000398149&amp;utm_medium=share结果保存在result.txt文档内 # -*- ...
复制链接

扫一扫