机器学习之文本特征抽取

最新推荐文章于 2024-04-11 10:15:40 发布

赵清河

最新推荐文章于 2024-04-11 10:15:40 发布

阅读量219

点赞数

分类专栏：文本特征抽取机器学习文章标签：机器学习数据分析

本文链接：https://blog.csdn.net/zz_zss/article/details/107788454

版权

机器学习同时被 2 个专栏收录

7 篇文章 0 订阅

订阅专栏

文本特征抽取

1 篇文章 0 订阅

订阅专栏

文本特征抽取

需要使用到jieba库

from sklearn.feature_extraction.text import CountVectorizer
import jieba

li = ['想变成天上忽明忽暗的云朵',
      '想吃掉世上最美味的一切',
      '一想到你呀，我这张脸，就泛起微笑',
      '爱你，就像爱生命',
      '当我跨过沉沦的一切，你是我的旗帜']
# 利用jieba库对文本进行分隔
jieba_data = []
for i in li:
    jieba_data.append(' '.join(jieba.lcut(i)))
print(jieba_data)

def countvec():
    # 实例化
    cv = CountVectorizer()
    # 调用fi_transform方法
    data = cv.fit_transform(jieba_data)
    print(cv.get_feature_names())
    print(data.toarray())

if __name__ == '__main__':
    countvec()

在这里插入图片描述

’ ‘.jion()方法是将多个字符串拼接成一个以空格连接的字符串的方法，’ '内可添加需要以什么符号连接

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

赵清河

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习之文本特征抽取

文本特征抽取需要使用到jieba库from sklearn.feature_extraction.text import CountVectorizerimport jiebali = ['想变成天上忽明忽暗的云朵', '想吃掉世上最美味的一切', '一想到你呀，我这张脸，就泛起微笑', '爱你，就像爱生命', '当我跨过沉沦的一切，你是我的旗帜']# 利用jieba库对文本进行分隔jieba_data = []for i in li:
复制链接

扫一扫