nlp
fffflyinthesky
这个作者很懒,什么都没留下…
展开
-
NLP学习 Task3 基于机器学习的文本分类
Task3 基于机器学习的文本分类 在上一章节,我们对赛题的数据进行了读取,并在末尾给出了两个小作业。如果你顺利完成了作业,那么你基本上对Python也比较熟悉了。在本章我们将使用传统机器学习算法来完成新闻分类的过程,将会结束到赛题的核心知识点。 基于机器学习的文本分类 在本章我们将开始使用机器学习模型来解决文本分类。机器学习发展比较广,且包括多个分支,本章侧重使用传统机器学习,从下一章开始是基于深度学习的文本分类。 学习目标 学会TF-IDF的原理和使用 使用sklearn的机器学习模型完成文本分类 机原创 2020-07-26 23:33:31 · 127 阅读 · 0 评论 -
NLP学习 Task02 数据读取与数据分析
Task02 数据读取与数据分析 学习目标 学习使用pandas读取赛题数据 分析赛题数据的分布规律 数据读取 赛题数据为文本数据,但是使用csv格式存储,可用pandas进行数据读取 import pandas as pd train_df = pd.read_csv(r"D:\python\NLP learn\datasets\train_set.csv",sep = "\t") pandas中的read_csv函数在这里选取三个参数赋值: 读取的文件路径,这里需要根据改成你本地的路径,可以使原创 2020-07-22 22:58:12 · 152 阅读 · 0 评论