自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 第1关:无监督学习的文本聚类

1、 无监督学习的特点有: B、 不需要带标签的数据 D、 无法量化效果 2、 下列哪项是无监督学习的方法? C、 聚类 3、 常用的聚类方法有 A、 KMeans D、 DBSCAN 第2关:基于 K-Means 算法的文本聚类importjiebafromsklearn.feature_extraction.textimportCountVectorizerfromsklearn.fe...

2022-05-19 17:16:50 2207

原创 第1关:神经网络基础

1、 下列不是神经网络的组成部分的是? B、 计算层 2、 递归神经网络是以什么方式遍历结构的? C、 拓扑排序 3、 卷积神经网络包含以下哪些部分? A、 卷积层 C、 池化层 D、 全连接层 第2关:Pytorch 搭建神经网络importtorchfrommainimporttesthidden_layer=int(input())#任务:使用torch模块构建一个简单神经网...

2022-05-19 17:12:55 522

原创 第1关:情感分析的基本方法

1、 对情感分析的研究到目前为止主要集中在以下哪些方面? A、 识别给定的文本实体是主观的还是客观的 D、 识别主观的文本的极性 2、 在情感分析领域目前主要的分析方法有: B、 词法分析 C、 机器学习分析 D、 混合分析 第2关:基于情感词典的情感分析实战fromcollectionsimportdefaultdictimportjiebaimportcodecsdefseg_word(sentenc...

2022-05-16 22:42:06 4395 1

原创 第1关:认识 Doc2vec

1、 doc2vec 是一种什么类型的算法? A、 2、 下列模型中,哪些是 doc2vec 的常用模型? A、 DM 模型 D、 DBOW 模型 3、 下列关于doc2vec算法的描述错误的是? D、 在预测单词的概率时,利用了部分文档的语义。 让模型去预测段落中的随机一个单词第2关:Doc2vec 实战fromgensim.models.doc2vecimportDoc2Vec,TaggedDocument...

2022-05-16 22:36:37 915

原创 第1关:学会使用 Gensim

fromgensimimportcorpora,modelsimportjieba.possegasjp,jiebafrombasicimportget_stopword_listtexts=[]foriinrange(5):s=input()texts.append(s)flags=('n','nr','ns','nt','eng','v','d')#词性stopwords=get_stopwor...

2022-05-16 22:33:35 1751 1

原创 第1关:Jieba 在关键词提取中的应用

import jieba.analysesentence = input()# 任务:基于jieba中的TF-IDF算法完成对sentence的关键词提取,提取前三个关键词并以一行输出# ********** Begin *********#keywords = jieba.analyse.extract_tags(sentence, topK=3, withWeight=True, allowPOS=('n', 'nr', 'ns'))for item in keywords:pr

2022-05-16 22:30:45 1756

原创 第1关:向量化算法 word2vec

importloggingfromgensim.modelsimportword2vecdefgetmodel():logging.basicConfig(format='%(asctime)s:%(levelname)s:%(message)s',level=logging.INFO)#加载《人民的名义》文本sentences=word2vec.LineSentence('./in_the_name_of_people_segmen...

2022-05-16 22:24:50 1621

原创 第2关:Pytorch 搭建神经网络

1、 下列不是神经网络的组成部分的是? B 2、 递归神经网络是以什么方式遍历结构的? C、 3、 卷积神经网络包含以下哪些部分? A、 卷积层 C、 池化层 D、 全连接层 第2关:Pytorch 搭建神经网络importtorchfrommainimporttesthidden_layer=int(input())#任务:使用torch模块构建一个简单神经网络模型#**********Begin...

2022-05-16 22:22:35 520

原创 第1关:词性标注

importjieba.possegas江南text=input()#任务:使用jieba模块的函数对text完成词性标注并将结果存储到result变量中#**********Begin*********#words=江南.cut(text)forword,flaginwords:print('%s/%s'%(word,flag),end='')...

2022-05-16 22:19:41 973

原创 第1关:命名实体识别

1、下列哪个不是目前命名实体识别技术的难点?A2、命名实体识别方法有哪些类别?A ,B,C第2关:中文人名识别frompyhanlpimportHanLPtext=input()#任务:完成对text文本的人名识别并输出结果#**********Begin*********#frompyhanlpimport*NER=HanLP.newSegment().enableNameRecognize(True)p_name=NER.seg(...

2022-05-16 22:17:40 1354

原创 第2关:TF/IDF 算法

#本程序的作用是通过TF/IDF算法完成对文本的关键词提取,输出前十个关键词。importmathimportjiebaimportjieba.possegaspsgfromgensimimportcorpora,modelsfromjiebaimportanalyseimportfunctoolsclassTfIdf(object):#四个参数分别是:训练好的idf字典,默认idf值,处理后的待提取文本,关键词数量def...

2022-05-16 22:10:54 2095

原创 TF/IDF 算法第1关:去除停用词

#停用词表加载方法defget_stopword_list():#停用词表存储路径,每一行为一个词,按行读取进行加载#进行编码转换确保匹配准确率stop_word_path='./stopword.txt'stopword_list=[sw.replace('\n','')forswinopen(stop_word_path,encoding='utf-8').readlines()]returnstopword_l...

2022-05-16 22:09:07 1966

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除