机器学习算法Python实现
hellozhxy
这个作者很懒,什么都没留下…
展开
-
机器学习算法Python实现:word2vec 求词语相似度
#!/usr/bin/env Python3# coding=utf-8import jiebajieba.load_userdict("C:\\Users\\Desktop\\s_proj\\dict.txt") #自定义分词词典#分词并将结果存入txtf1 =open("C:\\Users\\Desktop\\neg.txt","r",encoding='utf-8',erro...转载 2018-08-26 19:00:06 · 3480 阅读 · 2 评论 -
机器学习算法Python实现:tfidf 特征词提取及文本相似度分类
# coding: utf-8#本代码主要实现了对于商品名称根据tfidf提取特征词,然后基于已经训练好的word2vec模型,对每行商品的tfidf值大于某一阈值的特征词相似度匹配已经给定的商品类别。import jiebaimport jieba.posseg as psegimport jieba.analyseimport pymssqlimport xlwtfrom s...转载 2018-08-26 19:01:08 · 8919 阅读 · 1 评论 -
机器学习算法Python实现:doc2vec 求句子相似度
# coding:utf-8import sysimport gensimimport sklearnimport numpy as npfrom gensim.models.doc2vec import Doc2Vec, LabeledSentenceTaggededDocument = gensim.models.doc2vec.TaggedDocumentimport ...转载 2018-08-26 19:01:53 · 3006 阅读 · 0 评论 -
机器学习算法Python实现:kmeans文本聚类
# -*- coding:utf-8 -*#本代码是在jupyter notebook上实现,author:huzhifei, create time:2018/8/14#本脚本主要实现了基于python通过kmeans做的文本聚类的项目目的#导入相关包import numpy as npimport pandas as pdimport reimport osimport c...转载 2018-08-26 19:02:23 · 4722 阅读 · 2 评论 -
机器学习算法Python实现:基于情感词典的文本情感分析
# -*- coding:utf-8 -*#本代码是在jupyter notebook上实现,author:huzhifei, create time:2018/8/14#本脚本主要实现了基于python通过已有的情感词典对文本数据做的情感分析的项目目的#导入对应的包及相关的自定义的jieba词典import jiebaimport numpy as npjieba.load_us...转载 2018-08-26 19:03:03 · 16317 阅读 · 19 评论 -
机器学习算法Python实现:gensim里的similarities文本相似度计算
# -*- coding:utf-8 -*#本代码是在jupyter notebook上实现,author:huzhifei, create time:2018/8/14#本脚本主要实现了基于python的gensim包里的similarities接口对文本做相似度的项目目的#导入gensim与jieba包from gensim import corpora, models, sim...转载 2018-08-26 19:03:41 · 5167 阅读 · 0 评论