聚类
文章平均质量分 78
云寻觅
没有做不到,只有想不到,专注人工智能,物联网,大数据,分布式,云计算、搜索引擎研发、实时语音通讯、APP、ESB企业服务总线研发、数据路由器、ERP、CRM、呼叫中心 等领域
展开
-
python kmeans实战 - 单机一层聚类(小玩具哦),下次再弄个分布式多次聚类
# coding=utf-8 """ #K-means """ import time import re import os import sys import codecs import shutil import numpy as np from sklearn原创 2017-04-14 17:32:41 · 1282 阅读 · 0 评论 -
python聚类算法实战详细笔记 (python3.6+(win10、Linux))
python聚类算法实战详细笔记 (python3.6+(win10、Linux))一、基本概念: 1、计算TF-DIFTF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TFIDF的主要思想是:如果某个词或短语在一篇文章中出现原创 2017-04-19 09:26:37 · 1305 阅读 · 1 评论