• 我的消息
  • 我的博客
  • 我的学院
  • 我的下载
  • 我的收藏
  • 消息
  • 搜索条件:
    点击返回全部
    全部文章 > {categoryName }
    • google guice使用

      1. 概述Guice是Google开发的一个轻量级,基于Java5(主要运用泛型与注释特性)的依赖注入框架(IOC)。Guice非常小而且快。Guice是类型安全的,它能够对构造函数,属性,方法...

      原创
      2017-11-14 17:39:43
      83
      0
    • 相似度计算

      1. 相似度计算 1.1 概念 从多个维度分析两组数据的相似度,比如大的文本使用word2vec转成向量,类别根据最大的类别数量N拆成n维0或1表示的vector,数值类型归一化之后表示一个维度,...

      原创
      2017-10-30 17:41:17
      102
      0
    • play框架的基本应用

      1. 概述目前kmdm项目中有java写的rest服务,今后不再扩展,将迁移到elemental中scala的play服务。 目前我觉得play框架有以下优点 1. 省代码:scala天然的便利...

      原创
      2017-10-21 17:09:28
      181
      1
    • NLP分词

      NLP分词jar包很大,不建议使用maven下载,几百M,直接官网下载 package test import edu.stanford.nlp.ling.{CoreAnnotations, Cor...

      原创
      2017-09-28 12:11:27
      86
      0
    • Ansj分词

      /** * Created by liuwei on 2017/8/24. */ object AnsjTest { def main(args: Array[String]): Uni...

      原创
      2017-09-25 11:10:11
      75
      0
    • 聚类LDA

      1. 聚类LDA 1.1 概念 LDA(Latent Dirichlet Allocation)是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构。所谓生成模型,就是说,...

      原创
      2017-09-12 16:08:41
      73
      0
    • SVD降维

      1. SVD降维 1.1 概念 奇异值分解(Singular value decomposition) 现实世界里,为了实现类似特征值分解的计算,我们使用奇异值分解。奇异值分解适用于任何矩阵,如...

      原创
      2017-08-21 17:23:49
      105
      0
    • PCA降维

      1. PCA降维 1.1 概念 主成分分析( PrincipalComponent Analysis , PCA )或者主元分析。是一种掌握事物主要矛盾的统计分析方法,它可以从多元事物中解析出...

      原创
      2017-07-20 19:05:45
      199
      0
    • 文本词频TF-IDF

      1. 文本词频TF-IDF 1.1 概念 词频-逆向文件频率(TF-IDF)是一种在文本挖掘中广泛使用的特征向量化方法,它可以体现一个文档中词语在语料库中的重要程度。 词语由t表示,文档由d表示,语料...

      原创
      2017-07-14 13:55:20
      93
      0
    • 文本词频Countvectorizer

      1. 文本词频Countvectorizer 1.1 概念 CountVectorizer旨在通过计数来将一个文档转换为向量。当不存在先验字典时,Countvectorizer作为Estimator提...

      原创
      2017-07-12 14:45:24
      233
      0
  • 学院
  • 下载
  • 消息