2017年03月_esc_ai

一、TF-IDF词项频率: df:term frequency。 term在文档中出现的频率.tf越大,词元越重要. 文档频率: tf:document frequecy。有多少文档包含此term，df越大词元越不重要.词元权重计算公式： tf-idf=tf(t,d)*log(N/df(t))W(t,d):the weight of the term in document d tf

2017-03-23 21:46:51 5298 3

原创 ELK日志处理之使用Grok解析日志

介绍如何在logstash中使用Grok和正则表达式解析任意格式日志，以及Grok Debugger的使用。

2017-03-17 13:26:24 25670

原创图解Elasticsearch中的_source、_all、store和index属性

Elasticsearch中有几个关键属性容易混淆，很多人搞不清楚_source字段里存储的是什么？store属性的true或false和_source字段有什么关系？store属性设置为true和_all有什么关系？index属性又起到什么作用？什么时候设置store属性为true？什么时候应该开启_all字段？本文通过图解和代码测试进行解析。

2017-03-15 20:29:26 49402 17

原创 ELK日志处理之使用logstash收集log4J日志

介绍logstash处理log4j日志，包括log4j的简介、工程的搭建、log4j配置、logstash配置，实现日志从产生到logstash再到Elasticsearch的整个流程。

2017-03-11 00:29:52 32736 19

Elasticsearch 5.1.1 java api maven工程源码下载

Elasticsearch 5.1.1 java api maven工程,完整jar包在es5/target/dependency目录下

2017-04-18

MapReduce maven工程WordCount例子

介绍如何在Intellij Idea中通过创建maven工程配置MapReduce的编程环境。

2017-03-30

MapReduce WordCount例子

介绍如何在Intellij Idea中通过创建maven工程配置MapReduce的编程环境，WordCount代码。

2017-03-30

testng-6.8.8.jar

testng框架的jar文件，基于他可以写测试类，比juint强大

2016-10-29

Druid是什么？ Druid首先是一个数据库连接池。Druid是目前最好的数据库连接池，在功能、性能、扩展性方面，都超过其他数据库连接池，包括DBCP、C3P0、BoneCP、Proxool、JBoss DataSource。 Druid已经在阿里巴巴部署了超过600个应用，经过一年多生产环境大规模部署的严苛考验。同时Druid不仅仅是一个数据库连接池，它包括四个部分： Druid是一个JDBC组件，它包括三个部分：基于Filter－Chain模式的插件体系。 DruidDataSource 高效可管理的数据库连接池。 SQLParser

2016-10-29

逻辑思维训练500题以及答案

逻辑思维训练500题以及答案 word版本

2016-10-18

gson-2.2.4.jar

GSONjar包，2.2.4版本

2016-10-16

Redis实战中文.pdf

Redis实战中文版

2016-09-08

REDIS 入门指南

REDIS 入门指南.pdf

2016-09-08

宗成庆自然语言处理期末试题.pdf

中科院宗成庆自然语言处理期末试题

2016-07-11

grunt压缩、合并js/css

2016-06-15

信息检索导论_王斌译_课后习题答案

现代信息检索导论_王斌译_课后习题答案

2016-05-03

ssh读取新闻

使用eclipse搭建ssh新闻发布系统，基于struts2.3、 hibernate4、spring4.3，读取新闻数据到前台

2016-01-23

ssh新闻发布系统环境搭建

使用eclipse搭建ssh新闻发布系统，基于struts2.3、 hibernate4、spring4.3

2016-01-21

recommend.py

基于系统过滤的推荐算法，实现user－user、item－item推荐，计算欧几里德距离、皮尔逊相关度。

2015-12-31

SSH框架代码

struts 2.3.4、spring 4.2.3、hibernate4.3.11搭建ssh开发框架

2015-12-15

ssh框架整合实例

整合sping、struts2、hibernate框架的例子，数据库名称ssh2

2015-12-05

线性表基本操作

顺序表基本操作：创建、插入、删除、判空、查找.

2015-11-22

集体智慧编程中文版

本书以机器学习与计算统计为主题背景，专门讲述如何挖掘和分析Web上的数据和资源，如何分析用户体验、市场营销、个人品味等诸多信息，并得出有用的结论，通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息，以便创造新的用户价值和商业价值。全书内容翔实，包括协作过滤技术（实现关联产品推荐功能）、集群数据分析（在大规模数据集中发掘相似的数据子集）、搜索引擎核心技术（爬虫、索引、查询引擎、PageRank算法等）、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术（垃圾邮件过滤、文本过滤）、用决策树技术实现预测和决策建模功能、社交网络的信息匹配技术、机器学习和人工智能应用等。本书是Web开发者、架构师、应用工程师等的绝佳选择。

2015-11-03

lingo教程大全.pdf

非常全的lingo教程，包括lingo软件的基本使用方法，外部文件接口，数学建模，非常适合作为lingo学习的参加手册.

2015-08-21

ueditor实例

本实例在eclipse下配置了ueditor,解决图片上传路径配置问题,自定义拦截器解决了struts框架下图片上传失败问题。

2015-08-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

1.02^365=1377.41

原创 MapReduce编程(五) 单表关联

原创 MapReduce编程(四) 求均值

原创 MapReduce编程(三) 排序

原创 MapReduce编程(二) 文件合并和去重

原创 MapReduce编程(一) Intellij Idea配置MapReduce编程环境

原创 Intellij Idea编译Elasticsearch源码

原创 TF-IDF词项权重计算

原创 ELK日志处理之使用Grok解析日志

原创图解Elasticsearch中的_source、_all、store和index属性

原创 ELK日志处理之使用logstash收集log4J日志

标点符号用法标准.pdf

Elasticsearch 5.1.1 java api maven工程源码下载

Jackcard相似度的java代码

向量空间模型的Java代码

MapReduce maven工程WordCount例子

MapReduce WordCount例子

testng-6.8.8.jar

druid-1.0.16.jar

逻辑思维训练500题以及答案

gson-2.2.4.jar

Redis实战中文.pdf

REDIS 入门指南

宗成庆自然语言处理期末试题.pdf

grunt压缩、合并js/css

信息检索导论_王斌译_课后习题答案

ssh读取新闻

ssh新闻发布系统环境搭建

recommend.py

SSH框架代码

ssh框架整合实例

线性表基本操作

集体智慧编程中文版

lingo教程大全.pdf

ueditor实例

空空如也

标点符号用法标准.pdf

Elasticsearch 5.1.1 java api maven工程 源码下载

Jackcard相似度的java代码

向量空间模型的Java代码

MapReduce maven工程WordCount例子

MapReduce WordCount例子

testng-6.8.8.jar

druid-1.0.16.jar

逻辑思维训练500题以及答案

gson-2.2.4.jar

Redis实战 中文.pdf

REDIS 入门指南

宗成庆 自然语言处理 期末试题.pdf

grunt压缩、合并js/css

信息检索导论_王斌译_课后习题答案

ssh读取新闻

ssh新闻发布系统环境搭建

recommend.py

SSH框架代码

ssh框架整合实例

线性表基本操作

集体智慧编程中文版

lingo教程大全.pdf

ueditor实例

空空如也

Elasticsearch 5.1.1 java api maven工程源码下载

Redis实战中文.pdf

宗成庆自然语言处理期末试题.pdf