- 博客(9)
- 资源 (24)
- 收藏
- 关注
原创 互联网金融风控大数据技术应用
在互联网金融领域,为了尽快的给用户授信,并且防止不必要的风险,风险管控,需要用到一系列的技术数据挖掘技术做随机森林:用到随机森林分类用户。数据分析方面的分类是基于已有数据来的,
2015-11-30 19:04:23 804
转载 TextFile SequencFile性能对比
转载:http://tangjj.blog.51cto.com/1848040/1535555首先所有的输入格式都继承FileInputFormat,对于TextFile和SequenceFile有对应的TextInputFormat和SequenceFileInputFormat。 我们先来看一下TextInputFormat的实现:
2015-11-19 18:09:45 902
转载 大数据时代的全能日志分析专家 --Splunk安装与实践
0.背景随着大家对网络安全意识的提高,企业网管理人员,必须对IT基础设置进行监控及安全事件的管理,管理数据的数量和种类非常巨大,那么就需要有一款能否分析各种日志数据的工具,经过长期实践,为大家推荐Splunk这么一款全能型分析工具。1.Splunk简介Splunk是一款功能强大的、记录详细的日志分析软件,Splunk是基于原始日志数据(Raw data)内容建立索引,保存索引的
2015-11-18 18:25:31 3526
转载 How To Configure Elasticsearch on Hadoop with HDP
原文地址:http://www.tuicool.com/articles/JryymeElasticsearch’s engine integrates with Hortonworks Data Platform 2.0 and YARN to provide real-time search and access to information in Hadoop.S
2015-11-18 18:19:00 587
转载 ElasticSearch-Hadoop: Indexingproductviews count andcustomer topsearch queryfrom Hadoop to ElasticSe
原文地址:http://www.javacodegeeks.com/2014/05/elasticsearch-hadoop-indexing-product-views-count-and-customer-top-search-query-from-hadoop-to-elasticsearch.htmlThis post covers to use ElasticSear
2015-11-18 18:16:29 564
转载 elasticsearch-hadoop使用记录
elasticsearch-hadoop是一个深度集成Hadoop和ElasticSearch的项目,也是ES官方来维护的一个子项目,通过实现Hadoop和ES之间的输入输出,可以在Hadoop里面对ES集群的数据进行读取和写入,充分发挥Map-Reduce并行处理的优势,为Hadoop数据带来实时搜索的可能。 项目网址:http://www.elasticsearch.org/overvie
2015-11-18 18:13:14 7240
转载 CentOS 6.5下利用Rsyslog+LogAnalyzer+MySQL部署日志服务器
一、简介LogAnalyzer 是一款syslog日志和其他网络事件数据的Web前端。它提供了对日志的简单浏览、搜索、基本分析和一些图表报告的功能。数据可以从数据库或一般的syslog文本文件中获取,所以LogAnalyzer不需要改变现有的记录架构。基于当前的日志数据,它可以处理syslog日志消息,Windows事件日志记录,支持故障排除,使用户能够快速查找日志数据中看出问题的解决方案
2015-11-18 17:54:14 601
转载 WePay机器学习反欺诈实践:Python+scikit-learn+随机森林
摘要:在这篇博文中,WePay介绍了支付行业构建机器学习模型应对很难发现的shell selling欺诈的实践心得。WePay采用了流行的Python、scikit-learn开源学习机器学习工具以及随机森林算法。【编者按】将机器学习算法用于金融领域的一个很好的突破口是反欺诈,在这篇博文中,WePay介绍了支付行业构建机器学习模型应对很难发现的shell selling欺诈的实践心得。
2015-11-06 18:36:55 4815
原创 Cloudera新的开源储存引擎 Kudu
据外媒报道,大数据公司 Cloudera 正在开发一个大型的开源储存引擎 Kudu,用于储存和服务大量不同类型的非结构化数据。预计本月底发布。Kudu 将被当作目前广泛使用的 Hadoop Distributed File System 和 Hadoop-oriented HBase NoSQL 数据库的替代产品,并将集合两者的特点。Kudu 将遵循 Apache 协议开源。据说,
2015-11-02 18:50:33 1229
spring-batch-reference.pdf
2019-12-16
虚拟化与云计算
2011-11-01
[Objective-C[1].2.0程序设计(原书第2版)].(美)Stephen.G.Kochan.扫描版
2011-11-01
进程调度算法模拟程序设计
2010-07-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人