- 博客(4)
- 资源 (2)
- 收藏
- 关注
原创 数据分析---线性回归
经常说线性模型,线性回归模型,广义线性模型,广义线性混合模型.......之类的词好几个,搞得不好就容易混淆了。下面一起来复习下。1、线性回归模型(也称经典线性模型classic linear model或者一般线性模型General linear model)适用于自变量X和因变量Y为线性关系,具体来说,画出散点图可以用一条直线来近似拟合。模型可以表达为:
2015-11-25 15:38:48 1493
原创 数据索引---Solr DIH
Solr DIH就是Data Import Handler.由于很多时候我们的数据在数据库里面,需要将数据库里面的数据导出进行索引.Solr提供了一个很方便的接口来从数据库生成索引。DIH支持从单表和多表管理来导入数据,可以跨数据库来读取数据,还可以增量索引数据,应该说满足很多一般的需求。以下以solr-5.3.0为例,下面来说说一个简单的从Mysql数据库导入数据的配置,更多复杂的配置,需要
2015-11-24 14:26:47 824
原创 数据索引---Solr Cloud(Solr5) with ZooKeeper
上次说的得,要整个Solr Cluster也就是Solr Cloud,现在好像比较流行Cloud滴说。就像Solr介绍的一样Apache Solr includes the ability to set up a cluster of Solr servers that combines fault tolerance and high availability. Call
2015-11-15 21:25:33 1982
原创 数据处理---JVM监控
监控,就是要监视控制,既要监视出问题,也要能随时控制调整。下面来说说JVM监控的常用工具(JDK/bin自带提供了很多)和方法。1 . jinfojinfo -h 可以知道使用的参数有:jinfo [option] to connect to running processjinfo [option] to connect a core fi
2015-11-11 14:57:39 1106
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人