- 博客(29)
- 资源 (2)
- 收藏
- 关注
原创 数据挖掘-目录-正则化方法
Ridge Regression Least Absolute Shrinkage Selection Operator ( LASSO )弹性网络( Elastic Net )
2017-03-24 13:41:27 583 1
原创 数据挖掘-目录-集成算法
Boosting Bootstrapped Aggregation ( Bagging ) AdaBoost 堆叠泛化( Stacked Generalization , Blending) 梯度推进机( Gradient Boosting Machine, GBM ) 随机森林( Random Forest )。
2017-03-24 13:16:01 554 1
原创 数据挖掘-目录-深度学习(Deep Learning)
受限波尔兹曼机( Restricted Boltzmann Machine, RBN )Deep Belief Networks ( DBN )卷积网络( Convolutional Network )堆栈式自动编码器( Stacked Auto-encoders )
2017-03-24 12:02:07 546 1
原创 数据挖掘-目录-人工神经网络 (Artificial Neural Network)
感知器神经网络( Perceptron Neural Network )反向传递( Back Propagation ) Hopfield 网络自组织映射( Self-Organizing Map, SOM )学习矢量量化( Learning Vector Quantization , LVQ )
2017-03-24 11:59:40 1032 1
原创 数据挖掘-目录-评估
AreaUnderCurveBinaryClassificationMetricComputersBinaryConfusionMatrixBinaryLabelCounterBinaryClassificationMetricsMulticlassMetricsRankingMetricsRegressionMetricsBinaryClassificationEvaluatorEvaluator
2017-03-24 00:19:51 424
原创 数据挖掘-目录-降维(Dimensionality Reduction)
EigenValueDecomposition(特征值分解) SingularValueDecomposition(奇异值分解) Principal Component Analysis(主成分分析)
2017-03-24 00:15:57 416
原创 数据挖掘-目录-最优化算法(optimization)
GradientDescent (梯度下降算法)L-BFGS(限制内存BFGS)NNLS(非负最小二乘)
2017-03-24 00:10:56 1114
原创 数据挖掘-目录-线性代数( linear algebra)
Basic Linear Algebra SubprogramsCholeskyDecompositiondistributedBlockMatrixCoordinateMatrixDistributedMatrixIndexedRowMatrixRowMatrixEigenValueDecompositionMatricesSingularValueDecompositionVectors
2017-03-23 19:36:47 942
原创 数据挖掘-目录-基本统计
correlation Correlation PearsonCorrelation SpearmanCorrelationdistribution MultivariateGaussianKernelDensityMultivariateOnlineSummarizerMultivariateStatisticalSummaryKolmogorovSmirnov
2017-03-23 18:57:36 798
原创 数据挖掘-目录-回归分析(regression)
AFTSurvivalRegressionDecisionTreeRegressorGBTRegressorIsotonicRegressionLinearRegressionRandomForestRegressorGeneralizedLinearAlgorithmGLMRegressionModelIsotonicRegressionLabeledPointLassoLinearRegress
2017-03-23 17:57:53 825
转载 数据挖掘-目录-特征处理(feature)
BinarizerBucketizerChiSqSelectorCountVectorizerDCTElementwiseProductHashingTFIDFInteractionMinMaxScalerNGramNormalizerOneHotEncoderPCAPolynomialExpansionQuantileDiscretizerSQLTransformerStandardScalerS
2017-03-23 17:35:06 1162
原创 数据挖掘-目录-推荐(recommendation)
matrix factorization Alternating Least Squares (ALS)
2017-03-23 17:12:15 662
原创 数据挖掘-目录-聚类(clustering)
K-means bisecting k-means DBSCANMAXGaussianMixtureLatent Dirichlet AllocationGaussianMixturePowerIterationClustering
2017-03-23 17:07:03 833
原创 数据挖掘-目录-分类器(classification)
GLMNaiveBayesSupport Vector Machines Stochastic Gradient Descent LogisticRegressionDecisionTree CART Hunt ID3 C4.5 KNIMEGradient-Boosted TreesMultilayerPerceptronRandomForest
2017-03-23 16:59:22 1734
转载 java-命令
java.exe:运行java程序javac.exe:编译的Java程序,生成.class文件javaw.exe:功能:跟java命令相对的,可以运行.class文件,主要用来执行图形界面的java程序运行java命令时,会出现并保持一个console窗口,程序中的信息可以通过System.out在console内输出,而运行javaw,开始时会出现console,当主程序调用之后,console就
2017-03-15 06:46:34 339
转载 阿里巴巴Java开发手册
一、编程规约1.如果使用到了设计模式,建议在类名中体现出具体模式将设计模式体现在名字中,有利于阅读者快速理解架构设计思想。2.相同参数类型,相同业务含义,才可以使用 Java 的可变参数,避免使用 Object可变参数必须放置在参数列表的最后,尽量不用可变参数编程。3.对外暴露的接口签名,原则上不允许修改方法签名,避免对接口调用方产生影响接口过时必须加@Deprecated 注解,并清晰地说明采用的
2017-03-14 19:53:43 663
原创 hadoop-hdfs-文件工具类(Scala)
package com.avcdata.spark.job.utilimport java.io.{File, FileInputStream, FileOutputStream, IOException}import org.apache.hadoop.conf.Configurationimport org.apache.hadoop.fs.{FileStatus, FileSystem, F
2017-03-14 16:34:04 4160
原创 hadoop-hdfs-文件工具类(Java)
import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.*;import org.apache.hadoop.io.IOUtils;import java.io.File;import java.io.FileInputStream;import java.io.FileOutputStream;imp
2017-03-13 17:28:45 635
原创 java-io-文件相关工具类(全)
package io.util;import java.io.*;import java.nio.ByteBuffer;import java.nio.channels.FileChannel;import java.util.ArrayList;import java.util.Arrays;import java.util.Collections;import java.util.L
2017-03-13 17:11:36 778
原创 scala-json-json4s-工具类
汇总基于json4s类库的scala语言的json工具类import java.text.SimpleDateFormatimport org.apache.spark.SparkContextimport org.apache.spark.sql.{DataFrame, SQLContext}import org.json4s.jackson.JsonMethods._import org.
2017-03-11 08:57:53 1207
原创 java-IO-BIO-工具类
汇总BIO各种流操作的工具类package io;import javax.crypto.*;import java.io.*;import java.security.InvalidKeyException;import java.security.Key;import java.security.NoSuchAlgorithmException;import java.text.Sim
2017-03-10 18:02:27 283
原创 java-线程-定时器-工具类
汇总JDK定时器的实现package thread.timetask;import java.util.Calendar;import java.util.Date;import java.util.Timer;import java.util.TimerTask;import java.util.concurrent.Executors;import java.util.concurre
2017-03-09 15:58:09 1024
原创 java-线程池-工具类
汇总JDK自带的四个常用线程池的用法package thread.pool;import java.util.concurrent.ExecutorService;import java.util.concurrent.Executors;import java.util.concurrent.ScheduledExecutorService;import java.util.concurre
2017-03-09 14:26:17 2100
原创 爬虫-java-webmagic-搜视节目单(输出到单个文件)
webmgic 架构图(来自作者官方文档): Processor:public class TvSouProcessor implements PageProcessor { Map channelCodeMap = NIOUtils.csvFile2Map(TvSouConstant.CHANNELMAP_FILEPATH); private Site site = Site.me(
2017-03-04 10:33:26 1083
原创 构建工具-Maven-使用maven-assembly-plugin将依赖打包进jar并指定JDK版本
直接上POM.xml文件代码:build> plugins> plugin> artifactId>maven-assembly-pluginartifactId> configuration> archive> manifest>
2017-03-04 01:19:40 4474
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人