自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 资源 (2)
  • 收藏
  • 关注

转载 spark-MLlib-架构

sparkmlib-架构

2017-03-24 16:49:47 969 2

原创 数据挖掘-目录-正则化方法

Ridge Regression Least Absolute Shrinkage Selection Operator ( LASSO )弹性网络( Elastic Net )

2017-03-24 13:41:27 583 1

原创 数据挖掘-目录-集成算法

Boosting Bootstrapped Aggregation ( Bagging ) AdaBoost 堆叠泛化( Stacked Generalization , Blending) 梯度推进机( Gradient Boosting Machine, GBM ) 随机森林( Random Forest )。

2017-03-24 13:16:01 554 1

原创 数据挖掘-目录-深度学习(Deep Learning)

受限波尔兹曼机( Restricted Boltzmann Machine, RBN )Deep Belief Networks ( DBN )卷积网络( Convolutional Network )堆栈式自动编码器( Stacked Auto-encoders )

2017-03-24 12:02:07 546 1

原创 数据挖掘-目录-人工神经网络 (Artificial Neural Network)

感知器神经网络( Perceptron Neural Network )反向传递( Back Propagation ) Hopfield 网络自组织映射( Self-Organizing Map, SOM )学习矢量量化( Learning Vector Quantization , LVQ )

2017-03-24 11:59:40 1032 1

原创 数据挖掘-目录-impurity

Entropy Gini Impurities Impurity Variance

2017-03-24 00:24:53 585 1

原创 数据挖掘-目录-loss

AbsoluteErrorLogLossLossLossesSquaredError

2017-03-24 00:22:58 483

原创 数据挖掘-目录-评估

AreaUnderCurveBinaryClassificationMetricComputersBinaryConfusionMatrixBinaryLabelCounterBinaryClassificationMetricsMulticlassMetricsRankingMetricsRegressionMetricsBinaryClassificationEvaluatorEvaluator

2017-03-24 00:19:51 424

原创 数据挖掘-目录-降维(Dimensionality Reduction)

EigenValueDecomposition(特征值分解) SingularValueDecomposition(奇异值分解) Principal Component Analysis(主成分分析)

2017-03-24 00:15:57 416

原创 数据挖掘-目录-最优化算法(optimization)

GradientDescent (梯度下降算法)L-BFGS(限制内存BFGS)NNLS(非负最小二乘)

2017-03-24 00:10:56 1114

原创 数据挖掘-目录-线性代数( linear algebra)

Basic Linear Algebra SubprogramsCholeskyDecompositiondistributedBlockMatrixCoordinateMatrixDistributedMatrixIndexedRowMatrixRowMatrixEigenValueDecompositionMatricesSingularValueDecompositionVectors

2017-03-23 19:36:47 942

原创 数据挖掘-目录-关联分析

Apriori(频繁项集挖掘并行化)FP AssociationRules FPGrowth FPTree

2017-03-23 19:06:28 386

原创 数据挖掘-目录-基本统计

correlation Correlation PearsonCorrelation SpearmanCorrelationdistribution MultivariateGaussianKernelDensityMultivariateOnlineSummarizerMultivariateStatisticalSummaryKolmogorovSmirnov

2017-03-23 18:57:36 798

原创 数据挖掘-目录-回归分析(regression)

AFTSurvivalRegressionDecisionTreeRegressorGBTRegressorIsotonicRegressionLinearRegressionRandomForestRegressorGeneralizedLinearAlgorithmGLMRegressionModelIsotonicRegressionLabeledPointLassoLinearRegress

2017-03-23 17:57:53 825

转载 数据挖掘-目录-特征处理(feature)

BinarizerBucketizerChiSqSelectorCountVectorizerDCTElementwiseProductHashingTFIDFInteractionMinMaxScalerNGramNormalizerOneHotEncoderPCAPolynomialExpansionQuantileDiscretizerSQLTransformerStandardScalerS

2017-03-23 17:35:06 1162

原创 数据挖掘-目录-推荐(recommendation)

matrix factorization Alternating Least Squares (ALS)

2017-03-23 17:12:15 662

原创 数据挖掘-目录-聚类(clustering)

K-means bisecting k-means DBSCANMAXGaussianMixtureLatent Dirichlet AllocationGaussianMixturePowerIterationClustering

2017-03-23 17:07:03 833

原创 数据挖掘-目录-分类器(classification)

GLMNaiveBayesSupport Vector Machines Stochastic Gradient Descent LogisticRegressionDecisionTree CART Hunt ID3 C4.5 KNIMEGradient-Boosted TreesMultilayerPerceptronRandomForest

2017-03-23 16:59:22 1734

转载 java-命令

java.exe:运行java程序javac.exe:编译的Java程序,生成.class文件javaw.exe:功能:跟java命令相对的,可以运行.class文件,主要用来执行图形界面的java程序运行java命令时,会出现并保持一个console窗口,程序中的信息可以通过System.out在console内输出,而运行javaw,开始时会出现console,当主程序调用之后,console就

2017-03-15 06:46:34 339

转载 阿里巴巴Java开发手册

一、编程规约1.如果使用到了设计模式,建议在类名中体现出具体模式将设计模式体现在名字中,有利于阅读者快速理解架构设计思想。2.相同参数类型,相同业务含义,才可以使用 Java 的可变参数,避免使用 Object可变参数必须放置在参数列表的最后,尽量不用可变参数编程。3.对外暴露的接口签名,原则上不允许修改方法签名,避免对接口调用方产生影响接口过时必须加@Deprecated 注解,并清晰地说明采用的

2017-03-14 19:53:43 663

原创 hadoop-hdfs-文件工具类(Scala)

package com.avcdata.spark.job.utilimport java.io.{File, FileInputStream, FileOutputStream, IOException}import org.apache.hadoop.conf.Configurationimport org.apache.hadoop.fs.{FileStatus, FileSystem, F

2017-03-14 16:34:04 4160

原创 hadoop-hdfs-文件工具类(Java)

import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.*;import org.apache.hadoop.io.IOUtils;import java.io.File;import java.io.FileInputStream;import java.io.FileOutputStream;imp

2017-03-13 17:28:45 635

原创 java-io-文件相关工具类(全)

package io.util;import java.io.*;import java.nio.ByteBuffer;import java.nio.channels.FileChannel;import java.util.ArrayList;import java.util.Arrays;import java.util.Collections;import java.util.L

2017-03-13 17:11:36 778

原创 scala-json-json4s-工具类

汇总基于json4s类库的scala语言的json工具类import java.text.SimpleDateFormatimport org.apache.spark.SparkContextimport org.apache.spark.sql.{DataFrame, SQLContext}import org.json4s.jackson.JsonMethods._import org.

2017-03-11 08:57:53 1207

原创 java-IO-BIO-工具类

汇总BIO各种流操作的工具类package io;import javax.crypto.*;import java.io.*;import java.security.InvalidKeyException;import java.security.Key;import java.security.NoSuchAlgorithmException;import java.text.Sim

2017-03-10 18:02:27 283

原创 java-线程-定时器-工具类

汇总JDK定时器的实现package thread.timetask;import java.util.Calendar;import java.util.Date;import java.util.Timer;import java.util.TimerTask;import java.util.concurrent.Executors;import java.util.concurre

2017-03-09 15:58:09 1024

原创 java-线程池-工具类

汇总JDK自带的四个常用线程池的用法package thread.pool;import java.util.concurrent.ExecutorService;import java.util.concurrent.Executors;import java.util.concurrent.ScheduledExecutorService;import java.util.concurre

2017-03-09 14:26:17 2100

原创 爬虫-java-webmagic-搜视节目单(输出到单个文件)

webmgic 架构图(来自作者官方文档): Processor:public class TvSouProcessor implements PageProcessor { Map channelCodeMap = NIOUtils.csvFile2Map(TvSouConstant.CHANNELMAP_FILEPATH); private Site site = Site.me(

2017-03-04 10:33:26 1083

原创 构建工具-Maven-使用maven-assembly-plugin将依赖打包进jar并指定JDK版本

直接上POM.xml文件代码:build> plugins> plugin> artifactId>maven-assembly-pluginartifactId> configuration> archive> manifest>

2017-03-04 01:19:40 4474

贵州全省最新最全国家行政区域码,包含省市县乡村五级和上下级关系

贵州全省最新最全国家行政区域码,包含省市县乡村五级和上下级关系

2024-01-31

livy-0.7.1-incubating-bin-cdh6.2.1.zip

基于apache 0.7.1源码编译的cdh6.2.1版本的livy

2021-11-20

Microsoft Visual C++ 14.0

windows 的 Microsoft Visual C++ 14.0 的运行库 python常用依赖

2020-10-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除