2016年12月_小爷毛毛（卓寿杰）

12月 11月 10月 09月 08月 07月 06月

原创深入理解Spark 2.1 Core （二）：DAG调度器的原理与源码分析

上一篇《深入理解Spark 2.0 （一）：RDD实现及源码分析》的5.2 Spark任务调度器我们省略过去了，这篇我们就来讲讲Spark的调度器。概述上一篇《深入理解Spark（一）：RDD实现及源码分析》提到：定义RDD之后，程序员就可以在动作（注：即action操作）中使用RDD了。动作是向应用程序返回值，或向存储系统导出数据的那些操作，例如，count（返回RDD...

2016-12-28 22:11:02 11076 3

原创深入理解Spark 2.1 Core （一）：RDD的原理与源码分析

本文链接：http://blog.csdn.net/u011239443/article/details/53894611 该论文来自Berkeley实验室，英文标题为：Resilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing。下面的翻译，我是基于博文http://sh...

2016-12-27 12:57:57 22287 3

原创 Java NIO 实现 EchoServer EchoClient

阻塞模式EchoServer采用阻塞模式，用线程池中的工作线程处理每个客户连接。 EchoClient也采用阻塞模式，单线程。serverpackage com.test.socket.nio.echo;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStream;import java

2016-12-21 18:50:49 2834 1

原创基于Spark的大数据精准营销中搜狗搜索引擎的用户画像挖掘

转载请注明：转载 from http://blog.csdn.net/u011239443/article/details/53735609 from CCF举办的“大数据精准营销中搜狗用户画像挖掘”竞赛1. 选题背景与意义1.1 用户画像与精准营销 “用户画像”是近几年诞生的名词。很多营销项目或很多广告主，在打算投放广告前，都要求媒体提供其用户画像。在以前，大多媒体会...

2016-12-19 16:17:06 24564 26

原创 Scala——Traits

类似于Java中的接口，trait被用于通过所支持的方法特例化来定义对象。如Java 8中一样，Scala允许trait被部分实现。和class相比，trait可以没有构造函数。如：trait Similarity { def isSimilar(x: Any): Boolean def isNotSimilar(x: Any): Boolean = !isSimilar(x)}这个tra

2016-12-06 13:30:33 994

SMP2020微博情绪分类技术评测数据集

SMP2020微博情绪分类技术评测数据集本次技术评测使用的标注数据集由哈尔滨工业大学社会计算与信息检索研究中心提供，原始数据源于新浪微博，由微热点大数据研究院提供，数据集分为两部分。第一部分为通用微博数据集，该数据集内的微博内容是随机获取到微博内容，不针对特定的话题，覆盖的范围较广。第二部分为疫情微博数据集，该数据集内的微博内容是在疫情期间使用相关关键字筛选获得的疫情微博，其内容与新冠疫情相关。因此，本次评测训练集包含上述两类数据：通用微博训练数据和疫情微博训练数据，相对应的，测试集也分为通用微博测试集和疫情微博测试集。参赛成员可以同时使用两种训练数据集来训练模型。每条微博被标注为以下六个类别之一：neutral（无情绪）、happy（积极）、angry（愤怒）、sad（悲伤）、fear（恐惧）、surprise（惊奇）。通用微博训练数据集包括27,768条微博，验证集包含2,000条微博，测试数据集包含5,000条微博。疫情微博训练数据集包括8,606条微博，验证集包含2,000条微博，测试数据集包含3,000

2022-12-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创深入理解Spark 2.1 Core （二）：DAG调度器的原理与源码分析

原创深入理解Spark 2.1 Core （一）：RDD的原理与源码分析

原创 Java NIO 实现 EchoServer EchoClient

原创基于Spark的大数据精准营销中搜狗搜索引擎的用户画像挖掘

原创 Scala——Traits

SMP2020微博情绪分类技术评测数据集

jblas-1.2.4-SNAPSHOT

Spark机器学习文本处理数据集

Spark机器学习推荐模型数据集

Spark机器学习回归模型数据集

Spark机器学习分类模型的数据集

空空如也

原创 深入理解Spark 2.1 Core （二）：DAG调度器的原理与源码分析

原创 深入理解Spark 2.1 Core （一）：RDD的原理与源码分析

原创 Java NIO 实现 EchoServer EchoClient

原创 基于Spark的大数据精准营销中搜狗搜索引擎的用户画像挖掘

原创 Scala——Traits

SMP2020微博情绪分类技术评测数据集

jblas-1.2.4-SNAPSHOT

Spark机器学习文本处理数据集

Spark机器学习推荐模型数据集

Spark机器学习回归模型数据集

Spark机器学习分类模型的数据集

空空如也

原创深入理解Spark 2.1 Core （二）：DAG调度器的原理与源码分析

原创深入理解Spark 2.1 Core （一）：RDD的原理与源码分析

原创基于Spark的大数据精准营销中搜狗搜索引擎的用户画像挖掘