Icesuns-CSDN博客

原创 Spark常见算子

这里，从源码的角度总结一下Spark RDD算子的用法。单值型Transformation算子 map /** * Return a new RDD by applying a function to all elements of this RDD. */ def map[U: ClassTag](f: T => U): RDD[U] = withScope { ...

2019-06-10 00:13:05 169

原创 java实现spark（1）

用java实现简单的Spark例子。数据很简单，是一个被预先处理的日志文件，包括时间、电话号，上行流量和下行流量。一行为一条记录，不同数据之间用制表符隔开。样本类样本类是为了将日志文件的一条记录封装起来 package com.icesun.java.accessLog; import java.io.Serializable; public class LogInfo impleme...

2019-06-09 22:00:16 312

本文原地址为 www.zicesun.com icesuns.github.io 在学习的过程中,遇到很多的问题.在训练模型的时候,需要对数据进行读取操作.本篇文章,介绍pytorch如何自定义数据dataset和dataloader.在pytorch中,提供了Dataset这个类,负责对数据进行抽象,一次调用只返回第一个同样本.而Dataloader提供了对一个对一个batch的数据操作,还有...

2019-03-29 19:36:52 1781

原创学习之路——Spark(3)——Spark RDD内部结构

本文原地址在 www.zicesun.com icesuns.github.io Spark是一个基于分布式内存的大数据计算框架，RDD (Resilient Distributed Dataset)是Spark最重要的一个数据抽象。这篇文章记录了我对RDD的一些理解，有不足和错误的地方，请留言指正。什么是RDD RDD (Resilient Distributed Dataset)，弹性分...

2019-03-29 19:35:01 271

原创转载——学习之路——Spark(2)

本文转载于 www.zicesun.com icesuns.github.io 本文讲介绍如何搭建spark集群。搭建spark集群需要进行一下几件事情：集群配置ssh无秘登录 java jdk1.8 scala-2.11.12 spark-2.4.0-bin-hadoop2.7 hadoop-2.7.6 上述所有的文件都安装在/home/zhuyb/opt文件夹中。服务器服务器是...

2019-03-29 19:32:50 121

原创 Spark 简介

转载于 www.zicesun.com 之前看了一些Spark的相关内容，我觉得很有必要进行总结一下，不然都搭不起自己的知识框架。 Apache Spark Apache Spark™是用于大规模数据处理的统一分析引擎，是一个实现快速通用的集群计算平台。它是由加州大学伯克利分校AMP实验室开发的通用内存并行计算框架，用来构建大型的、低延迟的数据分析应用程序。它扩展了广泛使用的MapReduce计...

2019-03-29 19:27:28 156

原创统计学习方法（2）——K近邻模型

K-近邻算法的实现

2018-10-28 16:53:02 286

原创统计学习方法（1）——感知机实现（学习算法的原始形式）

最近在看李航老师的《统计学习方法》，打算实现每一个算法。置于算法的具体介绍和讲解，此处不做详细介绍，需要了解算法内容的同学，可以看一下书上的对应章节。这次实现数据参照书中第二章例2.1 实现了感知机学习算法的原始形式 #!/usr/bin/env python # -*- coding:utf-8 -*- # author= icesun import numpy as np # 感知机学习...

2018-10-27 16:29:09 561

原创 20180610-reinforcement-learning-MDP

【转自本人个人博客 icesuns】 Reinforcement Learning(2)——MDPs 上一篇文章强化学习——简介简单介绍了一下强化学习的相关概念。这篇博客将引入马尔科夫决策过程(Markov Decision Processes, MDPs)对强化学习进行建模。这篇文章，将对马尔科夫决策过程以及Q-leaning进行介绍。马尔科夫过程定义: 若随机过程 {Xn,...

2018-06-15 10:15:21 256

原创 reinforcement-learning-1

转载于icesuns的《Reinforcement Learning(1)》强化学习简介强化学习（英语：Reinforcement learning，简称RL）是机器学习中的一个领域，强调如何基于环境而行动，以取得最大化的预期利益。其灵感来源于心理学中的行为主义理论，即有机体如何在环境给予的奖励或惩罚的刺激下，逐步形成对刺激的预期，产生能获得最大利益的习惯性行为。强化学习涉及很多学科，...

2018-06-04 14:41:16 280 1

原创 kubenetes集群配置之kubeadm自动创建集群

kubeadm自动创建集群 kubeadm自动创建集群一更新apt-get源二安装docker 和kubenetes 三配置kubenetes 3.1 注意事项 3.2 配置master节点 3.3 配置子节点最近在做一个比赛，需要部署在kubenetes集群上。手动创建集群需要配置很多环境文件，容易出现各种问题，因此。我们在利用kubenetes自动部署...

2018-04-08 16:10:15 1497

原创 tensorflow-GPU安装 | cudnn安装问题

1、关于tensorflow-gpu安装的问题，教程很多，可以参考tensorflow-gpu的安装 2、安装tensorflow的时候，pip安装下组速度很慢，可以更换pip源(pypi国内源)加快下载速度. 大致的方法如下:pip install tensorf...

2018-03-25 14:20:17 376

Icesuns‘s blogs