ZenG的博客

极客矩阵

1.1 Introduction to HTML

Online HTML pad Dev API Docs Web Archive Machine Emmet Docs Atom shortcut cheatsheet: Ctrl + ` Heading 1 to 6 only search google to see more headin...

2018-12-23 16:59:32

阅读数 19

评论数 0

CMU课程推荐

CMU课程简介和先修查询 17437: Web Application Development (Django) 17214: Principles of Software Construction Keynotes 15110: Principles of Comp...

2018-12-22 18:17:32

阅读数 329

评论数 0

机器学习学习网站

CIML

2018-11-05 19:51:24

阅读数 34

评论数 0

云计算:核心概念

Scalability A distributed program is considered to be scalable if it remains effective when the quantities of users, data, and resources increase ...

2018-11-03 09:47:28

阅读数 284

评论数 0

Distributed Programming: Synchronous vs Asynchronous

Synchronous A distributed program is synchronous if and only if the component tasks operate in lockstep.Such mechanisms usually have an important e...

2018-11-03 07:57:29

阅读数 29

评论数 0

Distributed Programming: Two Traditional Communication Mechanism

shared memory vs message passing 文章目录Shared MemoryKey Abstraction:FeatureSynchronisation Mechanism1. Semaphore2. Locks3. BarrierExampleThe Message-Pa...

2018-11-03 07:41:08

阅读数 18

评论数 0

Database Manipulation in Java (Netbeans & Derby)

文章目录Set up Derby Database in Netbeans1. Create a new Database2. Get the Database URL3. Add library to Java4.Code SkeletonLoad the Database DriverConn...

2018-11-02 08:08:29

阅读数 240

评论数 0

Leetcode: Valid Parentheses

问题描述 思路: 考虑特殊情况 栈(stack)来存储未配对的符号 指针移动,如果和栈顶匹配,则弹栈 指针移动,如果和栈顶不匹配,且属于给定的符号,则压栈 终止条件为,遍历结束,栈空 class Solution { public boolean isValid(String s...

2018-11-02 06:25:04

阅读数 30

评论数 0

Spark之RDD操作

// 读取文件,压缩文件和路径都可以 val lines = sc.textFile("hdfs://localhost:9000/...") // hdfs val textFile = sc.textFile("file:///usr/lo...

2018-11-01 08:00:10

阅读数 49

评论数 0

Spark实战(5) DataFrame基础之处理缺失值

Drop Missing Value from pyspark.sql import SparkSession spark = SparkSession.builder.appName('aggs').getOrCreate() df = spark.read.csv('sales_info.cs...

2018-10-31 21:37:51

阅读数 1029

评论数 0

Spark实战(5) DataFrame基础之GroupBy和Aggregate

文章目录groupBy()AggregationAggregation Function groupBy() from pyspark.sql import SparkSession spark = SparkSession.builder.appName('aggs').getOrCreate...

2018-10-31 19:54:26

阅读数 781

评论数 0

Spark实战(4) DataFrame基础之数据筛选

文章目录filter写法一filter写法二条件符号获取结果 filter写法一 from pyspark.sql import SparkSession spark = SparkSession.builder.appName('ops').getOrCreate() df = spark....

2018-10-31 19:09:39

阅读数 510

评论数 0

Spark实战(3) DataFrame基础之行列操作和SQL

文章目录行列操作SQL操作 行列操作 df['age'] # I only get a column object df.select('age').show() # I get a datafram with a column that we could use with show() meth...

2018-10-31 18:40:59

阅读数 119

评论数 0

云计算之分布式编程(1)

基本概念 串行(sequential):cpu一次只执行一个程序,按照顺序执行所有程序 并行(concurrent):多个任务交替使用cpu资源,在时间上共享单一cpu资源 并发(parallel):多个任务在多个cpu上同时执行 分布式(distributed program):并发任务在不同...

2018-10-31 18:15:59

阅读数 168

评论数 0

Spark实战(2) DataFrame基础之创建DataFrame

之前,RDD语法占主导,但是比较难用难学. 现在,有了DataFrame,更容易操作和使用spark. 文章目录创建DataFrame创建DataFrame(指定Schema) 创建DataFrame from pyspark.sql import SparkSession # 新建一个ses...

2018-10-31 18:15:22

阅读数 131

评论数 0

Spark实战(1) 配置AWS EMR 和Zeppelin Notebook

SparkContext和SparkSession的区别,如何取用? SparkContext: 在Spark 2.0.0之前使用 通过资源管理器例如YARN来连接集群 需要传入SparkConf来创建SparkContext对象 如果要使用SQL,HIVE或者Streaming的API, 需...

2018-10-31 17:40:41

阅读数 136

评论数 0

Linux如何定位JDK Path

Linux如何查看JDK的安装路径

2018-10-23 21:52:21

阅读数 46

评论数 0

Ubuntu 16.04安装Java JDK8

Ubuntu 16.04安装Java JDK8

2018-10-23 21:47:43

阅读数 43

评论数 0

Install spaCy

For mac OS pip install -U spacy python -m spacy download en

2018-10-23 20:29:02

阅读数 200

评论数 0

Introduction to Scala

Introduction to Scala Scala is becoming popular Twitter and Linkedin is using scala Scala combines oop and functional programming Scala has good sup...

2018-10-23 13:46:58

阅读数 54

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭