ZenGeek
码龄6年
关注
提问 私信
  • 博客:158,854
    社区:1
    158,855
    总访问量
  • 68
    原创
  • 1,135,825
    排名
  • 26
    粉丝
  • 0
    铁粉

个人简介:代码乃需求之腿

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:澳大利亚
  • 加入CSDN时间: 2018-08-06
博客简介:

ZenG的博客

博客描述:
极客矩阵
查看详细资料
个人成就
  • 获得39次点赞
  • 内容获得8次评论
  • 获得164次收藏
  • 代码片获得118次分享
创作历程
  • 75篇
    2018年
成就勋章
TA的专栏
  • 求职
    3篇
  • 编程语言
    25篇
  • 数据库
    2篇
  • python包
    2篇
  • 数据分析
    1篇
  • 数据可视化
    1篇
  • 课程主页
    3篇
  • 爬虫
    3篇
  • NLP
    11篇
  • 吴恩达机器学习
    5篇
  • Anaconda
    1篇
  • python基础
    1篇
  • Cloud Computing
    3篇
  • Scala
    3篇
  • Maven
    1篇
  • JDK
    2篇
  • 云计算
    4篇
  • Spark
    7篇
  • Leetcode
    1篇
  • Java
    1篇
  • 网站推荐
    1篇
  • 机器学习
    1篇
  • Web Development
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

1.1 Introduction to HTML

Online HTML padDev API DocsWeb Archive MachineEmmet DocsAtom shortcut cheatsheet: Ctrl + `Heading1 to 6 onlysearch google to see more heading html mdnHTML templatehtml hit enterhtml:4t ...
原创
发布博客 2018.12.23 ·
281 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

1.1 Introduction to HTML

Online HTML padDev API DocsWeb Archive MachineEmmet DocsAtom shortcut cheatsheet: Ctrl + `Heading1 to 6 onlysearch google to see more heading html mdnHTML templatehtml hit enterhtml:4t ...
原创
发布博客 2018.12.23 ·
281 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

CMU课程推荐

CMU课程简介和先修查询 17437: Web Application Development (Django) 17214: Principles of Software ConstructionKeynotes 15110: Principles of Computing 15112: Fundamentals of Programming and C...
原创
发布博客 2018.12.22 ·
3327 阅读 ·
0 点赞 ·
0 评论 ·
6 收藏

机器学习学习网站

CIML
原创
发布博客 2018.11.05 ·
379 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

云计算:核心概念

ScalabilityA distributed program is considered to be scalable if it remains effective when the quantities of users, data, and resources increase significantly.从线性编程到分布式编程倍速公式:Ts: sequential pro...
原创
发布博客 2018.11.03 ·
1911 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Distributed Programming: Synchronous vs Asynchronous

SynchronousA distributed program is synchronous if and only if the component tasks operate in lockstep.Such mechanisms usually have an important effect on performance.AsynchronousAsynchronous p...
原创
发布博客 2018.11.03 ·
285 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Distributed Programming: Two Traditional Communication Mechanism

shared memory vs message passing文章目录Shared MemoryKey Abstraction:FeatureSynchronisation Mechanism1. Semaphore2. Locks3. BarrierExampleThe Message-Passing Programming ModelKey Abstraction:FeatureExamp...
原创
发布博客 2018.11.03 ·
398 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Database Manipulation in Java (Netbeans & Derby)

文章目录Set up Derby Database in Netbeans1. Create a new Database2. Get the Database URL3. Add library to Java4.Code SkeletonLoad the Database DriverConnect to DatabaseCreate TableInsert Records using Sta...
原创
发布博客 2018.11.02 ·
1048 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Leetcode: Valid Parentheses

问题描述思路:考虑特殊情况栈(stack)来存储未配对的符号指针移动,如果和栈顶匹配,则弹栈指针移动,如果和栈顶不匹配,且属于给定的符号,则压栈终止条件为,遍历结束,栈空class Solution { public boolean isValid(String s) { // corner case 1 if (s...
原创
发布博客 2018.11.02 ·
227 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Spark之RDD操作

// 读取文件,压缩文件和路径都可以val lines = sc.textFile("hdfs://localhost:9000/...") // hdfsval textFile = sc.textFile("file:///usr/local/spark/mycode/wordcount/word.txt") // local// 从driver的内存中读取val array = Ar...
原创
发布博客 2018.11.01 ·
266 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Spark实战(5) DataFrame基础之处理缺失值

Drop Missing Valuefrom pyspark.sql import SparkSessionspark = SparkSession.builder.appName('aggs').getOrCreate()df = spark.read.csv('sales_info.csv', inferSchema = True, header = True)df.printSche...
原创
发布博客 2018.10.31 ·
8455 阅读 ·
2 点赞 ·
1 评论 ·
8 收藏

Spark实战(5) DataFrame基础之GroupBy和Aggregate

文章目录groupBy()AggregationAggregation FunctiongroupBy()from pyspark.sql import SparkSessionspark = SparkSession.builder.appName('aggs').getOrCreate()df = spark.read.csv('sales_info.csv', inferSche...
原创
发布博客 2018.10.31 ·
8018 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Spark实战(4) DataFrame基础之数据筛选

文章目录filter写法一filter写法二条件符号获取结果filter写法一from pyspark.sql import SparkSessionspark = SparkSession.builder.appName('ops').getOrCreate()df = spark.read.csv('appe_stock.csv',inferSchema = True, heade...
原创
发布博客 2018.10.31 ·
10416 阅读 ·
1 点赞 ·
0 评论 ·
7 收藏

Spark实战(3) DataFrame基础之行列操作和SQL

文章目录行列操作SQL操作行列操作df['age'] # I only get a column objectdf.select('age').show() # I get a datafram with a column that we could use with show() method# see the first two row elementsdf.head(2) # r...
原创
发布博客 2018.10.31 ·
808 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

云计算之分布式编程(1)

基本概念串行(sequential):cpu一次只执行一个程序,按照顺序执行所有程序并行(concurrent):多个任务交替使用cpu资源,在时间上共享单一cpu资源并发(parallel):多个任务在多个cpu上同时执行分布式(distributed program):并发任务在不同的,互联的机器上执行(不仅仅是cpu)多任务(multitasking):用户可以同时运行多个任务(...
原创
发布博客 2018.10.31 ·
866 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Spark实战(2) DataFrame基础之创建DataFrame

之前,RDD语法占主导,但是比较难用难学.现在,有了DataFrame,更容易操作和使用spark.文章目录创建DataFrame创建DataFrame(指定Schema)创建DataFramefrom pyspark.sql import SparkSession# 新建一个sessionspark = SparkSession.builder.appName('Basics')...
原创
发布博客 2018.10.31 ·
834 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Spark实战(1) 配置AWS EMR 和Zeppelin Notebook

SparkContext和SparkSession的区别,如何取用?SparkContext:在Spark 2.0.0之前使用通过资源管理器例如YARN来连接集群需要传入SparkConf来创建SparkContext对象如果要使用SQL,HIVE或者Streaming的API, 需要创建单独的Context val conf = new SparkConf() .setA...
原创
发布博客 2018.10.31 ·
1327 阅读 ·
1 点赞 ·
0 评论 ·
3 收藏

Linux如何定位JDK Path

Linux如何查看JDK的安装路径
转载
发布博客 2018.10.23 ·
572 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Ubuntu 16.04安装Java JDK8

Ubuntu 16.04安装Java JDK8
转载
发布博客 2018.10.23 ·
267 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Install spaCy

For mac OS pip install -U spacy python -m spacy download en
原创
发布博客 2018.10.23 ·
1292 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多