Jooey_Zhong
码龄9年
关注
提问 私信
  • 博客:66,317
    66,317
    总访问量
  • 20
    原创
  • 710,540
    排名
  • 65
    粉丝
  • 0
    铁粉

个人简介:Trying to be a Pythoner;Focus on Hadoop &Spark

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:法国
  • 加入CSDN时间: 2015-09-24
博客简介:

Jooey_Zhong

博客描述:
待我学有所成,结发与蕊可好。@夏瑾墨 Trying to be a Pythoner;Focus on Hadoop & Spark,Data Analysis
查看详细资料
个人成就
  • 获得96次点赞
  • 内容获得5次评论
  • 获得297次收藏
创作历程
  • 2篇
    2017年
  • 19篇
    2016年
TA的专栏
  • 数据平台开发实习生
    8篇
  • 每日Python
    4篇
  • 软件工程系笔记本
    2篇
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

MCM-Problem-C-Overview

C题是MCM于2016年新增设的题目,被称为Data Insights类问题,关注与数据有关的数学模型。因此,与之前的MCM赛题相比,统计、模式识别等领域的模型可能用的更多。 C题是与数据有关的实际问题,建模的时候可能会遇到各种困难,如数据集较大(但还不是大数据级别),混合的数据类型,数据缺失等。但C题不是大数据(big data)问题,不需要参赛队掌握特殊的计算机科学知识,如数据处理的基本算法、
原创
发布博客 2017.01.01 ·
1532 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

使用 Spark MLlib 做 K-means 聚类分析

## Licensed to the Apache Software Foundation (ASF) under one or more# contributor license agreements. See the NOTICE file distributed with# this work for additional information regarding copyright
原创
发布博客 2017.01.01 ·
1506 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Python字典转Json并使用多种格式实现

前言: 利用Python数据转换的套路可以遵循:变量定义的位置,字典操作,列表操作,这个三部分的内容可以处理大部分的数据相关需求。1.下面我们先看这个脚本:#从字典转换为Json的方法from distutils.log import warn as printffrom json import dumpsfrom pprint import pprintBOOKs = { '0132
原创
发布博客 2016.11.13 ·
3886 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

利用python进行数据分析之——数据规整化2(ETL)

待我学有所成,结发与蕊可好。@夏瑾墨 by Jooey3.数据的轴向连接 Nunpy 有一个用于合并串联原始Numpy数组的concatenation函数import numpy as npimport pandas as pdfrom pandas import Series,DataFramearr=np.arange(12).reshape((3,4))print (arr)pri
原创
发布博客 2016.11.11 ·
1332 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

利用python进行数据分析之——数据规整化1(ETL)

待我学有所成,结发与蕊可好。@夏瑾墨 by Jooey合并数据集数据库风格的DataFrame合并索引上的合并轴向连接1.数据库风格的DataFrame合并import pandas as pdfrom pandas import Series,DataFrame#一对多df1=DataFrame({'key':['b','b','a','c','a','a','b'],'data1'
原创
发布博客 2016.11.08 ·
6740 阅读 ·
2 点赞 ·
0 评论 ·
4 收藏

CSDN-markdown编辑器使用方法

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl
原创
发布博客 2016.11.06 ·
384 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

11月读书进度记录表

2016年11月5日(更)技术类书籍《鸟哥的Linux私房菜(基础学习篇)》——P130/778:第一部分 第五章 5.4 超简单文本编辑器:nano《利用Python进行数据分析》——P64/463:第三章 %run 命令《Java jdk8 学习笔记》——P226/627:Chapter8 异常处理 - 人文类书籍《北上广深的年轻人》——p50/228《十年一品温如言》——p81/
原创
发布博客 2016.11.06 ·
632 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

利用Python进行数据分析系列之——数据格式转换

待我学有所成,结发与蕊可好。@夏瑾墨 by Jooey需求:将OD_Matrix_Weekday_BusyHourAM.csv转换成OD_Matrix_Weekday_BusyHourAM.json。 在数据可视化中,OD弦图要求以百分比的输入格式,也可以用具体的客流数值,但是需要修改一下绘图的js脚本。由于目前数据处理的结果主要是二维表形式的csv,与弦图要求的输入格式不一致,所以这里按照需求
原创
发布博客 2016.11.04 ·
1303 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

数据平台开发实习生系列之——学习规划

待我学有所成,结发与蕊可好。@夏瑾墨 by Jooey大概是从2015年2月份开始接触大数据相关的,在假期的时候,没有回家,留在了302实验室,现在想想那时候都学了什么?那时候和一个死大四的老学长还有两个14届的学长住在实验室里过着一箪食一豆羹的纯粹生活,在某个夜里死大四的老学长让我们去抬服务器,这是干什么?他说搭环境,后来了解到就是在搭hadoop这个平台,印象中老学长Python玩的比较溜,看
原创
发布博客 2016.11.03 ·
896 阅读 ·
0 点赞 ·
1 评论 ·
1 收藏

用Python解一元二次方程以及进制转换

待我学有所成,结发与蕊可好。@夏瑾墨每天都做出一定量的思考题,才会有长久的进步啊。 1.解一元二次方程设计 请定义一个函数quadratic(a, b, c),接收3个参数,返回一元二次方程:ax2 + bx + c = 0的两个解。提示:计算平方根可以调用math.sqrt()函数:import mathdef quadratic(a,b,c): p=b*b-4*a*c i
原创
发布博客 2016.11.01 ·
2784 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

译:Getting Started with Spark (in Python) Spark入门

待我学有所成,结发与蕊可好。@ 夏瑾墨Getting Started with Spark (in Python) Author:Benjamin Bengfort Translator:Jooey ZhongHadoop 作为处理大数据集的分布式计算标准工具这就是为什么当你路过机场看到广告上的”大数据“的原因。它已经变成大数据的一种操作系统,提供一个让您能使用许多相对廉价的商品化硬件在以
翻译
发布博客 2016.10.27 ·
867 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

数据结构之树和二叉树算法实现(C语言)

待我学有所成,结发与蕊可好。@夏瑾墨开发环境为Dev-C++ 5.11 编译器:MinGW GCC 6.1.0 64-bit 一、算法程序组建目录结构如下: 第一部分:头文件 1. c1.h 2. c3-3.h 3. c6-1.h 4. c6-2.h 5. c6-3.h 6. c6-4.h 7. c6-5.h 8. c6-7.h 第二部分:主程序入口文
原创
发布博客 2016.10.26 ·
5477 阅读 ·
5 点赞 ·
0 评论 ·
15 收藏

Python开发Spark应用之Wordcount词频统计

待我学有所成,结发与蕊可好。@夏瑾墨一个早上只做了一点微小的工作,很忏愧。但是发现Spark这玩意还是蛮有意思的。下面给大家介绍一下如何用python跑一遍Wordcount的词频统计的示例程序。#在pyspark模块中引入SparkContext和SparkConf类#在operator模块中导入add类from pyspark import SparkContext, SparkConf
原创
发布博客 2016.10.23 ·
8012 阅读 ·
5 点赞 ·
0 评论 ·
11 收藏

Anney and Jooey

Topic: Work in pairs. A girl student and a boy student act to attend a blind date in a café. 待我学有所成,结发与蕊可好。@夏瑾墨 by JooeyAnney: Hi I am Anney! Jooey: Hi I am Jooey!Anney: Nice to meet you. Anney
原创
发布博客 2016.10.22 ·
582 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Java技术笔记2:类与对象实例之用户定义类

待我学有所成,结发与蕊可好。@夏瑾墨用户自定义类(是用户自己编写的类,以下定义一个Cylinder类)package com.zhong;class Cylinder //定义Cylinder类{double radius; //定义成员变量radiusint height; //定义成员变量heightdouble pi=3.14;void area() //定义无返回值的方法are
原创
发布博客 2016.10.22 ·
1113 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Java技术笔记1:类与对象实例之系统常用类

一直在反思最近的时间安排,知识没有总结和积累很容易发生遗忘,如果要让自己在短期内能有大的提升,那就需要每天的知识流输入,减去你生活中看起来也是重要的东西,然而性命攸关的只有一个,兼顾太多,一无所得,一学长提到贪心算法来处理利益最大化问题,最后往往都不是最好的方案。而使用动态规划(Dynamic Programming),给自己做做减法,追求一下深度而非广度,你会发现自己可以做得更好。java类的基本
原创
发布博客 2016.10.18 ·
1042 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

C语言知识点完美总结

C语言最重要的知识点 总体上必须清楚的: 1)程序结构是三种: 顺序结构 、选择结构(分支结构)、循环结构。 2)读程序都要从main()入口, 然后从最上面顺序往下读(碰到循环做循环,碰到选择做选择),有且只有一个main函数。 3)计算机的数据在电脑中保存是以 二进制的形式. 数据存放的位置就是 他的地址. 4)bit是位 是指为0 或者1。 byte 是指字节, 一个字节
原创
发布博客 2016.10.08 ·
23128 阅读 ·
80 点赞 ·
4 评论 ·
360 收藏

003软件(2016)基础设计(一)

内容一:顺序、分支、循环结构程序设计、数组的应用 (4学时)方式:简单复习知识点,重点复习一维数组、二维数组。 题目:  基础:将10个元素存入一个一维数组中,按逆序输出,并找出最大数和最小数。 解:#include<stdio.h> int main(){ int i, a[10]; for(i = 0; i < 10; i ++)//顺序循环,输入10个数
原创
发布博客 2016.09.04 ·
1119 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

001 用ssh上传文件的简单方法

ssh连上了那么就差一步即可实现,yum安装个lrzsz软件;yum安装后再使用rz命令上传文件; yum -y lrzsz rz
原创
发布博客 2016.06.05 ·
523 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

002如何构建hadoop集群环境?

实验室机器配置情况: 3台PowerEdge R730 Server 1台PowerEdge R410 Server 1台kvm 1台交换机我们打算配置三个节点规模的集群,所以我们计划集群有1一个namenode背景知识:本篇文章介绍如何在一个计算机集群上构建Hadoop系统。hadoop的主体用java语言写成,能够在任意一个安装了jvm(Java Virtual Machine)(Jav
原创
发布博客 2016.04.26 ·
732 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多