pandana
码龄15年
关注
提问 私信
  • 博客:88,647
    社区:1,053
    89,700
    总访问量
  • 20
    原创
  • 1,645,289
    排名
  • 45
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:浙江省
  • 加入CSDN时间: 2009-11-11
博客简介:

pandana的专栏

查看详细资料
个人成就
  • 获得25次点赞
  • 内容获得24次评论
  • 获得79次收藏
创作历程
  • 1篇
    2015年
  • 4篇
    2014年
  • 4篇
    2013年
  • 4篇
    2012年
  • 2篇
    2011年
  • 4篇
    2010年
  • 1篇
    2009年
成就勋章
TA的专栏
  • 数据挖掘
    6篇
  • 软件工程
    2篇
  • 生活
  • python
  • 应用开发
    1篇
  • 数据抽取
    1篇
  • 网站分析
  • ETL
    1篇
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

hive中order by 和sort by与distribute by

hive order by 与SQL中的order by一致,都是做全局排序。order by的排序是做全局排序,只会有一个reducer进行排序,多个reducer无法保证全局有序,这样导致大数据量时,reducer排序压力大,运算慢,可能造成内存溢出危险。sort by 与order by的不同之处在于sort by限定在单机范围内进行排序。且数据能够被分发到多个reducer中处理,现假
原创
发布博客 2015.01.06 ·
590 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

ubuntu14.04 搭建hadoop2.5.1环境

一、在Ubuntu下创建hadoop组和hadoop用户增加hadoop用户组,同时在该组里增加hadoop用户,后续在涉及到hadoop操作时,我们使用该用户。1、创建hadoop用户组                2、创建hadoop用户        sudo adduser -ingroup
原创
发布博客 2014.10.26 ·
1103 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

ubuntu 14.04安装jdk 1.8.0_25

第一步、下载jdk;网址如下:http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.html点击上方的的Accept ,选择第二个tar.gz,也可以选择第一个第二步、解压jdk-7u45-linux-i586.tar.gz,如下图所示。第三步、设置j
原创
发布博客 2014.10.24 ·
1396 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

新浪新闻按关键字抓取实例

新浪新闻按关键字抓取新闻实例
原创
发布博客 2014.10.10 ·
2572 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

ubuntu12.4安装jdk1.7

第一步、下载jdk;网址如下:http://www.oracle.com/technetwork/java/javase/downloads/jdk7-downloads-1880260.html点击上方的的Accept ,选择第二个tar.gz,也可以选择第一个第二步、解压jdk-7u45-linux-i586.tar.gz,如下图所示。第三步、设置jav
原创
发布博客 2014.01.07 ·
1006 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

latex编写论文

写给像我这样需要使用latex编写论文的小菜鸟,给出demo和注释,高级部分自己参透(默认你已经搭好环境)。1.搭论文架子demo1\documentclass[10pt,a4paper]{article}\usepackage[left=2cm,right=2cm,top=2cm,bottom=2cm]{geometry}\title{Count User
原创
发布博客 2013.07.21 ·
2776 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

java实现人脸识别

发布资源 2013.06.25 ·
zip

Texmaker错误文件不能保存,请检查你是否拥有写权限

最近安装了Ctex+Texmaker来编写论文,发现在保存文件时报如下错误,纠结了许久。今天无意试了一下,成功解决了。问题很简单在保存文件时不要只是填写文件的名称,在名称后面要加上文件后缀名。加上后缀名后就能使用了,现在想想这个软件很坑爹……
原创
发布博客 2013.06.16 ·
5002 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

人人网error:invalid_request,error_description:Invalid redirect_uri解决方案

在开发网站接入人人网时,需要与人人网连接。人人网采用OAuth 2.0的验证授权流程。在http://wiki.dev.renren.com/wiki/SDK中下载相应的SDK文档,可以直接下载其demo来改写代码。本文就是下载了demo来改写代码。1.环境软件环境:java1.6+myeclipse 8.5+mysqlsdk版本:renren-sdk-java-2.02.部署de
原创
发布博客 2013.06.05 ·
9356 阅读 ·
1 点赞 ·
1 评论 ·
2 收藏

新手1小时搞定python基础

Lesson 1 准备好学习Python的环境下载的地址是:http://www.python.org/getit/这是python下载的官方网址,建议大家软件下载去官网下载linux版本的我就不说了,因为如果你能够使用linux并安装好说明你可以一切自己搞定的。运行环境可以是linux或者是windows:1、linuxredhat的linux安装上去之后一定会有
原创
发布博客 2013.01.05 ·
1028 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

2012年南邮计算机专业复试总结

2012年4月10日匆匆来到南京,下午就去找老师答疑。呵呵,老师有点娘不过人还挺好的。他讲的要注意的我认真听了,考试还是有点用的。下面我对复试情况做以下总结。(1)选择一门总结擅长的课,南邮默认选择微机原理(微机简单)    我没有学过微机原理,所以我选了编译原理。其实编译原理难,大部分人都去考微机了。不过成绩出来时还好,不管你选择了哪门课都要好好准备。 (2)本校的期末试卷和真题卷是
原创
发布博客 2012.04.24 ·
4834 阅读 ·
0 点赞 ·
3 评论 ·
3 收藏

考研复试面试常见问题回答20题

发布资源 2012.04.24 ·
doc

王汝传版编译原理资料

发布资源 2012.04.24 ·
rar

C++应用贪心算法求解背包问题

发布资源 2012.04.24 ·
doc

考研面试英语整理23题

发布资源 2012.04.24 ·
doc

spss clementine安装

最近在学着用这款统计软件,对安装做了一下整理。SPSS CLEMENTINE12.0下载地址:http://www.verycd.com/topics/2768317/1)下载虚拟光驱,并安装虚拟光驱(这个简单就不讲了)2)使用虚拟光驱安装TLF-SOFT-SPSS_Clementine_v12.0-CYGiSO.bin安装过程:   改变安装路径:
原创
发布博客 2012.04.23 ·
4874 阅读 ·
4 点赞 ·
2 评论 ·
9 收藏

myeclipse连接SQL2005以及碰到TCP/IP端口连接错误解决方案

最近在用myeclipse连接SQL2005进行开发,碰到了TCP/IP端口连接失败问题。原先我以为是SQL2005驱动包下载错误,导致数据库服务未开启。后来在网上找了资料,原来架包没有错。只是我的SQL2005的服务器有些服务没有开启。现在我把我解决问题的步骤整理如下:       (1)先在网上下载一个SQL2005连接myeclipse的驱动包。       (2)在myecli
原创
发布博客 2012.03.31 ·
1995 阅读 ·
3 点赞 ·
0 评论 ·
4 收藏

MATLAB2009A实现Kmeans实例

本人刚学习数据挖掘没有多久,数据挖掘中要用不少聚类算法。Kmeans作为其中常用的一种算法,聚类效果还行。  下面是我做了几个简单的MATLAB实现Kmeans的小实例100*2列矩阵聚类成3类 Matlab代码如下: data=rand(100,2);>> opts=statset('Display','final');>>[idx,ctrs]=kmeans(data
原创
发布博客 2012.03.31 ·
3328 阅读 ·
2 点赞 ·
2 评论 ·
1 收藏

java+myeclipse8.5+struct2.0开发的一个小型邮箱系统

发布资源 2012.03.09 ·
rar

哈弗曼树设计

发布资源 2012.03.02 ·
doc
加载更多