donne.go
码龄8年
关注
提问 私信
  • 博客:23,624
    动态:9
    23,633
    总访问量
  • 16
    原创
  • 1,879,145
    排名
  • 40
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2016-09-12
博客简介:

qq_36125181的博客

查看详细资料
个人成就
  • 获得20次点赞
  • 内容获得37次评论
  • 获得131次收藏
  • 代码片获得317次分享
创作历程
  • 1篇
    2022年
  • 3篇
    2020年
  • 12篇
    2019年
成就勋章
TA的专栏
  • 开发
    5篇
  • MySql
    2篇
  • Java
    2篇
  • hadoop
    12篇
兴趣领域 设置
  • 大数据
    hadoophivespark
创作活动更多

如何做好一份技术文档?

无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

183人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

NLPIR-JAVA版本-MAC-LINUX-WINDOWS操作系统均适用

最近在写论文,需要用到各类分词器的效果对比,大家都知道NLPIR是比较有名的,下载链接:NLPIR-ICTCLAS汉语分词系统-首页但是其使用C开发的,使用JAVA的小伙伴会很难受,大家可以直接从使用这个版本:The Java Package of NLPIR-ICTCLAS.其中MAC版本依赖的是这个lib文件(其它系统以来也都在对应目录下):安装好之后,直接进入Test文件运行,跑之前需要修改路径为绝对路径(MAC系统):如果遇到了以下ddl、io文件找不到问...
原创
发布博客 2022.03.30 ·
2629 阅读 ·
2 点赞 ·
1 评论 ·
1 收藏

List 集合流操作基础

List 流操作总结List 取属性值作为新List元素List<Long> illegalMySqlIds = list.stream() //stream是内存操作 .map(IllegalWord::getId) //取Id作为新List元素 .collect(Collectors.toList()); //成型 //案例2 List<Integer> list1=new ArrayList<Integer>(); list1.add(
原创
发布博客 2020.09.15 ·
1329 阅读 ·
2 点赞 ·
0 评论 ·
4 收藏

剑指Offer--解题记录(更新中......)

1.题目描述在一个二维数组中(每个一维数组的长度相同),每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。public class Solution { public boolean Find(int target, int [][] array) { int rows=a...
原创
发布博客 2020.03.12 ·
234 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

林子雨案例----淘宝伪数据分析

淘宝双11数据分析与预测准备工作:软件工具本案例所涉及的系统及软件: Linux系统(CENTOS 7) MySQL Tomcat(7.0.9) Hadoop(3.2.0) Hive(2.3.5) Sqoop(1.4.6) ECharts(4.5.0) Idea(2019.1.3) Spark(2....
原创
发布博客 2020.01.23 ·
5744 阅读 ·
9 点赞 ·
36 评论 ·
75 收藏

Hive优化

Hive优化HiveFetch抓取:在 hive-default.xml.template 文件中 hive.fetch.task.conversion 默认是 more,老版本 hive 默认是 minimal,该属性修改为 more 以后,在全局查找、字段查找、limit 查找等都不 走mapreduce。(如果设置为none,则所有查询都是用mapreduce)Hive本地模式:大多...
原创
发布博客 2019.12.01 ·
166 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

MapReduce原理过程详解

1 概述2 MapReduce体系结构3 MapReduce工作流程4 实例分析:WordCount5 MapReduce的具体应用1.概述在MapReduce出现之前,已经有像MPI这样非常成熟的并行计算框架了,那么为什么Google还需要MapReduce?MapReduce相较于传统的并行计算框架有什么优势? 传统并行计算框...
原创
发布博客 2019.10.05 ·
5730 阅读 ·
1 点赞 ·
0 评论 ·
17 收藏

Mysql——SELECT list is not in GROUP BY clause and contains nonaggregated column 'userinfo.

最近使用linux版本的Mysql的时候出现了错误:SELECT list is not in GROUP BY clause and contains nonaggregated column 'userinfo.最后发现是因为版本问题,在Mysql5.*之后的版本sql_mode缺省值为ONLY_FULL_GROUP_BY,这也是需要修改的地方。only_full_group_by :使...
原创
发布博客 2019.09.28 ·
1098 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Hadoop—jar命令(笔记)

Hadoop—jar命令(笔记)第一种是类名需要写全路径,这种需要在jar包之后加类名参数,在家args参数。我在创建的maven项目都需要此命令格式.第二种
原创
发布博客 2019.08.17 ·
1531 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Hadoop文件系统—通过CompressionCodecFActory 推断 CompressCodec

通过CompressionCodecFActory 推断 CompressCodec在读取一个压缩文件时,通常可以通过文件扩展名推断需要使用哪个codec。如果文件以.gz结尾,则可以用Gzipcodec来读取,如此推断等。各种压缩格式的文件拓展名:Hadoop中的codec当在读取一个压缩文件的时候,可能并不知道压缩文件用的是哪种压缩算法,那么无法完成解压任务。在Hadoop中,Compr...
原创
发布博客 2019.08.17 ·
718 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

Hadoop文件系统—对数据流的压缩和解压缩

Hadoop文件系统——对数据流的压缩和解压缩通过CompressionCodec对数据流进行压缩和解压缩,它包含两个函数,可以轻松用于对写入和输出数据进行压缩和解压缩。可用createOutputStream(OutputStream out)方法在底层的数据流中对需要以压缩格式写入(在此之前尚未压缩)的数据新建一个CompressionOutputStream对象。相反,对输入数据流中读...
原创
发布博客 2019.08.17 ·
337 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Hadoop文件系统— 通过FileSystem API 读取数据

通过FileSystem API 读取数据Hadoop文件系统通过Hadoop Path对象(而非java.io.File对象表示,因为它的语义与本地文件系统联系太过紧密)来代表文件。import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.fs.FSDataInputStream;import org.apa...
原创
发布博客 2019.08.14 ·
837 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

Hadoop文件系统—文件系统的基本操作

文件系统的基本操作现在我们通过命令行交互才进一步认识hdfs文件系统,它还有很多其他接口,但是命令行是最简单的。在我们设置伪分布式配置时,有两个属性需要进一步解释,一个是fs.defaultFS,设置为 hdfs://localhost/,用于设置hadoop的默认文件系统。HDFS的守护进程通过该属性来确定HDFS namenode的主机以及端口。我们将在localhost默认...
原创
发布博客 2019.08.13 ·
575 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

一起学Hadoop——使用IDEA编写第一个MapReduce程序(Java)

使用IDEA编写第一个MapReduce程序(Java)上两篇文章已经搭建好了hadoop为伪分布式集群,这节我们是编写第一个MapReduce程序(单词字母检查)1.安装Idea2.创建maven程序3.编写程序,导入hadoop jar包4.打包使用shell命令运行1.安装Idea下载安装即可:Idea官网2.创建maven程序安装好maven之后(配置环境变量),即可创建...
原创
发布博客 2019.08.11 ·
2066 阅读 ·
3 点赞 ·
0 评论 ·
29 收藏

带带小垃圾的博客

带带小垃圾博客目录Hadoop搭建伪分布式集群(上)hadoop搭建伪分布式集群 (下)编写第一个MapReduce程序Hadoop文件系统—文件系统的基本操作Hadoop文件系统— 通过FileSystem API 读取数据Hadoop文件系统—通过CompressionCodecFActory 推断 CompressCodecHadoop文件系统—对数据流的压缩和解...
原创
发布博客 2019.08.11 ·
166 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

hadoop搭建伪分布式集群(下)

hadoop搭建伪分布式集群 下(centos7+hadoop-3.1.0/2.7.7)第一部分请参考hadoop搭建伪分布式集群 上第二部分 Hadoop正式安装1.安装Hadoop2.修改hadoop的5个配置文件3.解决互信问题1.安装hadoop直接去官网hadoop下载建议下载最新的hadoop3.*版本,具体更新特性我也不太清楚,hadoop2.*也可以,1.*就不要考...
原创
发布博客 2019.08.11 ·
235 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

Hadoop搭建伪分布式集群(上)

hadoop搭建伪分布式集群 上(centos7+hadoop-3.1.0/2.7.7)第一部分 安装前部署1.查看虚拟机版本2.查看IP地址3.修改主机名为hadoop4.修改 /etc/hosts5.关闭防火墙6.关闭SELINUX7.安装yum源并安装基础包8.关闭不必要的服务9.安装Java环境第二部分 Hadoop正式安装1.安装Hadoop2.修改hadoop...
原创
发布博客 2019.08.11 ·
228 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏
加载更多