forrestxingyunfei
码龄15年
关注
提问 私信
  • 博客:126,917
    126,917
    总访问量
  • 82
    原创
  • 1,919,784
    排名
  • 40
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:上海市
  • 加入CSDN时间: 2010-07-04
博客简介:

youfashion的博客

查看详细资料
个人成就
  • 获得8次点赞
  • 内容获得10次评论
  • 获得24次收藏
创作历程
  • 1篇
    2018年
  • 25篇
    2017年
  • 58篇
    2016年
成就勋章
TA的专栏
  • 机器学习
  • linux
    1篇
  • Hue框架
    1篇
  • Oozie框架
    2篇
  • 大数据问题
    3篇
  • Hbase学习
    2篇
  • hadoop
    12篇
  • mysql
    5篇
  • zookeeper
    3篇
  • spark
    9篇
  • Hive
    11篇
  • java
    1篇
  • Storm
    1篇
  • scala
    7篇
  • redis
    2篇
  • 大数据企业平台
    1篇
  • JVM
    6篇
  • 架构设计
    1篇
  • maven
    4篇
  • Lucene
    3篇
  • Solr
    4篇
  • Flume
兴趣领域 设置
  • 人工智能
    机器学习数据分析
创作活动更多

2024 博客之星年度评选报名已开启

博主的专属年度盛宴,一年仅有一次!MAC mini、大疆无人机、华为手表等精美奖品等你来拿!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Hadoop学习四:hadoop分布式环境搭建

Hadoop学习四:hadoop分布式环境搭建标签(空格分隔): hadoopHadoop学习四hadoop分布式环境搭建一环境准备二分布式环境搭建针对克隆三角色分配四安装配置一,环境准备1,删除/opt/app/hadoop-2.5.0/share/doc目录(该目录很占空间)rm -rf doc/2,关闭虚拟机[root@hadoop001 hadoop-2.5.0]# halt3,克
原创
发布博客 2016.04.08 ·
1364 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Hadoop学习九:hdfs源代码调试

Hadoop学习九:hdfs源代码调试标签(空格分隔): hadoopHadoop学习九hdfs源代码调试一利用log4j调试一,利用log4j调试1,在eclipse工程里面创建source folder 2,拷贝log4j.properties文件[hadoop002@hadoop002 hadoop]$ cp log4j.properties /home/hadoop002/worksp
原创
发布博客 2016.04.13 ·
1702 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

oozie修改为GMT时间

1,修改oozie-site.xml:<property>        <name>oozie.processing.timezone</name>        <value>GMT+0800</value>  </property>2,修改/opt/setup/oozie-4.0.0-cdh5.3.6/oozie-ser...
原创
发布博客 2018.04.07 ·
579 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Solr3---案例分析

案例分析
原创
发布博客 2017.09.10 ·
569 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Solr3---SolrJ的使用

1,什么是solrJ 2,依赖的包 3,添加文档 3.1,实现步骤 4,删除文档 5,修改文档 6,查询文档 6.1简单查询 6.2 复杂查询 7,总结
原创
发布博客 2017.09.09 ·
541 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Solr2---域的类型和分类以及中文分词

一,域的类型和分类 C:\solrhome\collection2\conf\schema.xml二,配置中文分词 1,拷贝IKAnalyzer2012FF_u1.jar到apache-tomcat-7.0.81\webapps\solr\WEB-INF\lib目录下面2,拷贝配置文件ext.dic,IKAnalyzer.cfg.xml,stopword.dic到apache-tomcat-7.
原创
发布博客 2017.09.01 ·
1582 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Solr1---什么是Solr以及安装配置

Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器。Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。Solr可以独立运行,运行在Jetty、Tomcat等这些Servlet容器中,Solr 索引的实现方法很简单,用 POST 方法向 Solr 服务器发送一个描述 Field 及其内容的
原创
发布博客 2017.08.31 ·
452 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

lucene三---中文分词器

1.1. 中文分析器1.1.1.  Lucene自带中文分词器l  StandardAnalyzer:单字分词:就是按照中文一个字一个字地进行分词。如:“我爱中国”,效果:“我”、“爱”、“中”、“国”。l  CJKAnalyzer二分法分词:按两个字进行切分。如:“我是中国人”,效果:“我是”、“是中”、“中国”“国人”。 上边两个分词器无法满足需求。l  S
原创
发布博客 2017.08.31 ·
934 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

lucene二----luke的使用

1,将安装包放到根目录下2,java -jar  lukeall-4.10.3.jar
原创
发布博客 2017.08.31 ·
380 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

lucene一---基本原理和结构

1     什么是全文检索1.1   结构化数据和非结构化数据我们生活中的数据总体分为两种:结构化数据和非结构化数据。 ·       结构化数据:指具有固定格式或有限长度的数据,如数据库中的数据,元数据等。·       非结构化数据:指不定长或无固定格式的数据,如邮件,word文档等。1.2   对结构化数据的搜索对数据库的搜索,用SQL语句。再如对元数据的搜索,如
原创
发布博客 2017.08.31 ·
367 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

maven四

1,maven私服1.1私服安装2,仓库类型3,上传jar到私服4,从私服上下载Jar
原创
发布博客 2017.08.30 ·
292 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

maven三

1,传递依赖冲突解决2,ssh配置文件加载过程
原创
发布博客 2017.08.30 ·
312 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

maven二

1,maven的生命周期2,eclipse配置maven
原创
发布博客 2017.08.21 ·
394 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

maven一

1,maven的优点2,maven的好处如何实现3,maven的安装和配置4,本地仓库的配置5,标准目录结构6,maven的标准命令
原创
发布博客 2017.08.21 ·
268 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

分布式模式之Broker模式

问题来源: 创建一个游戏系统,其将运行在互联网的环境中。客户端通过WWW服务或特定的客户端软件连接到游戏服务器,随着流量的增加,系统不断的膨胀,最终后台数据、业务逻辑被分布式的部署。然而相比中心化的系统,复杂度被无可避免的增大了,该如何降低各个组件之间的耦合度。挑战: 需要保证可伸缩性、可维护性、可更新性,需要将服务划分为各个相对独立的组件,组件被分布式的部署,它们之间通过进程间通信方
转载
发布博客 2017.06.08 ·
470 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

hive数据压缩技术001

一、 压缩方案比较关于Hadoop HDFS文件的压缩格式选择, 我们通过多个真实的Track数据做测试,得出结论如下:1. 系统的默认压缩编码方式 DefaultCodec 无论在压缩性能上还是压缩比上,都优于GZIP 压缩编码。这一点与网上的一些观点不大一致,网上不少人认为GZIP的压缩比要高一些,估计和Cloudera的封装及我们Track的数据类型有关。2. Hive文
原创
发布博客 2017.06.05 ·
381 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Hive作业优化

1、Join原则将条目少的表/子查询放在 Join的左边。 原因是在 Join 操作的 Reduce 阶段,位于 Join左边的表的内容会被加载进内存,将条目少的表放在左边,可以有效减少发生内存溢出的几率。当一个小表关联一个超大表时,容易发生数据倾斜,可以用MapJoin把小表全部加载到内存在map端进行join,避免reducer处理。如:SELECT /*+ MAPJOIN(use
原创
发布博客 2017.06.04 ·
443 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

jdbc通过hive server2访问hive

1,pom配置:    org.apache.hadoop    hadoop-client    2.6.0-cdh5.8.3        org.apache.hadoop        hadoop-common        2.6.0-cdh5.8.3        org.apache.hive        hive-jd
原创
发布博客 2017.06.03 ·
515 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

hive-udaf开发实例1

1,pom配置:    org.apache.hive    hive-exec    1.1.0-cdh5.8.3    org.apache.hadoop    hadoop-client    2.6.0-cdh5.8.32,java代码:package com.ibeifeng.udaf;import org.apache
原创
发布博客 2017.06.03 ·
715 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

hive-udf开发实例1

1,pom配置:    org.apache.hive    hive-exec    1.1.0-cdh5.8.3    org.apache.hadoop    hadoop-client    2.6.0-cdh5.8.32,java代码:package com.ibeifeng.udf;import java.util.r
原创
发布博客 2017.06.02 ·
503 阅读 ·
0 点赞 ·
2 评论 ·
1 收藏
加载更多