litianxingzsq
码龄12年
关注
提问 私信
  • 博客:10,637
    10,637
    总访问量
  • 4
    原创
  • 1,608,322
    排名
  • 16
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2012-12-20
博客简介:

litianxingzsq的博客

查看详细资料
个人成就
  • 获得18次点赞
  • 内容获得2次评论
  • 获得362次收藏
创作历程
  • 4篇
    2020年
成就勋章
TA的专栏
  • hbase
    1篇
  • 大数据
    4篇
  • kafka
    1篇
  • 推荐算法
    1篇
  • spark
    1篇
兴趣领域 设置
  • 大数据
    hadoophivesparketl
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

提升Hbase读写性能的几个建议

在运维hbase时,目前我们最为关注的主要是三大方面的状况: Cluster load; 读写; 磁盘空间。 Cluster load 集群的load状况直接反映了集群的健康程度,load状况的获取非常容易,直接部署ganglia即可得到,由于hbase以优秀的可伸缩性著称,因此多数情况下load超出接受范围时加机器是一个不错的解决方法,当然,这还和系统的设计和使用hbase的方式有关。 如有出现个别机器load比较高的现象,通常是由于集群使用的不均衡造成,需要进行一定的处理,这个放到读写部分再说吧。
原创
发布博客 2020.12.17 ·
342 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

kafka高性能背后的优秀设计

这里写自定义目录标题kafka高性能架构鉴赏服务端请求处理顺序处理请求(方案一)异步处理(方案二)高性能高并发功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入 kafka高性能架构鉴赏 服务端请求处理 顺序处理请求(方案一) whi
原创
发布博客 2020.12.16 ·
177 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

sparkMllib协同过滤推荐算法

协同过滤推荐算法,是最经典、最常用的推荐算法。通过分析用户兴趣,在用户群中找到指定用户的相似用户,综合这些相似用户对某一信息的评价,形成系统关于该指定用户对此信息的喜好程度预测。 要实现协同过滤,需要以下几个步骤: 1)收集用户偏好; 2)找到相似的用户或物品; 3)计算推荐。 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VpWIHzEJ-1608025968713)(%E6%96%87%E6%A1%A3%EF%BC%9A%20sparkmllib%E5%8D%8F%E5%
原创
发布博客 2020.12.15 ·
529 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Hive优化总结(史上最全)

Hive优化总结 hive建表设计层面 1.使用分区表优化 分区表 是在某一个或者几个维度上对数据进行分类存储,一个分区对应一个目录。如果筛选条件里有分 区字段,那么 Hive 只需要遍历对应分区目录下的文件即可,不需要遍历全局数据,使得处理的数据量 大大减少,从而提高查询效率。 也就是说:当一个 Hive 表的查询大多数情况下,会根据某一个字段进行筛选时,那么非常适合创建为 分区表,该字段即为分区字段。 使用分桶表优化 跟分区的概念很相似,都是把数据分成多个不同的类别,区别就是规则不一样! 1、分区:按照
原创
发布博客 2020.12.14 ·
9589 阅读 ·
18 点赞 ·
1 评论 ·
350 收藏