少年程序员
码龄9年
关注
提问 私信
  • 博客:2,063
    2,063
    总访问量
  • 4
    原创
  • 486,934
    排名
  • 0
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:陕西省
  • 目前就职: 中软国际
  • 加入CSDN时间: 2015-11-21
博客简介:

qq_33000425的博客

查看详细资料
个人成就
  • 获得1次点赞
  • 内容获得2次评论
  • 获得4次收藏
创作历程
  • 3篇
    2021年
  • 2篇
    2020年
成就勋章
TA的专栏
  • 笔记
    1篇
  • SQL
    3篇
  • 大数据开发
    4篇
  • java
  • 机器学习
    1篇
兴趣领域 设置
  • 大数据
    hadoophivesparketl
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

企业级hive调优

hive的企业级调优1、Fetch抓取Fetch抓取是指,Hive中对某些情况的查询可以不必使用MapReduce计算例如:select * from score;在这种情况下,Hive可以简单地读取employee对应的存储目录下的文件,然后输出查询结果到控制台在hive-default.xml.template文件中 hive.fetch.task.conversion默认是more,老版本hive默认是minimal,该属性修改为more以后,在全局查找、字段查找、limit查找
原创
发布博客 2021.02.17 ·
215 阅读 ·
1 点赞 ·
2 评论 ·
1 收藏

Hive 主流文件存储格式对比

Hive 主流文件存储格式对比1、存储文件的压缩比测试1.1 测试数据https://github.com/liufengji/Compression_Format_Datalog.txt 大小为18.1 M1.2 TextFile创建表,存储数据格式为TextFilecreate table log_text (track_time string,url string,session_id string,referer string,ip string,end_user_
原创
发布博客 2021.02.17 ·
312 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Hive的查询语法

1.基本查询注意SQL 语言大小写不敏感SQL 可以写在一行或者多行关键字不能被缩写也不能分行各子句一般要分行写使用缩进提高语句的可读性1.1 查询全表和特定列全表查询select * from stu;选择特定列查询select id,name from stu;1.2 列起别名重命名一个列紧跟列名,也可以在列名和别名之间加入关键字 ‘as’案例实操select id,name as stuName from stu;1.3 常用函
原创
发布博客 2021.02.17 ·
294 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

SQL排名函数总结

1.ROW_NUMBER() 定义:ROW_NUMBER()函数作用就是将select查询到的数据进行排序,每一条数据加一个序号,他不能用做于学生成绩的排名,一般多用于分页查询,  比如查询前10个 查询10-100个学生。 实例: 1.1对学生成绩排序   这里number就是每个学生的序号 根据studentScore(分数)进行desc倒序 1.2获取第二个同学的成绩信息   这里用到的思想就是 分页查询的思想 在原s...
转载
发布博客 2020.11.14 ·
984 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

机器学习模型总结

线性回归模型线性回归模型的特点优点线性模型形式简单,可解释性强,容易理解和实现缺点线性模型怒能表达复杂的模式,对于非线性问题表现不佳应用领域金融领域,气象预报,特别适用于能够用线性关系进行描述的问题领域模型实现from sklearn import linear_modelimport numpy as npmodel = linear_mod...
原创
发布博客 2020.03.02 ·
257 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏