足下小欣
码龄10年
关注
提问 私信
  • 博客:13,890
    13,890
    总访问量
  • 1
    原创
  • 455,807
    排名
  • 2
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2015-01-24
博客简介:

qq_25582369的博客

查看详细资料
个人成就
  • 获得14次点赞
  • 内容获得3次评论
  • 获得121次收藏
  • 代码片获得365次分享
创作历程
  • 4篇
    2018年
TA的专栏
  • R语言
    2篇
  • HIVE
    2篇
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

R包中文文本挖掘chinese.misc的中文说明

转载:https://github.com/githubwwwjjj/chinese.misc中文文本分析方便工具R包chinese.misc的中文说明很多人都问过的问题:(1)哪里有更多介绍?——请看极其详细的英文手册http://mirrors.ustc.edu.cn/CRAN/web/packages/chinese.misc/chinese.misc.pdf——如果您尚不了解如...
转载
发布博客 2018.12.15 ·
2383 阅读 ·
1 点赞 ·
0 评论 ·
4 收藏

json、数组、map相关的hive函数

hive-third-functions参考文献:https://github.com/aaronshan/hive-third-functions/blob/master/README-zh.md简介hive-third-functions 包含了一些很有用的hive udf函数,特别是数组和json函数.注意:hive-third-functions支持hive-0.11.0或更高...
转载
发布博客 2018.12.14 ·
2143 阅读 ·
3 点赞 ·
0 评论 ·
17 收藏

HIVE 数组

1、只获取文本中的字母,汉字和数字,剔除标点和特殊符号> select regexp_replace('assseewfew@@@###$%%.....~~~京津冀123','[[^0-9a-zA-Z\\u4e00-\\u9fa5]]','')> assseewfew京津冀1232、获取字符串a首次在字符串b中出现的位置> select locate('123','12...
原创
发布博客 2018.12.12 ·
4787 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

基于R语言的Kaggle案例分析-泰坦尼克号

背景泰坦尼克号由位于北爱尔兰贝尔法斯特的哈兰·沃尔夫船厂兴建,是当时最大的客运轮船,由于其规模相当一艘现代航空母舰,因而号称“上帝也沉没不了的巨型邮轮”。在泰坦尼克号的处女航中,从英国南安普敦出发,途经法国瑟堡-奥克特维尔以及爱尔兰昆士敦,计划横渡大西洋前往美国纽约市。但因为人为错误,于1912年4月14日船上时间夜里11点40分撞上冰山;2小时40分钟后,即4月15日凌晨02点20分,船裂成...
转载
发布博客 2018.12.12 ·
4571 阅读 ·
9 点赞 ·
3 评论 ·
99 收藏