R包中文文本挖掘chinese.misc的中文说明

转载:https://github.com/githubwwwjjj/chinese.misc 中文文本分析方便工具R包chinese.misc的中文说明 很多人都问过的问题: (1)哪里有更多介绍? ——请看极其详细的英文手册http://mirrors.ustc.edu.cn/CRAN/we...

2018-12-15 09:32:34

阅读数 114

评论数 0

json、数组、map相关的hive函数

hive-third-functions 参考文献:https://github.com/aaronshan/hive-third-functions/blob/master/README-zh.md 简介 hive-third-functions 包含了一些很有用的hive udf函数,特别是数...

2018-12-14 11:02:22

阅读数 119

评论数 0

HIVE 数组

1、只获取文本中的字母,汉字和数字,剔除标点和特殊符号 > select regexp_replace('assseewfew@@@###$%%.....~~~京津冀123','[[^0-9a-zA-Z\\u4e00-\\u9fa5]]','') > a...

2018-12-12 00:31:52

阅读数 674

评论数 0

基于R语言的Kaggle案例分析-泰坦尼克号

背景 泰坦尼克号由位于北爱尔兰贝尔法斯特的哈兰·沃尔夫船厂兴建,是当时最大的客运轮船,由于其规模相当一艘现代航空母舰,因而号称“上帝也沉没不了的巨型邮轮”。在泰坦尼克号的处女航中,从英国南安普敦出发,途经法国瑟堡-奥克特维尔以及爱尔兰昆士敦,计划横渡大西洋前往美国纽约市。但因为人为错误,于191...

2018-12-12 00:25:03

阅读数 208

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭