自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 【Hive SQL】is not null之后还是存在空值

这是因为数据在数据库中格式可能为‘’,因此可以加一个条件:where length(trim(col)) = 0 另外,Hive SQL中NULL和‘’有所不同:where length(NULL),length('')->NULL,0

2020-07-22 15:46:42 4161

原创 【SQL】小数以百分数形式输出

代码:select concat(10.2,'%')->10.2%

2020-07-21 17:44:41 3527 1

原创 【Hive SQL】FAILED: ParseException line 13:4 missing KW_END at ‘,‘ near ‘‘

Hive SQL 代码报错:FAILED: ParseException line 13:4 missing KW_END at ',' near ''原因:case when 后没有加end

2020-07-21 14:50:49 2025

原创 【Hive】insert into 和 insert overwrite

insert into :以追加的方式插入数据insert overwrite:以覆盖的方式插入数据(先删除hive表中的数据,再插入数据)

2020-07-21 11:03:11 920

原创 【Hive SQL】FAILED: SemanticException [Error 10146]: can not truncate non-managed table

在Hive SQL中,执行truncate table **语句时,报错:FAILED: SemanticException [Error 10146]: can not truncate non-managed table原因是:Hive不能清空外部表(外部表不被hive管理,hive只维护到外部表的引用关系)因此,执行truncate操作,只能对内部表进行。...

2020-07-20 15:49:32 2137

原创 【SQL】Attempt to do update or delete using transaction manager that does not support these operations

在Hive SQL中执行update或者delete语句,报错:FAILED: SemanticException [Error 10294]: Attempt to do update or delete using transaction manager that does not support these operations通过查询资料得知,原因是hive中默认没有开启update和delete操作。如果要执行上述操作,需要自己配置。...

2020-07-20 15:46:32 3361

原创 【Jupyter】打开Jupyter notebook时,网页打不开

这个只需要在Jupyter Notebook文件中设置一下默认浏览器即可,步骤如下:1.打开anaconda prompt2.运行jupyter notebook --generate-config结果:3.复制上述文件路径,使用记事本打开4.找到#c.NotebookApp.browser = ‘’在下方加入import webbrowserwebbrowser.register("firefox",None,webbrowser.GenericBrowser(u"D:\\360Dow

2020-07-20 13:46:53 1989 1

原创 【Python】ValueError: The number of classes has to be greater than one; got 1 class

今天使用Python的sklearn模块训练模型时,报错ValueError: The number of classes has to be greater than one; got 1 class,如下:clf.fit(x,y)->ValueError: The number of classes has to be greater than one; got 1 class最后发现是样本原因,y变量只有一个类型,如下:y.value_counts()->-1 263

2020-07-19 14:24:22 9105 3

原创 【Python】安装docx模块后运行出行ModuleNotFoundError:No module named ‘docx‘

由于公司电脑不能联网,又需要用到docx扩展包,因此没办法直接用pip install在线安装,只能通过下载安装包,然后用u盘考进电脑之后在cmd下安装,刚开始我在官网上下载.gz文件之后,cmd下显示安装成功,然而运行导入模块时,还是报错:ModuleNotFoundError:No module named 'docx'因此,换了种方法,不去官网下载,去下面这个网址:https://www.lfd.uci.edu/~gohlke/pythonlibs/然后找到python_docx-0.8.6

2020-07-16 11:18:07 5068

原创 【Jupyter】更改默认文件存储路径

一般安装完Anaconda之后,打开Jupyter notebook都会发现默认是在C盘里面,而很多时候我们不想把代码放在C盘,而是放在其他自定义的路径里面,本文就是分享修改默认Jupyter notebook路径的方法,按照以下步骤即可:首先,打开Anaconda Prompt,运行命令jupyter notebook --generate-config,然后会输出jupyter_notebook_config.py文件所在路径,复制该路径使用记事本打开jupyter_notebook_config

2020-07-15 10:14:11 1211 1

原创 【中国银联】数据挖掘笔试+三面面经

2020年是非常艰难的一年,尤其是对我们这些湖北人而言,上半年疫情,现在洪水。但是也有记得怀恋的把,毕竟2020年结束了学业生活,从昨天正式入职银联开始,真正成为了一名社畜。各大企业2021年校招已经开始了,我在这里给大家分享一下我2020年中国银联笔试和面试的经历把。投递岗位:志愿一:数据挖掘志愿二:大数据研发笔试首先,笔试的话,题目非常多,题型也很宽泛,我印象中是分了三到四个部分,每个部分都有时间限制,然后整体的话是两个小时,第一部分主要是常规的数值计算、图形推理等等,这部分题量挺大的

2020-07-14 20:15:28 2698

原创 【Python】实现Bagged-pSVM

最近有人找我代写了一个Bagged-pSVM(Bagged-proportion SVM)算法,在实现过程中,感觉首先要理清代码实现的思路,最好能写出步骤,当知道每一步要干嘛,要达到什么样的效果之后,再进行代码编写,会轻松容易很多,这里总结一下Bagged-pSVM算法的流程,码字不易,喜欢请点赞!!!谢谢。(1)根据数据的某个属性R将样本划分到b个包里面(2)计算每个包里面的标签比例Pr(3)repeat for 1 to k 进行bootstrap方法采样,每次得到b个袋子的数据集

2020-07-10 13:45:54 335

原创 【Python】找出最大或最小的N个元素

在Python中,每次取最大或者最小元素比较容易,直接用max或者min函数就行,如下面代码:#Input:a = [1,3,4,3,7,3,9,3,1,2]print('max a is:', max(a))print('min a is:', min(a))#output:max a is: 9min a is: 1但是有时候我们需要输出最大或最小的N个数,这样的话如果只是用max和min的话就需要加一层循环,比较麻烦,这个时候可以考虑用nlargest和nsmallest函数了,如

2020-07-08 15:57:02 2565

原创 【Python】拆分任意长度的可迭代对象

Python作为现在主流的编程语言,有很多使用特性,比如今天要分享的可迭代对象的拆分。1.定长可迭代对象首先,对于固定长度或已知长度的可迭代对象(包括但不限于元组、列表、字符串等),可以通过复制给相同个数的变量即可:#inputtup = ('a', 2)x, y = tupprint('x=', x)print('y=', y)#outputx= ay= 22.任意长度可迭代对象使用"*表达式"即可,如下代码:#inputlistA = list('abcde')x, y

2020-07-06 11:16:43 456

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除