自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 用hive语句走过的坑

1.在sqlServer中有isnull 函数,但是hive不支持,只能用case when 字段 is null then 0 else 字段 end as 字段2.hive join 表时 join 的表不能是带括号的,如果必须jion这种条件生成的表,需要根据条件生成临时表错误写法:spark.sql(""""select a.*,b.* from a join (selec...

2019-01-25 16:01:57 1458

原创 机器学习平台数据归一化总结

最近开发数据 归一化的需求,归一化的方法是对将需要处理的列转化为Vector,然后将df放到方法里面去执行,得到新的df如果保留原始类,这个df只需要重新拆分,就可以如果不保留原始列,这个df拆分后,还要进行新的判断,将处理后的列值替代原来的值 1._*  用法:1)变长参数如将vector 追加至原始df的时候已经处理的列   val vec=features2Vec...

2019-01-07 15:04:16 189

原创 机器学习实战----kNN近邻算法问题记录

1.import kNN。报错:only 2 non-keyword arguments accepted原因:group =array([1.0,1.1],[1.0,1.0],[0,0],[0,0.1]) 粗心少写了两个中括号正确写法:group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])2.AttributeError: 'dict' ...

2018-10-10 18:35:31 246

原创 Scala学习笔记(三)

第四章 元组和映射 (快学scala)4.1构造映射A.不可变映射val scores=Map("Alice"->10,"Bob"->3,"Cindy"->8)B.可变映射val score=scala.collection.mutable.Map("Alice"->10,"Bob"->3,"Cindy"->8)C.空的映射,选定映射实现并给定映射参数val score

2018-01-08 14:05:23 264

原创 Scala学习笔记

1.高级for循环和for推导式a.变量for(ib.for循环的循环体以yield开始 ,for循环推导式for(ifor{i1 to 3from=4-ij3 }2.编写一个函数countdown(n:Int),输出n到0的数字def countdown(n:Int) :Unit={for(icountdown(10)思路:首先满足递减,其次要

2018-01-08 09:37:21 829

原创 linux操作

1.查找定时任务的命令  crontab -l 2.编辑定时任务的内容 crontab -e3.删除所有的定时任务 crontab -r 4.python生成的文件指定存储路径def wfile(path,cur): sql = 'select * from parts_num ' cur.execute(sql) rows = cur.fetchall();

2018-01-04 13:11:26 159

原创 Scala学习笔记

第二章 控制结构和函数(快学scala)1.条件表达式1)scala中 if/else表达式有值例: var x=1if (x>0) 1 else -12)scala中有混合类型的表达式if (x>0) "positive" else -1上述表达式的类型是公共超类型 ,Any3)esle部分缺失(每个表达式都应该有某种值)if (x>0) 1

2017-12-22 13:15:39 251

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除