自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

WxyangID的博客

11月 10月 07月 06月 05月 04月 03月 01月

原创 spark算子join操作

一旦分布式数据集（distData）被创建好，它们将可以被并行操作。例如，我们可以调用distData.reduce(lambda a, b: a + b)来将数组的元素相加。我们会在后续的分布式数据集运算中进一步描述。并行集合的一个重要参数是slices，表示数据集切分的份数。Spark将会在集群上为每一份数据起一个任务。典型地，你可以在集群的每个CPU上分布2-4个slices. 一般来说，...

2018-07-31 19:21:26 7204

转载 sql 优化方式

在sql查询中为了提高查询效率，我们常常会采取一些措施对查询语句进行sql优化，下面总结的一些方法，有需要的可以参考参考。 1.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where 子句中对字段进行 null 值判断，否则将导致引擎放弃使用索引而进行全表扫描，如： select id from t where...

2018-07-22 00:02:17 991 1

JRE-8U151-macosx-x64.dmg

mac系统的jre-8u151-macosx-x64.dmg，也可以从oracle官网下载，这个可以用，分享给大家

2017-12-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

WxyangID CSDN认证博客专家 CSDN认证企业博客

码龄8年

IP 属地：北京市

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

119: 原创

7万+: 周排名

148万+: 总排名

49万+: 访问

: 等级

5219: 积分

34: 粉丝

99: 获赞

32: 评论

417: 收藏

私信

关注

热门文章

分类专栏

IDEA 4篇
Ubuntu16.04 27篇
Python 51篇
Java 7篇
数据库 7篇
MySQL 2篇
mongoDB
操作系统 1篇
算法数据结构 2篇
机器学习 22篇
常用 1篇
c语言 3篇
myeclipse 4篇
pycharm 2篇
xshell 2篇
Linux 4篇
计算机网络 1篇
hivesql
spark 1篇
leetcode 2篇

最新评论

import cv2出现“ImportError: DLL load failed: 找不到指定的模块”
yzlcpgl: 博主，你拯救了我查了一天的坑给解决了
pip install opencv问题ImportError: OpenCV loader: missing configuration file: ['config-3.6.py', 'conf
凌晨三点lili: 命令输入在哪啊大哥
GridSearchCV参数
wangyuyang08: 您好，楼主。如果数据中有类型（标签）数据，怎样去保证网格搜索交叉验证GridsearchCV每一折中不同类型数据比例和原始数据比例保持一致，谢谢。
GridSearchCV参数
wangyuyang08: 你好，因为原始数据带有标签，譬如说4种草地植被类型。这样在GridsearchCV的时候怎么保证每一折数据比例与原始数据一致。在GridsearchCV这一步怎样去设置 kflod = StratifiedKFold(n_splits=10, shuffle = True,random_state=7)#将训练/测试数据集划分10个互斥子集，
使用Git往github上提交代码时出现[packet_write_wait connection to xx.xx.xx.xx Broken pipe]错误的解决办法：
SiegfriedG: 果然有用

最新文章

提示

确定要删除当前文章？

取消删除