自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

一路风景

为了学习的愉悦而读书，为了做事的满足而工作

阳光洒落你窗前 CSDN认证博客专家 CSDN认证企业博客

码龄16年

45: 原创

18万+: 周排名

143万+: 总排名

51万+: 访问

: 等级

3065: 积分

48: 粉丝

150: 获赞

43: 评论

464: 收藏

私信

关注

热门文章

分类专栏

数据库 1篇
打鸡血 4篇
参与的题目 2篇
扩展 3篇
书目 1篇
scala 16篇
算法 1篇
python 6篇
统计 2篇
数据挖掘 4篇
机器学习 5篇
Linux 4篇
前端 5篇
设计模式 1篇
sbt 2篇
spark 10篇
java 2篇
IDE 2篇
数据分析 2篇
git 1篇
效率 3篇

最新评论

数据挖掘竞赛题目 -- 电影推荐
m0_75052371: 你好，这个电影推荐的项目有具体流程，代码之类的么
数据挖掘竞赛题目 -- 文本分类
阿白_大攀: 你好该数据集测试集没有标签，能不能找到完整数据集
Markdown中公式的写法(Latex)
mileszhaof: 正态分布好像缺个负号
TF-IDF原理及使用
黑眼圈@~@: 我的数据计算出来TF-IDF的数值都是大于1的。用模拟数据大部分都是0<X<1之间的。好烦。实在不明白什么原因。
Spark集群中使用spark-submit提交jar任务包实战经验
lmw0320: 请教下，如果我是用pyspark交互环境下进入yarn模式，可以正常连接hbase获取数据。而如果用spark-submit提交完整的py代码，则会报这个资源不足的提示：WARN scheduler.TaskSchedulerImpl: Initial job has not accepted any resources; check your cluster UI to ensure that workers are registered and have sufficient resources 进入pyspark的时候命令是pyspark --master yarn，我并没有指定相应的worker内存。。同样的，我用spark-submit提交的时候，也是没有指定： spark-submit --master yarn test.py 结果却一直无法获取到数据。RM的UI页面上，我也没有看到相应的任务在执行。。而我强制结束该spark-submit任务时，在Spark的 History Server的提交记录中却看到了该任务。。求指点下，如何解决。。

最新文章

spark

关注

文章平均质量分 80

关注数：文章数：10 文章阅读量：277438 文章收藏量：463

作者: 阳光洒落你窗前

这个作者很懒，什么都没留下…

展开