- 博客(2)
- 收藏
- 关注
原创 解决pyspark问题:在spark中使用集群未安装的python第三方库
解决pyspark问题:在集群中使用cluster模式,引入python复杂第三方库问题:在工作中,使用spark-summit部署python第三方库保存的xgboost模型(单机库模型,非xgboost-4j),运行出错,ImportError: No module name xxxx。使用第三方库有:pandas、numpy、xgboost。因为没有集群权限,模型安装流程复杂,尝试自己探索解决,看了国内外很多帖子,大致有3种情况:单一文件 自建模块 或python简单第三方库(不含.so文.
2021-01-05 22:28:12 4702
原创 解决python问题:xlsx转csv每行出现一行空行
with open(subfile_path,'w', newline='',encoding='utf-8') as f:write = csv.writer(f)for row_num in range(sheet.nrows):row_value = sheet.row_values(row_num) write.writerow(row...
2018-03-28 19:33:14 1424
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人