- 博客(3)
- 收藏
- 关注
原创 [hadoop+spark+python]大数据实战随手笔记
1.提交任务 指令(我配置了spark-submit的环境变量)spark-submit --class org.apache.spark.examples.SparkPi --master spark://192.168.12.233:7077 --executor-memory 10G --total-executor-cores 10 fielname逐条解释如下: (1)–class
2017-08-08 14:44:17 1593
原创 如何用python遍历文件夹下的所有excel文件
大数据处理经常要用到一堆表格,然后需要把数据导入一个list中进行各种算法分析,简单讲一下自己的做法:1.如何读取excel文件网上的版本很多,在xlrd模块基础上,找到一些源码:import xdrlib ,sysimport xlrddef open_excel(file="C:/Users/flyminer/Desktop/新建 Microsoft Excel 工作表.xl
2017-02-27 15:03:50 26009 9
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人