法克大米-CSDN博客

原创 [hadoop+spark+python]大数据实战随手笔记

1.提交任务指令(我配置了spark-submit的环境变量)spark-submit --class org.apache.spark.examples.SparkPi --master spark://192.168.12.233:7077 --executor-memory 10G --total-executor-cores 10 fielname逐条解释如下: (1)–class

2017-08-08 14:44:17 1593

原创 Linux踩雷笔记

开发过程中遇到的linux问题记录

2017-08-08 09:13:10 411

原创如何用python遍历文件夹下的所有excel文件

大数据处理经常要用到一堆表格，然后需要把数据导入一个list中进行各种算法分析，简单讲一下自己的做法：1.如何读取excel文件网上的版本很多，在xlrd模块基础上，找到一些源码：import xdrlib ,sysimport xlrddef open_excel(file="C:/Users/flyminer/Desktop/新建 Microsoft Excel 工作表.xl

2017-02-27 15:03:50 26009 9

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 [hadoop+spark+python]大数据实战随手笔记

原创 Linux踩雷笔记

原创 如何用python遍历文件夹下的所有excel文件

空空如也

空空如也

原创如何用python遍历文件夹下的所有excel文件