dfh1 = sqlContext.read.csv(myfeature_path + 'shixin_com_prob_hydm.csv', header=False)
dfh1.show()
dfh1.createOrReplaceTempView('base')
print(dfh1.count())
res = sqlContext.sql(''' select * from base where _c0 != 'company_name' ''')
hdfs保存csv文件,里面含有多行列标题,验证需要用header=False,否则,显示不了;
最新推荐文章于 2022-10-25 16:22:22 发布