对应视频40、41
课件3.3
启动pyspark:
pyspark --master spark://hadoop101:7077 --executor-memory 950m --executor-cores 2
读取hdfs上的文件创建一个dataframe
>>>df = spark.read.csv('/sql/customers.csv',header=True)
1、查看行数
2、查看数据的格式
>>> df.dtypes
对应视频40、41
课件3.3
启动pyspark:
pyspark --master spark://hadoop101:7077 --executor-memory 950m --executor-cores 2
读取hdfs上的文件创建一个dataframe
>>>df = spark.read.csv('/sql/customers.csv',header=True)
>>> df.dtypes