.net for spark笔记1

微软在5月发布了.net for spark版本,让.net大军可以加入大数据分析阵容。由于资料是少之又少,百度了下,基本上没有,也是从零开始,只能自己瞎倒腾,所以自己留下点笔记吧。

HelloSpark。

安装运行环境很简单,百度官网,按照步骤安装即可。

https://docs.microsoft.com/zh-cn/dotnet/spark/tutorials/get-started

新建项目.net core,NuGet安装micrsoft.spark包。然后引用一下Microsoft.Spark.Sql;

按照官网示例新建一个APP;

SparkSession spark = SparkSession.Builder().AppName("xfj_xfr").GetOrCreate();

下面就是导入文件了,分别使用text和CSV尝试下,然后翻了下视频教程,学着样子写了几句。

            DataFrame xfjdf = spark.Read()
                .Option("Delimiter", "|")
                .Option("Encoding", "UTF-8")
                .Schema("xfjbh STRING,djsj STRING,djjgmc STRING,gkxx STRING,cfxfb
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值