6-25(1)

一、本次实习总任务:

  (1)会应用数据分析基本方法

    包括:聚类kmeans算法,分类线性判别分析算法LDA和logistics regression算法,回归分析最小二乘法、主成分分析(回归)、偏最小二乘算法

  (2)会应用大数据服务的方法

    技术点:

      1)在Linux虚拟机上建立Hadoop集群

      2)在Linux虚拟机上搭建Spark开发环境的方法

      3)在linux虚拟上的Spark环境下应用数据分析算法,并将结果反馈到web应用软件中

      4)一个信息系统中服务器端数据服务的组织过程和相关技术(不懂)

二、借助工具

  (1)13级论文+程序(给予spark的协同过滤推荐算法)

  (2)网上教程

三、自我计划

  能把论文内容实现了这些学习目标就掌握了,所以工作要围绕论文做

 

转载于:https://www.cnblogs.com/Neavotre/p/9222767.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值