- 博客(4)
- 收藏
- 关注
原创 美团电话面试总结
1.数据库优化MySQL数据库优化的八种方式(经典必看)http://www.cnblogs.com/zhyunfe/p/6209074.html2.hashtable与hashmap区别3、spring MVC流程4、mongodb与oracle区别5、常用数据结构,arraylist与linkedlist区别6、分布式锁,乐观锁7、事务管理,sess
2017-09-12 09:36:47 2315
原创 初学Spark的一些笔记
1、为什么推荐用scala①性能开销小②最新版本和最好性能③有助于更了解sparkscala可以在同一个环境中完成所有数据处理和分析,不用考虑数据本身在何处存放和在何处处理。2、spark编程模型在输入数据集上定义一组转换调用action(存储)运行本地计算(执行)3、记录关联问题
2016-12-08 13:38:32 319
原创 数据挖掘导论 笔记
引论1.1为什么进行数据挖掘?信息时代的来临不贴切,我们的时代其实是数据时代,还没有真正步入信息时代,现在数据爆炸增长,需要将数据转化为知识。1.2什么是数据挖掘?即KDD,数据中的数据发现知识发现的迭代步骤为:1)数据清理2)数据集成3)数据选择4)数据变换5)数据挖掘6)模式评估7)知识表示广义的数据挖掘可表述为:从大量数据中挖掘有趣模式和知识的过程。1.3可以挖掘
2016-11-30 22:15:30 1194
原创 第三届全国高校云计算应用创新大赛---KDDCUP1999数据集
今年报名参加了第三届全国高校云计算应用创新大赛,报名了技能组,下载了技能组的第一题《基于Spark的大数据聚类算法》,其中使用的数据集为KDDCUP1999,根据自己在网上搜集的一些信息,总结如下。1.数据来源:1998 年林肯实验室建立了模拟美国空军局域网的一个网络环境,收集了9 周时间的网络链接和系统审计数据,仿真各种用户类型、各种不同的网络流量和攻击手段,使它就像一个真实的网络环境。
2016-11-30 20:46:34 2407
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人