- 博客(2)
- 资源 (1)
- 收藏
- 关注
原创 《数据科学概论》Python上机练习
备注:仅用于检验python语言的学习效果,面向数据分析和处理,做编程练习。整个数据科学概论的教学大纲(包括其他上机练习),请参考https://blog.csdn.net/xiongpai1971/article/details/89364071Python与机器学习初步1,(决策树-易)通过信息增益,进行决策树第一个特征选择,请参考5.2.1。 备注:使用课...
2019-03-02 22:21:24 904
原创 理解大数据的三个V实验序列
1,Volume实验 要求:在助教协助下,利用云平台进行Word Count MapReduce实验(或者Sort/Inverted Index等)。目的:对大数据的分布式处理有更加直观认识。提示:助教撰写实验指导。1,助教准备一个大文本文件1GB。2,启动Hadoop,把文件上传HDFS,运行Word Count MapReduce程序,打印结果并且分析,获得Top...
2019-03-02 20:00:43 1075
词项向量化的各种技术
2019-04-18
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人