- 博客(9)
- 收藏
- 关注
原创 大数据技术原理与应用 - 数据处理与分析(自用)
本来还有第二次作业《大数据技术原理与应用 - 分布式数据库HBase》的,这不是,没搞定嘛,弄了很久都是在稀里糊涂的看报错,最后没时间了直接使用了mongodb,mongodb似乎比较友好,很快就启动了,所以hbase的复盘就跳过了,现在第三次作业是对数据进行处理与分析。
2023-12-22 17:25:16
944
原创 大数据技术原理与应用 - hadoop复盘记录(指路)
virtualbox虚拟机,linux的ubuntu硬盘,制作安装u盘,进行双系统安装,然后安装hadoop,再单机配置安装或者伪分布式安装配置。太痛苦了好在环境配好了就不仔细说了,步骤放着,以后如果出意外了再说。
2023-11-18 21:59:48
151
1
原创 python词频统计(word ——> excel,含去重)
不依赖panda的python词频统计,过程比较简单,word文档--->excel表格。主要是我自己用的,顺便帮mac的朋友解决一下电脑txt文档不可编码的问题。
2023-01-18 23:03:22
1075
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人