- 博客(3)
- 收藏
- 关注
原创 搭建hadoop+Hbase,JAVA API操作HBase
搭建hadoop+Hbase,JAVA API操作HBase一、实验背景 了解HBase的存储形式https://blog.csdn.net/worldchinalee/article/details/82692185 HBase基于列的而不是基于行的模式。 Hbase 全称为 Hadoop Database,即 Hbase 是 Hadoop 的数据库,是一个分布式的存储系统。Hbase 利用 Hadoop 的 HDFS 作为其文件存储系统,利用 Hadoop 的 MapRedu
2020-07-04 00:58:43 472
原创 爬取豆瓣https://movie.douban.com/top250,翻页,图片
如何爬取豆瓣https://movie.douban.com/top250操作步骤加思考:①所需要的模块import requestsfrom lxml import etree# pandas用来保存为csv的import pandas as pd# os所需的文件夹的下载import os# 获取其页面代码②获取页面代码,因为豆瓣有反爬虫,加上headersdef ge...
2020-03-11 15:57:27 5798 5
原创 机器学习-决策树实现可视化
决策树代码实现的可视化要安装库sklearn,pandas,graphviz在cmd中安装pip install sklearnpip install pandaspip install graphviz下载graphviz,装环境变量下载网址:在下载的时候有点慢https://graphviz.gitlab.io/_pages/Download/Download_window...
2020-03-11 11:15:20 770
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人