- 博客(11)
- 收藏
- 关注
原创 java导出Excel表格
表格的通用导出方法downloadMaterialExcel/*** 简单表格的通用导出方法* @param workbook 文档对象* @param sheetName 工作簿名称* @param title 文档标题* @param list 文档数据* @param header 文档标题* @param field 标题对应内容字段* @param orderNumber 是否显示序号*///判断是否加入序号header.add(0,"序号");
2023-03-11 16:29:11 636
原创 scrapy爬虫框架的使用
找到要爬取所有信息的父标签,并且父标签是唯一的(可以右键,查看网页源代码,Ctrl+f搜索该标签属性是否只有一个)把40到43的注释取消(原本它是被注释的),并在里面添加请求头,这时候项目创建好了,我们需要修改settings.py文件。选择Terminal,创建scrapy项目(通过分析,我们所要爬取的信息在ul的li里面。把65到67的注释取消(原本它是被注释的)修改start_urls为所要爬取的地址。我们利用Xpath获取所有的li标签。首先咱们先下载scrapy包。遍历il,定位要爬取的内容。..
2022-08-01 02:34:15 102
原创 配置Hive
在配置mysql数据库和hadoop伪分布式的前提下配置Hive1.解压apache-hive-2.1.0-bin.tar.gz文件tar -xzvf apache-hive-2.1.0-bin.tar.gz2.重命名为hivemv apache-hive-2.1.0-bin hive3.配置/etc/profile文件,添加一下内容4.刷新文件source /etc/profile5.进入hive文件的conf目录下cd hive/conf5.复制hive-env.sh.template文件cp h
2022-07-07 22:07:20 450
原创 hadoop伪分布式搭建
一,配置jdk1.解压jdk-8u112-linux-x64.tar.gz文件tar -xzvf jdk-8u112-linux-x64.tar.gz2.重命名jdk-8u112-linux-x64.tar.gz 成jdkmv jdk1.8.0_112 jdk3.配置profile文件vim /etc/profile添加:export JAVA_HOME=/opt/soft/jdkexport PATH=$PATH:$JAVA_HOME/bin4.刷新profile文件source /etc/profil
2022-07-07 19:10:50 216
原创 hadoop完全分布式搭建
1、【配置三台机器的主机名】vim /etc/hostnamereboot2、【在主机器上生成密匙】ssh-keygen -t rsa配置三台机器免密登录ssh-copy-id -i root@localhostssh-copy-id -i root@机器二ssh-copy-id -i root@机器三3、【配置jdk和hadoop】export JAVA_HOME=/opt/soft/jdkexport PATH=$PATH:$JAVA_HOME/binexport HA
2022-05-13 22:45:10 424 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人