(一)转换成parquet文件

在这里插入图片描述

1.需求

在这里插入图片描述

2.需求

统计各省市的数据量分布

在这里插入图片描述
在这里插入图片描述

地域分布报表

在这里插入图片描述
在这里插入图片描述

需求 媒体

在这里插入图片描述
其中appname可能为空,appid不为空,另外有一个表 存储app的具体信息

如果使用广播变量,把app表广播出去,但是又一个缺点  就是广播出去的表就不能再更改了
所以这里采取的是使用 redis存储,可以每天实时更新
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
您可以使用Apache POI和Apache Parquet库来将Java中的Excel文件转换为Parquet文件。首先,您需要使用POI库读取Excel文件中的数据,然后将其转换为Parquet格式并写入Parquet文件。您可以使用ParquetWriter类来写入Parquet文件。以下是一个示例代码片段: ``` // 导入所需的库 import org.apache.poi.ss.usermodel.*; import org.apache.poi.xssf.usermodel.XSSFWorkbook; import org.apache.parquet.hadoop.ParquetWriter; import org.apache.parquet.hadoop.metadata.CompressionCodecName; import org.apache.parquet.schema.MessageType; import org.apache.parquet.schema.MessageTypeParser; import org.apache.parquet.schema.Types; // 读取Excel文件 Workbook workbook = new XSSFWorkbook(new FileInputStream("input.xlsx")); Sheet sheet = workbook.getSheetAt(); // 定义Parquet文件的模式 MessageType schema = MessageTypeParser.parseMessageType("message ExcelData {\n" + " required binary column1;\n" + " required binary column2;\n" + "}"); // 创建Parquet文件的写入器 ParquetWriter<GenericRecord> writer = AvroParquetWriter.<GenericRecord>builder(new Path("output.parquet")) .withSchema(schema) .withCompressionCodec(CompressionCodecName.SNAPPY) .withDataModel(GenericData.get()) .build(); // 将Excel数据转换为Parquet格式并写入Parquet文件 for (Row row : sheet) { GenericRecord record = new GenericData.Record(schema); record.put("column1", row.getCell().getStringCellValue()); record.put("column2", row.getCell(1).getStringCellValue()); writer.write(record); } // 关闭写入器 writer.close(); ``` 请注意,您需要将上述代码中的输入和输出文件路径替换为您自己的路径。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值