需求场景如下:
现需要将ip地址解析并提取对应的省份信息
感谢xxh的推荐
开源 IP 地址定位库 ip2region
ip2region 是准确率 99.9% 的 IP 地址定位库,0.0x毫秒级查询,数据库文件大小只有 2.7M,提供了 Java、PHP、C、Python、Node.js、Golang 的查询绑定和 Binary、B树、内存三种查询算法
下载地址:
码云
git
引入maven依赖
<dependency>
<groupId>org.lionsoul</groupId>
<artifactId>ip2region</artifactId>
<version>1.7.2</version>
</dependency>
使用ip2region解析地址
将下载好后的ip2region放入项目内(本地测试用)
生产上直接放入hdfs读取即可
编写UDF地址映射函数
//ip to province
// filepath 为ip2region.db路径
object SearcherWrapper extends Serializable {
@