- 博客(35)
- 资源 (16)
- 收藏
- 关注
原创 一码多址与同义词解决方案
通过每天将业务地址中没有与标准地址成功关联匹配的地址收集起来,经过ETL流程自动化的规范化工作之后,每天把疑似标准地址的地址数据推送给人工确认就行。第二步:业务地址关联标准地址:依赖addresstool工具,利用api接口或者大数据工具,将业务地址与标准地址进行一对一匹配(具体方法可参考我写的其他文章)。业务地址关联标准地址会有3中情况,完全关联、非完全关联和未关联,后2中情况的地址是需要进一步治理的。这个可以将各种不符合要求的地址进行过滤,如无地址主体的地址、目前区域外的地址、脏字符串、乱码等。
2024-06-26 18:29:46
162
原创 统一地址平台架构设计
通过每天将业务地址中没有与标准地址成功关联匹配的地址收集起来,经过ETL流程自动化的规范化工作之后,每天把疑似标准地址的地址数据推送给人工确认就行。第二步:业务地址关联标准地址:依赖addresstool工具,利用api接口或者大数据工具,将业务地址与标准地址进行一对一匹配(具体方法可参考我写的其他文章)。最后,人工作业周期性长,更新一次标准地址库少则一个月,长则半年甚至更长,但是有些地址项目对标准地址库的及时性要求非常高。第五步:地址规范化。第一步:业务地址汇总:大量非标准的地址数据去重。
2024-06-25 15:37:56
422
原创 addresstool解决了地址方面什么问题
综上所述,Addresstool是一个强大的地址处理工具,它通过解决地址数据的标准化、去重、解析、匹配等一系列问题,极大地提高了地址数据的准确性和处理效率,尤其适合电商物流、智慧城市、数据分析、公共服务等领域应用。: 高效地将业务地址数据与标准地址库进行匹配,即使原始数据存在拼写错误、简称、遗漏等问题,也能实现高精度关联,适用于大数据量下的地址关联需求,如亿级地址的全量更新。: 支持地址数据的动态更新,确保关联到的地址信息始终与最新的标准地址库保持一致,解决了因地址信息变化带来的数据挂接问题。
2024-06-25 14:06:16
562
原创 Addresstool与统一地址平台的区别
通过与城市基础设施、人口信息、法人单位等多源数据的融合,统一地址平台能够支持智慧城市、公共服务、应急响应等多种应用场景,促进城市治理的精细化和智能化。它集成了地址标准化、清洗、匹配、解析及地理编码等功能,服务于各类需要精确地址管理的业务场景,如物流配送、城市管理、市场营销分析等。Addresstool通过先进的自然语言处理技术和地理信息系统(GIS)能力,能够将非结构化或半结构化的地址信息转化为统一、规范的标准格式,提高数据质量与利用率,支持用户快速定位目标地址并进行空间分析。
2024-06-25 14:03:40
461
原创 地址中抓取省市区小工具(Java)
4.解析的结果以Map<String,String>返回,例如{ province=北京市, city=北京市, area=海淀区, street=上地十街}3.地址输入不规则地址的解析,例如“浙江省 杭州市 西湖区 塘苗路18号 华星现代产业园”可解析出“浙江省杭州市西湖区塘苗路18号华星现代产业园”2.地址输入不规则地址的解析,例如“辉煌国际3号楼”可解析出“北京市海淀区上地十街辉煌国际3号楼”最近跟天猫对接,也碰到根据地址解析出省市区,下面用Java实现地址解析小工具,以便自己查阅!
2024-06-21 15:31:43
243
原创 java从地址串中解析提取省市区-完美匹配中国所有地址
公司每天需处理大量快递地址,需要将一段字符串进行解析出省、市、区、街道、详细地址、手机、姓名。类似淘宝的地址自动识别,并且需要解析到具体的楼栋单元户室。如果想进一步解析出地址中的道路、楼栋、单元、户室等,可使用地址分词功能。如果想了解更多addresstool用法,欢迎关注我的博客。研究了好久,终于写出了一个Java版的解析算法。速度超级快,地址处理速度达到。下载addresstool。这么简单,就完成啦!
2024-06-21 15:27:17
587
1
原创 Java 正向地址编码(通过地址找坐标)
如何根据地址信息定位到经纬度坐标,地址项目经常会遇到正向/逆向地址编码问题?本文通过addresstool工具包,通过Java实现非标准地址获取经纬度坐标信息。1.整理一份标准地址,包含5级行政区以及小区、道路、门牌号,以及。信息,做好分词并加载到AddressTool。从map中解析出x y坐标数据就可以啦。2.下载addresstool。
2024-06-20 22:07:37
310
1
原创 如何根据地址获取对应的社区
如何根据地址信息定位到所属社区,如果是地址中包含社区描述,可以通过正则匹配等方法提取社区信息,对于一些没有社区描述的地址,如何获取社区信息呢?本文通过addresstool工具包,通过Java实现非标准地址获取社区信息。1.整理一份标准地址,包含5级行政区以及小区、道路、门牌号信息,做好分词并加载到AddressTool。2.下载addresstool。
2024-06-20 14:43:21
238
原创 最简单的LLaMa3中文大模型安装步骤
史上最强开源AI大模型——Meta的LLaMa3一经发布,各项指标全面逼近GPT-4。它提供了8B和70B两个版本,8B版本最低仅需4G显存即可运行,可以说是迄今为止能在本地运行的最强LLM。
2024-05-13 10:39:55
1664
原创 Java GIS:使用地理信息系统和空间数据
我们将讨论地理信息系统 (GIS) 以及如何在 Java 中使用空间数据。 GIS 用于分析、管理和可视化空间数据,可以帮助软件开发人员构建涉及基于位置的服务、地图绘制和空间分析的强大应用程序。
2024-05-10 14:16:08
801
原创 使用socket client源码,调用addresstool地址关联算法
之前使用httpserver方式发布地址关联服务,发现每秒只能处理1800条地址,远远没有达到本地计算每秒1万条的速度,于是改变思路,使用socket发布服务。结合上一篇socketserver案例,可以发布一个完整的服务了。
2024-04-19 13:50:01
215
原创 使用socket server源码,调用addresstool地址关联算法
之前使用httpserver方式发布地址关联服务,发现每秒只能处理1800条地址,远远没有达到本地计算每秒1万条的速度,于是改变思路,使用socket发布服务。经测试,使用socketserver能够达到每秒6000条的处理速度。
2024-04-19 13:47:34
344
原创 postgres存储过程开发-(重载函数、聚合函数)
PostgreSQL数据库,在这里总结了一下存储过程中我用到了的基础知识,常常温习。包括函数重载和聚合函数开发
2024-04-17 11:25:55
119
原创 postgres插件部署+函数开发 - pl/java安装(centos7)
本文介绍PostgreSQL里如何使用pljava扩展支持java编程。以及在pg中如何引用
2024-04-17 11:19:06
418
原创 如何通过业务地址规范化后构建标准地址库-Java版
地名作为最常用的社会公共信息,不仅与人们的日常生活息息相关,而且是政府行政行为、经济建设不可缺少的基础信息资源。在国家信息化体系中,地名是不可或缺的重要节点和桥梁,在信息传递中发挥着重要作用。如图,已成功进行自动化的垃圾地址过滤和正常地址行政区划补充,最终完美生成中文标准地址库。使用中有问题或者建议,欢迎联系邮箱addresstool@163.com。二、业务地址关联标准地址库。
2024-04-02 16:33:33
344
原创 Java实现根据地址智能识别省市区县及详细地址Util
公司每天需处理大量快递地址,需要将一段字符串进行解析出省、市、区、街道、详细地址、手机、姓名。类似淘宝的地址自动识别,并且需要解析到具体的楼栋单元户室。使用中有问题或者建议,欢迎联系邮箱addresstool@163.com。如果想进一步解析出地址中的道路、楼栋、单元、户室等,可使用地址分词功能。如果想了解更多addresstool用法,欢迎关注我的博客。研究了好久,终于写出了一个Java版的解析算法。速度超级快,地址处理速度达到。这么简单,就完成啦!
2024-04-02 13:56:02
792
原创 快递识别api服务发布 部署教程(识别 人名、电话、地址、省市区县等)
一、地址分词将地址字符串中的省市区县、街道、道路、小区、楼栋、单元、户室的等地理要素解析出来。并且对书写不规范的行政区进行修正,如“北京”会修正为“北京市”二、自定义词库加载每个单位都有一套自己的地理词库,为了在使用中让程序使用自己标准地址词库可以在初始化时加载自定义词库。完成自定义词库后,不论是地址分词还是地址关联都是依据自定义词库进行计算,完美匹配各单位自定义地址标准不一致的问题。三、构建中文标准地址库对于一些质量不高的标准化地址,为了节省人工构建标准地址库的成本,可以对低质量的标准地址进行自
2024-04-02 10:56:08
342
原创 大数据环境下 实现每天千万级地址关联 10万/秒
一、地址分词将地址字符串中的省市区县、街道、道路、小区、楼栋、单元、户室的等地理要素解析出来。二、自定义词库加载让程序使用自己标准地址词库可以在初始化时加载自定义词库。三、构建中文标准地址库为了节省人工构建标准地址库的成本,可以对低质量的地址分析、修正和建库,提高标准地址质量。四、普通地址关联标准地址算法同一个地址会有多种不同的书写方法,将各种不同的写法统一到一条标准地址中。
2024-04-01 19:47:04
621
原创 收件地址解析成 姓名+电话+省+市+区+道路+楼栋+户室 Java版
一、地址分词将地址字符串中的省市区县、街道、道路、小区、楼栋、单元、户室的等地理要素解析出来。二、自定义词库加载让程序使用自己标准地址词库可以在初始化时加载自定义词库。三、构建中文标准地址库为了节省人工构建标准地址库的成本,可以对低质量的地址分析、修正和建库,提高标准地址质量。四、普通地址关联标准地址算法同一个地址会有多种不同的书写方法,将各种不同的写法统一到一条标准地址中。五、快递地址自动解析省市区县以及名称电话和邮编等自动化识别文本中的地址、人名、电话、邮编等。六、自动补充行政区划
2024-03-29 13:23:13
617
10
原创 中文地址智能匹配算法-Java版
在政务系统中有许多需要将业务地址关联到标准地址的场景,addresstool致力于解决地址关联匹配算法中的速度和准确性问题。经实测,addresstool的地址关联速度在5000/秒-20000/秒之间(取决于业务地址质量),关联匹配正确率达到98%
2024-03-29 09:58:43
708
原创 快递地址 自动识别地址省市区、手机号、姓名,地址自动补全省市区 -java算法
一、地址分词将地址字符串中的省市区县、街道、道路、小区、楼栋、单元、户室的等地理要素解析出来。二、自定义词库加载让程序使用自己标准地址词库可以在初始化时加载自定义词库。三、构建中文标准地址库为了节省人工构建标准地址库的成本,可以对低质量的地址分析、修正和建库,提高标准地址质量。四、普通地址关联标准地址算法同一个地址会有多种不同的书写方法,将各种不同的写法统一到一条标准地址中。五、快递地址自动解析省市区县以及名称电话和邮编等自动化识别文本中的地址、人名、电话、邮编等。六、自动补充行政区划
2024-03-28 19:36:32
1741
1
原创 java 从字符串中提取省、市、区、镇、乡、社区、道路、门牌号、楼栋、单元等
处理中文地址的分词和匹配,采用NLP分词算法进行中文地址分词 ,能够提取字符串中的省市区县乡以及街道道路等。在中文地址分词基础上对垃圾地址进行识别,过滤,标记等。根据杂乱的业务地址自动化生成标准中文地址库,并支持随机业务地址关联到标准地址操作,实测速度达到25000条/每秒
2024-03-27 06:00:00
654
原创 如何自动化构建中文标准地址库-Java版(2万/秒)
处理中文地址的分词和匹配,采用NLP分词算法进行中文地址分词 ,在中文地址分词基础上对垃圾地址进行识别,过滤,标记等。根据杂乱的业务地址自动化生成标准中文地址库,并支持随机业务地址关联到标准地址操作,实测速度达到25000条/每秒
2024-03-26 14:31:12
414
原创 如何构建中文地址库-java版
研究与解决智慧城市背景下的地名标准化、数字化问题,尽快建立高起点、高质量、高效率的城市标准地名地址信息数据库,最终实现地名数字化管理,有利于提高地名信息资源的利用率和社会经济效益,为知识经济时代创造新的增长点。注意:由于地址数据保密级别高,生成**.addr文件和加载文件都依赖license授权码,同一个授权码生成的文件需要相同的授权码才能解析加载(不同授权码之间生成的**.addr文件无法相互解析)通过**.addr加载标准地址数据。将标准地址生成**.addr文件。将标准地址生成**.addr文件。
2024-03-26 13:24:16
172
原创 地址标准化算法
用于中文地址分词,与标准地址挂接,进行地址标准化。用于建立社会管理要素统一地址标准规范,整合公安、民政、自然资源与规划等现有地址资源,协助建立贯穿市、区、街道、社区、网格、建筑物、房屋(户室)等多层结构的空间地理与统一地址应用与服务平台。
2024-03-21 10:36:48
213
原创 Java转换坐标系,GPS(WGS84)大地200(CGCS200)、百度(BD-09)、高德(GCJ-02)互转,一文搞懂坐标系、坐标转换
WG-S84: 地理坐标系统,GPS仪器记录的经纬度信息,Google Earth采用,Google Map中国范围外使用,高德地图中国范围外使用。GCJ-02: 投影坐标系统,火星坐标系,中国国家测绘局制定的坐标系统,由WGS-84加密后的坐标。Google中国和搜搜地图,arcgis地图,高德地图 BD-09: 投影坐标系统,百度坐标,GCJ-02加密后的坐标系,只适用于百度地图。必须至少使用GCJ-02坐标系,或者使用在GCJ-02加密后再进行加密的坐标系,如百度坐标系)
2023-10-10 14:17:40
2660
1
addresstool工具授权文件,有效期3年,适用于中文地址分词AddressCut方法
2024-05-15
快递地址解析 地址分词,算法jar包
2024-05-10
地址分词、地址关联、运单识别
2024-04-12
武汉市完成分词后的标准地址,包含省市区、道路、门牌、小区名称、gps坐标等,addresstool工具可读
2024-04-12
北京市各类poi数据,包括poi名称、道路、经纬度坐标、poi类型等
2024-04-09
AddressTool-1.13.jar
2024-04-03
addresstool-1.1.3.zip
2024-03-26
上海市所有的小区名称,包括行政区、名称以及房价
2023-10-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人