- 博客(25)
- 资源 (6)
- 收藏
- 关注
原创 使用socket client源码,调用addresstool地址关联算法
之前使用httpserver方式发布地址关联服务,发现每秒只能处理1800条地址,远远没有达到本地计算每秒1万条的速度,于是改变思路,使用socket发布服务。结合上一篇socketserver案例,可以发布一个完整的服务了。
2024-04-19 13:50:01 178
原创 使用socket server源码,调用addresstool地址关联算法
之前使用httpserver方式发布地址关联服务,发现每秒只能处理1800条地址,远远没有达到本地计算每秒1万条的速度,于是改变思路,使用socket发布服务。经测试,使用socketserver能够达到每秒6000条的处理速度。
2024-04-19 13:47:34 312
原创 postgres存储过程开发-(重载函数、聚合函数)
PostgreSQL数据库,在这里总结了一下存储过程中我用到了的基础知识,常常温习。包括函数重载和聚合函数开发
2024-04-17 11:25:55 94
原创 postgres插件部署+函数开发 - pl/java安装(centos7)
本文介绍PostgreSQL里如何使用pljava扩展支持java编程。以及在pg中如何引用
2024-04-17 11:19:06 381
原创 如何通过业务地址规范化后构建标准地址库-Java版
地名作为最常用的社会公共信息,不仅与人们的日常生活息息相关,而且是政府行政行为、经济建设不可缺少的基础信息资源。在国家信息化体系中,地名是不可或缺的重要节点和桥梁,在信息传递中发挥着重要作用。如图,已成功进行自动化的垃圾地址过滤和正常地址行政区划补充,最终完美生成中文标准地址库。使用中有问题或者建议,欢迎联系邮箱[email protected]。二、业务地址关联标准地址库。
2024-04-02 16:33:33 263
原创 Java实现根据地址智能识别省市区县及详细地址Util
公司每天需处理大量快递地址,需要将一段字符串进行解析出省、市、区、街道、详细地址、手机、姓名。类似淘宝的地址自动识别,并且需要解析到具体的楼栋单元户室。使用中有问题或者建议,欢迎联系邮箱[email protected]。如果想进一步解析出地址中的道路、楼栋、单元、户室等,可使用地址分词功能。如果想了解更多addresstool用法,欢迎关注我的博客。研究了好久,终于写出了一个Java版的解析算法。速度超级快,地址处理速度达到。这么简单,就完成啦!
2024-04-02 13:56:02 291
原创 快递识别api服务发布 部署教程(识别 人名、电话、地址、省市区县等)
一、地址分词将地址字符串中的省市区县、街道、道路、小区、楼栋、单元、户室的等地理要素解析出来。并且对书写不规范的行政区进行修正,如“北京”会修正为“北京市”二、自定义词库加载每个单位都有一套自己的地理词库,为了在使用中让程序使用自己标准地址词库可以在初始化时加载自定义词库。完成自定义词库后,不论是地址分词还是地址关联都是依据自定义词库进行计算,完美匹配各单位自定义地址标准不一致的问题。三、构建中文标准地址库对于一些质量不高的标准化地址,为了节省人工构建标准地址库的成本,可以对低质量的标准地址进行自
2024-04-02 10:56:08 230
原创 大数据环境下 实现每天千万级地址关联 10万/秒
一、地址分词将地址字符串中的省市区县、街道、道路、小区、楼栋、单元、户室的等地理要素解析出来。二、自定义词库加载让程序使用自己标准地址词库可以在初始化时加载自定义词库。三、构建中文标准地址库为了节省人工构建标准地址库的成本,可以对低质量的地址分析、修正和建库,提高标准地址质量。四、普通地址关联标准地址算法同一个地址会有多种不同的书写方法,将各种不同的写法统一到一条标准地址中。
2024-04-01 19:47:04 583
原创 收件地址解析成 姓名+电话+省+市+区+道路+楼栋+户室 Java版
一、地址分词将地址字符串中的省市区县、街道、道路、小区、楼栋、单元、户室的等地理要素解析出来。二、自定义词库加载让程序使用自己标准地址词库可以在初始化时加载自定义词库。三、构建中文标准地址库为了节省人工构建标准地址库的成本,可以对低质量的地址分析、修正和建库,提高标准地址质量。四、普通地址关联标准地址算法同一个地址会有多种不同的书写方法,将各种不同的写法统一到一条标准地址中。五、快递地址自动解析省市区县以及名称电话和邮编等自动化识别文本中的地址、人名、电话、邮编等。六、自动补充行政区划
2024-03-29 13:23:13 337 8
原创 中文地址智能匹配算法-Java版
在政务系统中有许多需要将业务地址关联到标准地址的场景,addresstool致力于解决地址关联匹配算法中的速度和准确性问题。经实测,addresstool的地址关联速度在5000/秒-20000/秒之间(取决于业务地址质量),关联匹配正确率达到98%
2024-03-29 09:58:43 527
原创 快递地址 自动识别地址省市区、手机号、姓名,地址自动补全省市区 -java算法
一、地址分词将地址字符串中的省市区县、街道、道路、小区、楼栋、单元、户室的等地理要素解析出来。二、自定义词库加载让程序使用自己标准地址词库可以在初始化时加载自定义词库。三、构建中文标准地址库为了节省人工构建标准地址库的成本,可以对低质量的地址分析、修正和建库,提高标准地址质量。四、普通地址关联标准地址算法同一个地址会有多种不同的书写方法,将各种不同的写法统一到一条标准地址中。五、快递地址自动解析省市区县以及名称电话和邮编等自动化识别文本中的地址、人名、电话、邮编等。六、自动补充行政区划
2024-03-28 19:36:32 558
原创 java 从字符串中提取省、市、区、镇、乡、社区、道路、门牌号、楼栋、单元等
处理中文地址的分词和匹配,采用NLP分词算法进行中文地址分词 ,能够提取字符串中的省市区县乡以及街道道路等。在中文地址分词基础上对垃圾地址进行识别,过滤,标记等。根据杂乱的业务地址自动化生成标准中文地址库,并支持随机业务地址关联到标准地址操作,实测速度达到25000条/每秒
2024-03-27 06:00:00 209
原创 如何自动化构建中文标准地址库-Java版(2万/秒)
处理中文地址的分词和匹配,采用NLP分词算法进行中文地址分词 ,在中文地址分词基础上对垃圾地址进行识别,过滤,标记等。根据杂乱的业务地址自动化生成标准中文地址库,并支持随机业务地址关联到标准地址操作,实测速度达到25000条/每秒
2024-03-26 14:31:12 333
原创 如何构建中文地址库-java版
研究与解决智慧城市背景下的地名标准化、数字化问题,尽快建立高起点、高质量、高效率的城市标准地名地址信息数据库,最终实现地名数字化管理,有利于提高地名信息资源的利用率和社会经济效益,为知识经济时代创造新的增长点。注意:由于地址数据保密级别高,生成**.addr文件和加载文件都依赖license授权码,同一个授权码生成的文件需要相同的授权码才能解析加载(不同授权码之间生成的**.addr文件无法相互解析)通过**.addr加载标准地址数据。将标准地址生成**.addr文件。将标准地址生成**.addr文件。
2024-03-26 13:24:16 159
原创 地址标准化算法
用于中文地址分词,与标准地址挂接,进行地址标准化。用于建立社会管理要素统一地址标准规范,整合公安、民政、自然资源与规划等现有地址资源,协助建立贯穿市、区、街道、社区、网格、建筑物、房屋(户室)等多层结构的空间地理与统一地址应用与服务平台。
2024-03-21 10:36:48 124
原创 Java转换坐标系,GPS(WGS84)大地200(CGCS200)、百度(BD-09)、高德(GCJ-02)互转,一文搞懂坐标系、坐标转换
WG-S84: 地理坐标系统,GPS仪器记录的经纬度信息,Google Earth采用,Google Map中国范围外使用,高德地图中国范围外使用。GCJ-02: 投影坐标系统,火星坐标系,中国国家测绘局制定的坐标系统,由WGS-84加密后的坐标。Google中国和搜搜地图,arcgis地图,高德地图 BD-09: 投影坐标系统,百度坐标,GCJ-02加密后的坐标系,只适用于百度地图。必须至少使用GCJ-02坐标系,或者使用在GCJ-02加密后再进行加密的坐标系,如百度坐标系)
2023-10-10 14:17:40 1898 1
地址分词、地址关联、运单识别
2024-04-12
武汉市完成分词后的标准地址,包含省市区、道路、门牌、小区名称、gps坐标等,addresstool工具可读
2024-04-12
北京市各类poi数据,包括poi名称、道路、经纬度坐标、poi类型等
2024-04-09
AddressTool-1.1.jar
2024-04-03
addresstool-1.1.2.zip
2024-03-26
上海市所有的小区名称,包括行政区、名称以及房价
2023-10-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人