python 文本提取地址,如何在python中使用NLTK从原始文本中提取地址？

最新推荐文章于 2024-08-15 10:54:05 发布

张皓and梁媛哲

最新推荐文章于 2024-08-15 10:54:05 发布

阅读量402

点赞数

文章标签： python 文本提取地址

I have this text

'''Hi, Mr. Sam D. Richards lives here, 44 West 22nd Street, New

York, NY 12345. Can you contact him now? If you need any help, call

me on 12345678'''

. How the address part can be extracted from the above text using NLTK? I have tried Stanford NER Tagger, which gives me only New York as Location. How to solve this?

解决方案

Definitely regular expressions :)

Something like

import re

txt = ...

regexp = "[0-9]{1,3} .+, .+, [A-Z]{2} [0-9]{5}"

address = re.findall(regexp, txt)

# address = ['44 West 22nd Street, New York, NY 12345']

Explanation:

[0-9]{1,3}: 1 to 3 digits, the address number

(space): a space between the number and the street name

.+: street name, any character for any number of occurrences

,: a comma and a space before the city

.+: city, any character for any number of occurrences

,: a comma and a space before the state

[A-Z]{2}: exactly 2 uppercase chars from A to Z

[0-9]{5}: 5 digits

re.findall(expr, string) will return an array with all the occurrences found.

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

张皓and梁媛哲

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

[Python从零到壹] 十五.文本挖掘之数据预处理、Jieba工具和文本聚类万字详解

杨秀璋的专栏

08-06

2万+

前一篇文章讲述了分类算法的原理知识级案例，包括决策树、KNN、SVM，并通过详细的分类对比实验和可视化边界分析与大家总结。本文将详细讲解数据预处理、Jieba分词和文本聚类知识，这篇文章可以说是文本挖掘和自然语言处理的入门文章。两万字基础文章，希望对您有所帮助。欢迎大家来到“Python从零到壹”，在这里我将分享约200篇Python系列文章，带大家一起去学习和玩耍，看看Python这个有趣的世界。所有文章都将结合案例、代码和作者的经验讲解，真心想把自己近十年的编程经验分享给大家，希望对您有所帮助，文章中不

chatgpt赋能python：Python从一段话中提取出地址

suimodina的博客

06-01

520

本文由chatgpt生成，文章没有在chatgpt生成的基础上进行任何的修改。以上只是chatgpt能力的冰山一角。作为通用的Aigc大模型，只是展现它原本的实力。对于颠覆工作方式的ChatGPT，应该选择拥抱而不是抗拒，未来属于“会用”AI的人。🧡AI职场汇报智能办公文案写作效率提升教程 🧡专注于AI+职场+办公方向。下图是课程的整体大纲下图是AI职场汇报智能办公文案写作效率提升教程中用到的ai工具。

参与评论您还未登录，请先登录后发表或查看评论

python 从地址获取数据失败_数据提取：使用python提取中文地址描述中的省市区信息...

weixin_39812577的博客

12-12

874

在一次建模比赛中，我手头里的原始数据中有一个“地址描述”地段，如下：这样的地址描述字段过于随意，很难使用，但是看这些字符串的样子似乎又可以提取出其所在的省、市和区。即使只能够提取出区或者市，如果我们有一个省、市和区的归属数据库的话，应该也能够将剩下的信息映射出来。如果自己写的话肯定很麻烦，还要去网上找数据库，于是我做了一个可以复用的python模块，一条命令就可以将上面的“地址描述”字段转换成如下...

【Python】从文本提取含有地址信息的方法（省市县）

最新发布

Meggie35的博客

08-15

684

本文通过构建中国省份和城市以及各镇区的名称字段，梳理成json格式，省会城市以键对值的关系展示，

Python：从文章内提取地址

Cyber的博客

06-22

3378

前言：如何从文章内提取地址？方法有很多种，我这边提一个我的思路。 1、整理一份标准地址库，至少包括以下几列：省、市、镇、街道、路。有人会说整理很难，没错，很难找到成熟的地址库（这种都是能卖Q的），通过政府官网可以获得的数据也仅仅是省、市、镇、街道/居委之类的，如果要整理成一份详尽的，难度很高。以上海为例，我主要是通过百度文库获得了一份相对来说比较全的地址库，但也仅仅是路和区的对应表，无法整理到镇或街道。所以我又在上海统计局官网中找到了居委会和区的对应表，经过多次整理获得一份相对比较准确的清单。 2、

如何使用Python进行地址信息(省/市/区/姓名/电话)提取

湖北太米网络科技有限公司

12-20

2432

地址信息提取是一种技术，它可以帮助我们从文本、图像或其他来源中提取出有关地址的信息。这种技术的背景和目的是为了解决人们在日常生活和工作中经常遇到的地址相关问题。无论是在线购物、导航应用还是物流管理，都需要获取准确的地址信息。地址信息提取的背景源于数字化时代的快速发展。随着互联网的普及和移动设备的智能化，大量的地址信息在各种平台和应用中被广泛使用。然而，由于地址信息的多样性和复杂性，手动提取和处理这些信息变得困难和耗时。因此，我们需要一种自动化的方法来从大量的文本和图像中提取出准确的地址信息。。

python从地址提取省市区实例_一个用于提取简体中文字符串中省，市和区并能够进行映射，检验和简单绘图的python模块...

weixin_39837105的博客

12-20

897

简介一个用于提取简体中文字符串中省，市和区并能够进行映射，检验和简单绘图的python模块。举个例子：["徐汇区虹漕路461号58号楼5楼", "泉州市洛江区万安塘西工业区"]↓ 转换|省 |市 |区 |地址 ||上海市|上海市|徐汇区|虹漕路461号58号楼5楼 ||福建省|泉州市|洛江区|万安塘西工业区 |注：“地址”列代表去除了...

python nltk 7 从文本提取信息

lakomi的博客

07-10

2115

nltk——从文本提取信息Extracting Information from Text（从文本提取信息）1 Information Extraction（信息提取）2 Chunking（词块划分）2.1 Noun Phrase Chunking（名词短语词块划分）2.2 Exploring Text Corpora（用正则表达式进行词块划分）英文文档 http://www.nltk.org/book/ 中文文档 https://www.bookstack.cn/read/nlp-py-2e-zh

文本分类：机器学习和NLP：使用python，scikit-learn和NLTK进行文本分类

02-03

在文本分类中，我们首先需要对原始文本进行预处理，包括分词、去除停用词、词干提取等。`scikit-learn`内置了一些预处理功能，但更复杂的任务可能需要结合使用`nltk`（自然语言工具包）。 NLTK是Python中一个重要的...

python 文本处理保留中英文和标点符号_【NLP】Python NLTK处理原始文本

weixin_39622891的博客

12-03

1275

作者：白宁超2016年11月8日22:45:44摘要：NLTK是由宾夕法尼亚大学计算机和信息科学使用python语言实现的一种自然语言工具包，其收集的大量公开数据集、模型上提供了全面、易用的接口，涵盖了分词、词性标注(Part-Of-Speech tag, POS-tag)、命名实体识别(Named Entity Recognition, NER)、句法分析(Syntactic Parse)等各项...

使用python进行文本预处理和提取特征的实例2.zip

06-22

在提供的实例中，`a.txt`可能是经过预处理的文本数据，而`使用python进行文本预处理和提取特征的实例.pdf`可能包含详细的操作步骤和解释。你可以通过阅读这份PDF文件来深入了解如何在Python中使用这些技术。例如，...

Python第三方安装包-中文地址提取工具

07-16

中文地址提取工具，支持中国三级区划地址（省、市、区）提取和级联映射，支持地址目的地热力图绘制。

python NLTK识别字符串中的人名等，命名实体识别-附件资源

03-05

python NLTK识别字符串中的人名等，命名实体识别-附件资源

jionlp :一款超级强大的Python 神器！轻松提取地址中的省、市、县

m0_59596937的博客

12-02

5898

在日常数据处理中，如果你需要从一个完整的地址中提取出省、市、县三级地名，或者乡镇、村、社区两级详细地名，你可以使用一个第三方库来实现快速解析。在使用之前，你需要先安装这个库。为了更快速地安装，我们可以选择使用国内的软件源（比如豆瓣镜像）进行下载和安装所需的第三方库。当然，你也可以选择其他可靠的国内源进行操作。

Python 提取地址中的省、市、县

weixin_42894969的博客

05-20

735

【代码】Python 提取地址中的省、市、县。

Python-精准提取行政区省市区