如何识别网页中的地址信息
1、可以考虑使用状态机的识别办法。下表是一个状态转换表。可以识别大多数的地址。如果要识别更多的情况,可以丰富这个表格。
2、使用状态机可以找到一段话中地址的结束位置。
根据状态图的方法判断路的信息是否是正确。
市|县|区|镇|环路|段|路|街|道|巷|胡同|号|楼
1市 | 3,4,5,6,7,8,9,10,11,12 |
2县 | 3,4 |
3区 | 4,5,7,8,9,10,11,12,14 |
4镇 | 7,8,10,11,12 |
5环路 | 6 |
6段 | 7,13,8,21 |
7路 | 13,14,6,10,21 |
8街 | 13,14,21 |
9街道 | 13,14 |
10巷 | 13,14 |
11胡同 | 13,14 |