第一次个人编程作业

个人仓库

PSP2.1Personal Software Process Stages预估耗时(分钟)实际耗时(分钟)
· Planning· 计划6030
· Estimate· 估计这个任务需要多少时间1010
· Development· 开发180300
· Analysis· 需求分析 (包括学习新技术)8050
· Design Spec· 生成设计文档9060
· Design Review· 设计复审9060
· Coding Standard· 代码规范 (为目前的开发制定合适的规范)3010
· Design· 具体设计6060
· Coding· 具体编码180180
· Code Review· 代码复审90180
· Test· 测试(自我测试,修改代码,提交修改)120480
· Reporting Standard· 报告6060
· Test Repor· 测试报告6060
· Size Measurement· 计算工作量2020
· Postmortem & Process Improvement Plan· 事后总结, 并提出过程改进计划6060
·· 合计11901620

解题思路

  1. 由于数据只有手机号被混到地址中,所以先切出手机号
  2. 然后切除名字方便解析地址
  3. 地址解析部分用正则表达式
    • 解析用到的正则表达式参考博客[1]

关键代码

String regex="(?<province>[^省]+自治区|.*?省|.*?行政区|.*?市)(?<city>[^市]+自治州|.*?地区|.*?行政单位|.+盟|市辖区|.*?市|.*?县)(?<county>[^县]+县|.+区|.+市|.+旗|.+海域|.+岛)?(?<town>[^区]+区|.+镇)?(?<village>.*)";

输入输出样例

//传入参数
System.out.println(AddressUtil.addressResolutionVersion1("李四,福建省福州13756899511市鼓楼区鼓西街道湖滨路110号湖滨大厦一层"));
System.out.println(AddressUtil.addressResolutionVersion1("张三,福建省福州市闽13599622362侯县上街镇福州大学10#111"));
System.out.println(AddressUtil.addressResolutionVersion1("王五,福建省福州市鼓楼18960221533区123号福州鼓楼医院"));
System.out.println(AddressUtil.addressResolutionVersion1("小美,北京市东15822153326城区交道口东大街1号北京市东城区人民法院"));
System.out.println(AddressUtil.addressResolutionVersion1("小陈,广东省东莞市凤岗13965231525镇凤平路13号"));

//控制台打印结果
{"姓名":"李四","手机":"13756899511","地址":["福建省","福州市","鼓楼区","","鼓西街道湖滨路110号湖滨大厦一层"]}
{"姓名":"张三","手机":"13599622362","地址":["福建省","福州市","闽侯县","上街镇","福州大学10#111"]}
{"姓名":"王五","手机":"18960221533","地址":["福建省","福州市","鼓楼区","","123号福州鼓楼医院"]}
{"姓名":"小美","手机":"15822153326","地址":["北京市","东城区交道口东大街1号北京市","东城区","","人民法院"]}
{"姓名":"小陈","手机":"13965231525","地址":["广东省","东莞市","","凤岗镇","凤平路13号"]}

发现和范例给的要求还是有区别的

分析问题

  • 直辖市和一般城市没有做区别
  • town部分没有匹配街道
  • 没有采用"非贪婪"的表达式

修改后的正则表达式

String regex="(?<province>[^省]+自治区|.*?省|.*?行政区)?(?<city>[^市]+自治州|.*?地区|.*?行政单位|.+盟|市辖区|.*?市|.*?县)?(?<county>[^县]+县|.+?区|.+市|.+旗|.+海域|.+岛)?(?<town>[^区]+区|.+镇|.+街道)?(?<village>.*)";

后来在测试过程中发现测试数据存在省市区关键字缺失的情况,因此不能采用上面的方法。我裂开了

修正后的思路

  1. 手机号,名字的处理方法不变
  2. 加载行政区数据匹配字符串的前3级
    • 从最前的字符遍历的输入字符,与数据中的行政区一一比较
  3. 后面的级别同样通过正则表达式

主要类和方法

类名方法名功能
AreaCodeConvertvoid Convert()读取行政区数据文件加载到内存中
AddressUtilvoid addressResolutionVersion2(String address)解析地址(V1已经废弃)
-String getProvince(String address)解析省级
-String getCity(String address)解析市级
-String getCityWithoutProvince(String address)省缺失解析市级
-String getCounty(String address)解析县级
-String getCountyWithoutProvinceAndCity(String address)省市缺失解析县级
-String getCountyWithoutCity(String address)市缺失解析县级

行政区数据来源

http://www.mca.gov.cn/article/sj/xzqh/2019/201908/201908271607.html

通过观察得到各级地区后缀名为
  • 一级
    • 自治区
    • 特别行政区
  • 二级
    • 自治州
    • 地区
  • 三级
    • 海域
正则表达式
//5级的后2级
(?<town>[^区]+?区|.+?镇|.+?街道|.+?乡)?(?<village>.*)
//7级的后4级
(?<town>[^区]+区|.+?镇|.+?街道|.+?乡)?(?<village1>.+?街|.+?路|.+?巷)?(?<village2>[\d]+?号|[\d]+.?道)?(?<village3>.*)
性能分析图

1795893-20190915203740837-714113563.png
1795893-20190915203743243-1659212518.png
耗时主要花在2部分1个是读取数据耗时,这个基本没得改,另一个是输入的地址和数据中的地址做匹配,尽量优化匹配的效率。

单元测试
测试用例
1!李四,福建鼓楼13756899511鼓西街道湖滨路110号湖滨大厦一层.
1!张三,福州市闽13599622362侯县上街镇福州大学10#111.
1!刘湖,吉林省白山市六道江镇西村药店18694520738.
1!王五,腾冲市满邑社区华园三小区47号18694520738.
1!咸陡隐,江苏省苏州市吴江13184142847区平望镇新业织造有限公司吴江区平望镇双浜村村民委员会.
2!王五,福建省福州市鼓楼18960221533区五一北路123号福州鼓楼医院.
2!小美,北京市东15822153326城区交道口东大街1号北京市东城区人民法院.
2!王五,云南省昭通市水富18694520738县云川路1号.
2!王五,云南省迪庆藏族自治州18694520738香格里拉市.
2!王五,四川省眉山市仁寿18694520738县黑龙滩镇牌坊街.
2!王五,陕西省渭南市韩18694520738城市108国道附近.



{"姓名":"李四","手机":"13756899511","地址":["福建省","","鼓楼区","鼓西街道","湖滨路110号湖滨大厦一层"]}
{"姓名":"张三","手机":"13599622362","地址":["","福州市","闽侯县","上街镇","福州大学10#111"]}
{"姓名":"刘湖","手机":"18694520738","地址":["吉林省","白山市","","六道江镇","西村药店"]}
{"姓名":"王五","手机":"18694520738","地址":["","","腾冲市","满邑社区","华园三小区47号"]}
{"姓名":"咸陡隐","手机":"13184142847","地址":["江苏省","苏州市","吴江区","平望镇","新业织造有限公司吴江区平望镇双浜村村民委员会"]}
{"姓名":"王五","手机":"18960221533","地址":["福建省","福州市","鼓楼区","","五一北路","123号","福州鼓楼医院"]}
{"姓名":"小美","手机":"15822153326","地址":["北京","北京市","东城区","","交道口东大街","1号","北京市东城区人民法院"]}
{"姓名":"王五","手机":"18694520738","地址":["云南省","昭通市","水富市","","云川路","1号",""]}
{"姓名":"王五","手机":"18694520738","地址":["云南省","迪庆藏族自治州","香格里拉市","","","",""]}
{"姓名":"王五","手机":"18694520738","地址":["四川省","眉山市","仁寿县","黑龙滩镇","牌坊街","",""]}
{"姓名":"王五","手机":"18694520738","地址":["陕西省","渭南市","韩城市","","","108国道","附近"]}

测试覆盖率
1795893-20190915203802690-1052059609.png

异常处理
  • 只有手机号没有地址
    • 2!王五,18694520738
  • 没有选择难度
    • 王五,陕西省渭南市韩18694520738城市108国道附近.
小总结和心路历程
  • 第一次了解国家各个行政区原来分这么多种
  • 测试真的给我做吐了
  • 算法无力,代码辣鸡,写个作业都费劲
  • 为什么测试这么麻烦的?
  • 中秋还要上课撸代码太惨了吧??
  • 来个大佬带带我(无能狂怒)

转载于:https://www.cnblogs.com/Aka1i/p/11509595.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值