地址分级服务总结

 我的工作内容就是处理poi的一个属性-地址,其中包含很多有价值的信息,包括行政区、道路、门牌、poi等,但这部分信息的提取需要一定的专业技能,所以公司之前这部分信息的处理基本是空白,当然这也是我的价值所在,虽然面小点儿,哈哈!
先看下实例效果:
	地址数据:双峪路5号综合楼奥新天地商贸中心9楼(近双峪环岛)
    分级数据:双峪路/R1 5号/H1 综合楼/P1 奥新天地商贸中心/P2 9楼/O1 近双峪环岛/L1
    ====山东省青岛市城阳区城阳村社区致远民生小区1号楼
	===>山东省/S1 青岛市/C1 城阳区/D1 城阳村社区/P1 致远民生小区/P3 1号楼/B1
    注:词性R等含义见附录一
产品评测结果

评测说明
数据说明目前地址分级数据中总量有3578636条(取自完全正确POI的地址)
【注】此处的数值只取了有效、运营未处理过的数据,实际数据库记录比这多;
服务对此做地址分级处理,对处理结果给出四中准确度的标识,从高到低依次是1、2、3、4,所以对此做了分层抽样,以客观评估数据的准确性;结果见如下表:
数据统计表
准确度为4的数据可能存在偏差,因为样本量太小造成的,但是从总体占比来看无太大影响;
可用性说明
按照目前的结果看地址分级服务完全可用,并且可用性比较高;
至于应用场景大家可以发挥想象力,我们主要是在垃圾地址过滤,地址规范化等方面应用。
同类产品gd的准确率不会高于90%,与之相比,我们现在产品准确度高出很多,当然这也跟应用场景有关,gd后续采用大数据挖掘的方式完善了部分处理效果,这也导致gd这一产品只能作为一个处理步骤,无法独立对外提供服务;我们的产品完全可以独立对外提供可靠的地址处理服务。至于gd没有继续改进效果的原因主要是内部逻辑非常复杂,经过多人之手,改造几乎不可能,也没人愿意去踩这个坑,又有别的工具可以完善效果,大家也就没有优化的动力了。
这里面的难点就是字典数据的优化处理,此过程相当乏味与无聊,没有相当的毅力、决心以及相应的处理方法是绝对不可能解决这种长尾效应的问题的,现在想起来我都有点儿反胃。细节的处理难以详细介绍,在此仅把整个处理流程展示一下。
在此先介绍下,基本原理:单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,它的查询时间复杂度为O(n),n为树的高度。
字典特性:
1. 双数组trie树
2. 词性概念,根据需要分类建立数据,并对其赋予相关词性,以便于根据词性对数据进行针对性的处理;组合词性-需要根据数据所处位置对词性进行推测。
3. 动态数据插入
字典模型
字典模型
字典数据初始流程
字典数据初始流程
核心的回归改进流程
回归改进流程
这里面要提一点就是自动回归测试工具的作用非常大,能节省大量人工重复工作量,也保证之前版本的处理效果不会倒退,其中一些利于辨识的展示效果也非常重要,比如以"====>"等比较明显的标识来标示两次差异的处理结果等。
附录一

词性对应表

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
播出视频服务器的安全运维全文共3页,当前为第1页。播出视频服务器的安全运维全文共3页,当前为第1页。播出视频服务器的安全运维 播出视频服务器的安全运维全文共3页,当前为第1页。 播出视频服务器的安全运维全文共3页,当前为第1页。   【摘要】视频服务器是电视台播出系统的核心设备,服务器超过设计使用年限后,设备故障逐年增多,本文对视频服务器运行维护工作进行了总结,以指导技术人员对视频服务器日常维护保障工作。   【关键词】视频服务器 配置管理 日常运维管理   黑龙江广播电视台于2010年开始高标清同播系统建设,并于2011年实现上线运行,高标清同播系统采用了哈雷公司的MediaDeck高清视频服务器,截止目前,作为播出系统核心部分的视频服务器系统运行正常,有效保障了我台高标清同播系统播出安全。   随着视频服务器设备已经超过设计使用年限,设备发生故障的频率逐年增多,对视频服务器设备的运行维护及升级改造,将作为今后一段时间内的工作重点,因此,在多年视频服务器维护保障工作基础上,现对哈雷视频服务器运行维护工作进行总结,以指导技术人员对视频服务器日常维护保障工作。   一.哈雷视频服务器介绍   哈雷MediaDeck高清视频服务器,其不同于基于PC和Windows操作系统的视频服务器产品,操作系统存储于Flash Memory中,启动时间快,并且不受系统盘故障影响,采用双冗余RAID控制,千兆以太网进行文件传输,配置8块企业级SATA素材盘,2个双通道视音频编解码模块,冗余电源等,均支持热插拔。   二.视频服务器配置管理   哈雷視频服务器需通过Systemmanager程序进行配置管理,程序安装在本地PC工作站,通过管理程序可进行视频服务器的配置管理、状态警报查看等,视频服务器配置包括:设置IP地址、基本参数配置、配置文件系统、创建Player通道、服务器功能测试等。   1.配置设备IP地址   视频服务器IP地址配置,需要使用"monitor.exe"工具软件,该软件一般可以在"Systemmanager"程序目录中找到,值得注意的是"monitor.exe"工具软件版本需与待调试设备相匹配,否则可能出现无法自动发现服务器的问题。   视频服务器IP地址配置完成后,需要对视频服务器进行"Reset"重启,待重启完成可通过"monitor.exe"查看设备IP地址是否修改成功,并通过"Ping"测试是否联通正常。   2.设备基本参数配置   视频服务器配置管理都是通过"Systemmanager"程序实现的,可通过PC管理工作站利用IE浏览器打开管理程序,登录"Systemmanager"默认用户名和密码:播出视频服务器的安全运维全文共3页,当前为第2页。播出视频服务器的安全运维全文共3页,当前为第2页。adminstrator/omneon,在登录后可进行新建用户或用户名密码的修改,登录"Systemmanager"管理程序后,一般程序会自动发现视频服务器,如过不能自动发现设备,在确定视频服务器IP地址可以ping通的情况下,可通过添加设备的方式手工添加视频服务器设备。 播出视频服务器的安全运维全文共3页,当前为第2页。 播出视频服务器的安全运维全文共3页,当前为第2页。   视频服务器基本配置主要针对设备主机名称、网络地址、时区/时间、用户名/密码等进行设置,时区/时间在查询日志分析故障原因的时候显得尤其重要,在此提醒一定要进行正常配置。   用Putty工具选择SSh方式登录,用户名root,密码omneon   命令date查看当前时间。   使用date MMDDhhmmYYYY修改,例如:2019年10月1日上午10点31分50秒。   # date 10011031502019   3.配置文件系统   视频服务器创建文件系统后才能实现视音频文件存储,可以实现通过FTP、SMB等方式进行存储区访问,"Systemmanager"管理程序可以方便快捷的创建文件系统,文件系统创建完成后,可通过FTP客户端工具、UNC网路路径访问的方式进行测试。   4.创建Player通道   视频服务器中每一路编码通道、解码通道或半双工编解码通道,被称为一个Player通道,需要创建、配置相关参数并映射到物理设备,才能实现该编/解码通道的播出控制。   三.日常服务器维护操作   视频服务器提供管理配置软件,实现服务器日常维护与管理,为了保障设备稳定运行,需要技术人员定期进行设备状态检查,并对发现的报警、异常及时处理,必要的情况下询求厂商技术支持。   1.故障报警查看   视频服务器管理程序可以监视设备运行状态,对设备故障进行报警,对报警信息进行分级显示,针对设备严重警告提醒,必要情况下需要联系厂商技术人员进行协助处理。  

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值