- 博客(2)
- 收藏
- 关注
原创 记录处理自然语言数据集中全型字符的问题
记录处理自然语言数据集中全型字符的问题缘起全型字符unicode字符范围全型字符 缘起 进公司之后的第一个任务是处理一个大型自然语言数据集,处理成可用的格式,遇到了一些问题,在这里记录下来并给出解决方案。 全型字符unicode字符范围 全型字符真的是自然语言处理中很讨厌的东西,删除特殊字符的时候一不小心就会 除全型字母外的全型字符范围: ‘ff00’ - ‘ff20’, ‘ff3b’ - ‘ff41’, ‘ff60’ - ‘ffef’, ‘ff3b’ - ‘ff41’; 全型字母范围: ‘ff21’ -
2020-09-04 17:23:26 162
原创 局部异常因子算法-Local Outlier Factor(LOF)算法的PHP实现
这两天在完善自己系统的过程中要实现一个查找异常的功能,于是在朋友的指点下学习并实现了异常点查找的一个基本算法“局部异常因子算法-Local Outlier Factor(LOF)算法”。 首先,找相关说明看看这是个什么东西吧。 我参考了这一篇文章: 异常点/离群点检测算法——LOF 大致明白了lof算法是在讲什么,我的理解还有很多不完善的地方,不过还是作为一个初学者写出来供大家批评指正。
2017-04-16 11:16:44 7158 3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人