自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

lyc1201

问题解决记录

  • 博客(2)
  • 收藏
  • 关注

原创 记录处理自然语言数据集中全型字符的问题

记录处理自然语言数据集中全型字符的问题缘起全型字符unicode字符范围全型字符 缘起 进公司之后的第一个任务是处理一个大型自然语言数据集,处理成可用的格式,遇到了一些问题,在这里记录下来并给出解决方案。 全型字符unicode字符范围 全型字符真的是自然语言处理中很讨厌的东西,删除特殊字符的时候一不小心就会 除全型字母外的全型字符范围: ‘ff00’ - ‘ff20’, ‘ff3b’ - ‘ff41’, ‘ff60’ - ‘ffef’, ‘ff3b’ - ‘ff41’; 全型字母范围: ‘ff21’ -

2020-09-04 17:23:26 155

原创 局部异常因子算法-Local Outlier Factor(LOF)算法的PHP实现

这两天在完善自己系统的过程中要实现一个查找异常的功能,于是在朋友的指点下学习并实现了异常点查找的一个基本算法“局部异常因子算法-Local Outlier Factor(LOF)算法”。 首先,找相关说明看看这是个什么东西吧。 我参考了这一篇文章: 异常点/离群点检测算法——LOF 大致明白了lof算法是在讲什么,我的理解还有很多不完善的地方,不过还是作为一个初学者写出来供大家批评指正。

2017-04-16 11:16:44 7152 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除