自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 解决jTessBoxEditorFX的train.bat点击无效的问题

左图是fx的train.bat 文件内容 右图是原版train.bat 的内容。然后将train.bat文件中的路径更改未你的路径,就可以就解决了。然后将你所下载的文件解压后,保存到一个指定路径(哪里都可),但是jTessBoxEditor却没有这样的问题。如果还未能解决 那么就将javafx添加到环境变量中。在上述官网网址中 ,选在javafx-sdk。,所以根本提取不到lib包更别提路径了。我们可以发现fx不能打开原因是因为。不仅路径无效,而且很可能你的。为:PATH_TO_FX。

2024-02-28 18:18:19 392

原创 省市区地址匹配——解决身份证地址缺失值问题

在做selenium自动化的过程中,发现对于需要点击填写省市区的过程中,出现了原数据不完整 具有缺失值的问题。分别是缺省 缺市 的情况 都可以补全,但是目前还存在一些小问题 后续会继续完善,完善了再发。例如我仅仅知道【讷河市】,但是可以自动匹配出 【黑龙江省】【齐齐哈尔市】过程不赘述了,简单来说就是用原地址的字符串循环匹配查找,需要的可以直接用。但需要匹配的地址其实是:黑龙江省 齐齐哈尔市 讷河市 某某某。例如:原地址为:黑龙江省 讷河市 某某某。这样就出现了无法填写的问题。然后通过运算将全部地址输出。

2024-01-26 11:44:28 366 1

原创 在selenium框架下对列表元素进行精确点击

这种情况在列表上体现的更为凸显,而且在对列表元素进行点击的过程,不可能对列表所有的元素进行穷举,那么更好的方式就是:对标签名(tag_name)下的内置文本innertext进行读取匹配,能够更好的选择想要的元素。在使用selenium过程中会出现:原本定位的元素 经过网页的修改后定位变得不准确的情况。这里可以看到列表中的标签名 为 ‘li’ 同理 若为div button 都可以使用。然后对每个列表元素进行循环,将所需要的与目标元素进行匹配。首先对目标列表的上一级进行定位。

2024-01-12 09:35:50 2503 1

原创 广告数据集mapreduce实验(词频统计)

hadoop实验mapreduce词频统计,对广告数据集的购买者年龄进行词频统计,获得购买者年龄分布。

2023-01-12 18:12:42 314

全国省市区划分对应表 共34个省对应34各表

共34个省对应34各表 ,每个表中分为省市区三列,直辖市、自治区都包括,可以用来做地址匹配,对于身份证地址缺失值的问题具有很好的帮助,如果需要匹配身份证地址缺失值问题的可以找我,已经做了一份相应的查询代码,欢迎交流指导

2024-01-26

网页广告数据集(年龄+性别+薪资+点击量+询问量+购买量)

网页广告数据集(年龄+性别+薪资+点击量+询问量+购买量)主要适用于词频统计分析等训练场景,共一千一百余条数据

2023-05-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除