![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
图像标注
技术修行
人生如梦,技术无边,愿做行僧,修得真谛。
展开
-
谷歌AVA数据库的1705.08421论文(5)
5.试验5.1.试验准备 在Table1看到的,AVA数据集中的追加的素材,标签的分布大体上遵从齐夫定律(Zipf)。自从在很小量的测试集上评估认为可能是不可靠,我们只有用那些有至少25测试实例的类别,来检测动作定位的表现。我们的检测基准设定为由44个动作类别组成,这些类别适合要求,且每个类别有90个训练实例的最小个数。我们随机选择训练数据的10%作为确认系列,用他们调整模型的翻译 2017-11-07 21:29:00 · 482 阅读 · 0 评论 -
python下wordpdf转换总结
python下wordpdf转换总结 近期涉及到了关于doc文档读取的处理,也查了很久,为了便于大家使用,故集大成一下。Doc文档读取有如下几种:1、从doc读取文本 目前没有找到直接的方式,一般是先转为docx文件在处理。所使用工具为doc2doc(批量时可用),或人工另存处理。 还有可以用antiword(依赖linux环境),使用“./antiword” + doc文件名即可读取文件...原创 2018-03-30 09:56:29 · 841 阅读 · 0 评论 -
open3d的例程2
KDTreeOpen3D使用FLANN来快速创建KDTrees。#src/Python/Tutorial/Basic/kdtree.py import sysimport numpy as npsys.path.append("../..")from py3d import * if __name__ =="__main__": print("Testing kdtree in py3d....翻译 2018-03-03 13:35:28 · 3572 阅读 · 0 评论 -
open3d例程
Open3D是一个可以支持 3D数据处理软件快速开发的开源库。简要介绍下其例程。综合场景Open3D能集成所有RGB-D图像到单一TSDF volume,压缩为一个mesh。输入参数if __name__ =="__main__": parser =argparse.ArgumentParser(description= "integrate the whole RGB...翻译 2018-03-03 13:33:20 · 9751 阅读 · 1 评论 -
labelme的使用及问题解决
个人在试验mask-rcnn的过程中使用labelme进行标注,使用中遇到了如下问题: Unable to save: 'bytes' object has no attribute 'encode' 这个是在windows上python3上遇到的问题。需要修改代码,网上有怎么对应的方法,但没有提供现成的可用代码,故我修改后验证可用,然后共享出来,不用大家每次都去修改。共享的代码...原创 2018-02-11 17:21:33 · 10362 阅读 · 1 评论 -
谷歌AVA数据库的1705.08421论文(4)
4. AVA数据集的特性 我们通过讨论数据的类型与分布开始分析,展示注释的高质量。之后我们研究感兴趣的动作,和时间结构,这使此数据集真正的独一无二。然后我们讨论这些特性,其使数据集具有挑战性,尤其对动作检测任务。 首先,建立直觉的一些样本。每个样本被推荐为来自片段的3帧:带矩形框的中间帧圈住表演动作的人,在中间帧之前的0.5s的那一帧,在中间帧翻译 2017-11-06 16:56:16 · 410 阅读 · 0 评论 -
谷歌AVA数据库的1705.08421论文(3)
3. 数据收集 AVA数据集的产生管道包含3个阶段:电影和片段选择,人的矩形框标记,动作标记。3.1.电影和片段选择 AVA数据集的未加工的视频内容,来自YouTube。我们通过收集不同国籍的高水平演员列表就开始了。对每个名字我们发布了一个YouTube搜索问询,收到了2000个结果。我们仅仅收集带“film”或“television”主题注释的翻译 2017-11-05 11:50:10 · 776 阅读 · 0 评论 -
moviepy安装过程中的问题
在测试ObjectDetectionAPI过程中遇到了一些问题,做个记录。以备后用。1、安装moviepy过程中,在cmd下,使用pip命令pip install moviepy安装遇到如下问题:1. Exception: 2. Traceback (most recent call last): 3. File "C:\ProgramData\原创 2017-11-12 19:31:21 · 7066 阅读 · 2 评论 -
谷歌AVA数据库的1705.08421论文(2)
接续上节:2. 关联工作 大部分受欢迎的动作识别数据集,如KTH [31], Weizmann [4], Hollywood-2 [22], HMDB[21] and UCF101 [33],由短的剪辑组成,手工整理获得一个单独的动作。理论上这些数据集是合适,对训练全监督,整个剪辑,强制选择优先级来说。遗憾的是,尽管实用,这动作识别的构想是完全不切实际,真实世界翻译 2017-10-31 16:06:20 · 576 阅读 · 0 评论 -
谷歌AVA数据库的1705.08421论文
目的是理解AVA数据库的做成过程。翻译了谷歌AVA数据库的1705.08421论文。翻译初版,部分还需要斟酌,之后在改善。内容参见如下。概要本论文提出了一个视频数据集,(时空局部化)原子视觉动作(Atomic Visual Actions (AVA))。这个AVA数据集密集的标注了80种原子视觉动作,在57.6k的基于带有空间和时间的动作的视频片段上,作为结果,有210k动翻译 2017-10-30 11:24:38 · 1243 阅读 · 0 评论 -
使用jTessBoxEditorFX进行ocr训练的实际操作步骤
使用jTessBoxEditorFX进行ocr训练实际的操作步骤如下。先把训练用样本图像准备好。1、打开 jTessBoxEditor ,选择 Tools -> Merge TIFF,打开对话框,选择训练样本所在文件夹,并选中所有要参与训练的样本图片,注意对话框中“文件类型”的选取png2、之后有打开对话框,输入“chi_my.font.exp0.tif”,格式为tiff。其中chi_my可...原创 2018-04-06 18:33:02 · 5177 阅读 · 5 评论