人工智能
AICVer
专注计算机视觉,文本检测识别,目标检测等
展开
-
国内大厂机器人赛道产品
人形机器人,已发布Cyberone。机器狗已发布CyberDog2。现阶段科技巨头布局人形机器人无非两个目的:一是将其作为一个新的应用场景来实现技术上的突破;二是利用人形机器人来展示自己的核心技术,证明自己在机器人“天花板”上的实力。研发人形机器人,主要投入工业应用,如流水线拧螺丝,外观缺陷检测,生化样本制作,家庭机器人。.产品多样化包括讲解服务机器人,清洁机器人,仓储机器人,巡检机器人等。当前字节在机器人领域只是初步探索阶段,目前尚未发布相关产品(截止至23.12)。2018年在深圳成立。原创 2023-12-10 12:11:55 · 696 阅读 · 0 评论 -
轻量级人脸检测
1.超轻人脸检测https://github.com/Linzaer/Ultra-Light-Fast-Generic-Face-Detector-1MB2.移动端部署https://github.com/jackweiwang/Android-FaceDetection-UltraNet-MNN原创 2020-09-11 00:07:34 · 280 阅读 · 0 评论 -
2020 场景文本识别相关论文
CVPR 2020论场景文本识别中的词汇依赖性[1].On Vocabulary Reliance in Scene Text Recognition作者 |Zhaoyi Wan, Jielei Zhang, Liang Zhang, Jiebo Luo, Cong Yao单位 | 旷视;中国矿业大学;罗切斯特大学[2].SCATTER: Selective Context Attentional Scene Text Recognizer作者 |Ron Litman, Or..原创 2020-09-07 23:40:25 · 1768 阅读 · 2 评论 -
2019 人工智能领域AI相关比赛信息
1.ICDAR2019ICDAR是专注于自然场景下图片文本检测与识别的一项比赛。http://rrc.cvc.uab.es/2.天池大数据竞赛https://tianchi.aliyun.com/competition/entrance/231685/introduction?spm=5176.12281925.0.0.cbdc7137ck6tzc3.首届中国人工智能·多媒体信...原创 2019-03-27 20:44:09 · 1948 阅读 · 0 评论 -
keras中使用内置模型语义分割上采样维度不匹配
1.卷积时要使用padding=same因此要修改原来的padding=validx = conv2d_bn(img_input, 32, 3, strides=2, padding='same')2.池化时卷积核大小修改为2而不是原来的3branch_pool = layers.MaxPooling2D(2, strides=2, padding='same')(x)...原创 2019-03-09 21:44:09 · 824 阅读 · 0 评论 -
目标检测解决多尺度问题
相关链接http://bbs.cvmart.net/topics/264/scale?from=groupmessage1.针对小目标Perceptual Generative Adversarial Networks for Small Object Detection CVPR2017文章2.多尺度问题UC San DiegoSVCL实验室和IBM研究院的MSCNN:A ...原创 2019-01-29 20:30:15 · 1948 阅读 · 0 评论 -
人工智能重要比赛榜单网址
1.pascal vochttp://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?cls=mean&challengeid=11&compid=42.ICDAR 2015http://rrc.cvc.uab.es/?ch=4&com=evaluation&task=13.RCTW 2017...原创 2019-01-09 16:39:42 · 612 阅读 · 0 评论 -
keras 使用tensorboard记录训练日志与结果
1.每个epoch结束记录只需要在fit的时候加上callbacks=[TensorBoard(log_dir='./tmp/log')] 这一句就可以将运行的结果记录下来了。2.自定义每个batch记录损失函数class Mylosscallback(Callback): def __init__(self, log_dir): super(Callback...原创 2018-12-14 16:12:37 · 8687 阅读 · 0 评论 -
python opencv3.x中svm的模型保存与加载
废话不多说直接上代码:import numpy as npfrom sklearn import datasetsX,y = datasets.make_classification(n_samples=100,n_features=2,n_redundant=0,n_classes=2,random_state=7816)print(X.shape,y.shape)X = X.ast...原创 2018-04-25 19:30:00 · 8892 阅读 · 1 评论 -
论文相关总结
一.论文如何开题第一步:提出主题首先,你得提出一个主题,对你正在学习领域中提出一些问题。这些问题可以是泛泛的,也可以是具体的,也可以是难以回答的。不管是哪一种,只要是你很想找到答案的问题,都把它们列在一个问题清单上。然后尝试去找到这些问题的答案。为了验证你是否真正理解了这些问题的答案,你可以看看自己是否能别人很顺畅地谈论这些问题,是否有能力教别人,看看他们有什么想法。你可以把你对此问题的理解发到 ...原创 2018-03-27 18:55:19 · 1178 阅读 · 0 评论 -
语义分割文献集合
语义分割 Global Deconvolutional Networks BMVC 2016 https://github.com/DrSleep/GDN半监督语义分割 Mix-and-Match Tuning for Self-Supervised Semantic Segmentation AAAI Conference on Artificial Intelligence (AAA...原创 2018-02-27 18:18:11 · 3560 阅读 · 0 评论 -
Mask R-CNN 基于windows10下tensorflow的环境配置
1.论文地址:Mask R-CNN 源代码:matterport - github2.github 给出的安装步骤如下:InstallationClone this repositoryDownload pre-trained COCO weights (mask_rcnn_coco.h5) from the releases page.(Op原创 2018-01-30 18:23:23 · 4922 阅读 · 1 评论 -
GoogleNet的几个版本整理
Google一系列深度学习网络发展的整理原创 2017-12-13 14:30:59 · 4758 阅读 · 0 评论 -
deeplearning 发展历程
1.ILSVRC榜单便是Deep Learning视觉发展的里程碑式代表图1. ILSVRC历年的Top-5错误率2.AlexNet、VGG、GoogLeNet、ResNet对比LeNet主要是用于识别10个手写数字的,当然,只要稍加改造也能用在ImageNet数据集上,但效果较差。而本文要介绍的后续模型都是ILSVRC竞赛历年的佼佼者,这里具体比较AlexNet、VGG、原创 2017-12-13 14:24:20 · 654 阅读 · 0 评论