其实书童是一个集算法、实践、论文以及Transformer于一身的公号(往期索引大全)...

今天给大家推荐一个好朋友ChaucerG,不仅有趣也具有非常强的执行力,独自创立和运营了【集智书童】公众号;

集智书童】从最开始的机器学习与深度学习基础开始记起,为刚刚入门人工智能的小伙伴提供理论基础;

同时【集智书童】也保持其前沿性,对最新、最具实用性的论文进行解读和翻译记录,为已经工作的小伙伴、或者科研领域的小伙伴抛砖引玉,希望小伙伴们也可以继往开来,启发更多的思考节约更多的时间成本。

最最重要的是,有了理论只是如何用于实践?这是一个非常现实的问题,这里ChaucerG也会不定期为大家提供实际的AI项目实践内容。

基础学习

ChaucerG在这里可以说是一步一步告诉你如何开始入门AI然后如何进一步进阶深度学习和计算机视觉,这里给出一部分往期原创:

往期推荐

【机器学习算法】1、线性回归——深层理解

【机器学习算法】2、逻辑回归——从来源说起

【机器学习算法】3、K-近邻算法

【机器学习算法】4、降维算法之PCA(深入理解与实践)

【机器学习算法】5、支持向量机算法

【机器学习算法】6、K-Means流程结束要不要多问几个为什么呢?

【机器学习算法】7、聚类算法之Mean-Shift

【机器学习算法】8、聚类算法之DBSCAN

【机器学习算法】9、EM算法与K-Means算法的收敛性证明

【机器学习算法】10、朴素贝叶斯算法+中文分词项目实战

【机器学习算法】11、高斯混合模型算法+语音识别项目实战

【机器学习算法】12、隐马尔科夫模型+股票预测项目实战+中文分词项目实战

【深度学习】1、优化方法原理与实践对比——非常详细与全面

【深度学习】2、Pytorch自行实现常见的11个激活函数的Fashion Minist项目实践对比(你需要的这里都有了!)

【深度学习】3、正则化技术全面了解

【经典网络模型】1、基于GUI实践AlexNet图像识别与分类

【经典网络模型】2、卷积神经网络之 - VGGNet

前沿Work学习

ChaucerG在这里完全跟进最新科研动向,并从中挑选出具有价值的文章进行解读和记录,这里给出一部分往期原创:

往期推荐

详细解读 | CVPR 2021轻量化目标检测模型MobileDets(附论文下载)

即插即用模块 | CompConv卷积让模型不丢精度还可以提速(附论文下载)

遮挡人脸问题 | 详细解读Attention-Based方法解决遮挡人脸识别问题(附论文下载)

效率新秀 | 详细解读:如何让EfficientNet更加高效、速度更快

让检测告别遮挡 | 详细解读NMS-Loss是如何解决目标检测中的遮挡问题?

即插即用 | 卷积与Self-Attention完美融合X-volution插入CV模型将带来全任务的涨点(文末附论文)

YOLO |多域自适应MSDA-YOLO解读,恶劣天气也看得见(附论文)

轻量化卷积:TBC,不仅仅是参数共享组卷积,更具备跨通道建模

CVPR2021 | 重新思考BiSeNet让语义分割模型速度起飞(文末获取论文)

YOLO在升级 | PP-YOLO v2开源致敬YOLOV4携带Tricks又准又快地归来(附论文与源码)

又改ResNet | 重新思考ResNet:采用高阶方案的改进堆叠策略(附论文下载)

VariFocalNet | IoU-aware同V-Focal Loss全面提升密集目标检测(附YOLOV5测试代码)

最强检测 | YOLO V4?都是弟弟! CenterNet2以56.4mAP超越当前所有检测模型(附源码与论文)

新型卷积 | 涨点神器!利用Involution可构建新一代神经网络!(文末获取论文与源码)

CVPR2021-即插即用 | Coordinate Attention详解与CA Block实现(文末获取论文原文)

Transformer学习

ChaucerG在这里为了对于比较好的前沿工作继续学习与记录,更是单独推出Transformer专题来进行讲解,这里给出一部分往期原创:

往期推荐

详细解读Google新作 | 教你How to train自己的Transfomer模型?

Tansformer | 详细解读:如何在CNN模型中插入Transformer后速度不变精度剧增?

最强Transformer | 太顶流!Scaling ViT将ImageNet Top-1 Acc刷到90.45%啦!!!

Transformer | 详细解读Transformer怎样从零训练并超越ResNet?

Transformer | 没有Attention的Transformer依然是顶流!!!

Google新作 | 详细解读 Transformer那些有趣的特性(建议全文背诵)

极品Trick | 在ResNet与Transformer均适用的Skip Connection解读

Transformer又一城 | Swin-Unet:首个纯Transformer的医学图像分割模型解读

最快ViT | FaceBook提出LeViT,0.077ms的单图处理速度却拥有ResNet50的精度(文末附论文与源码)

超越SOLO V2| ISTR:基于Transformer的端到端实例分割(文末获取论文与源码)

简单有效 | Transformer通过剪枝降低FLOPs以走向部署(文末获取论文)

经典Transformer | CoaT为Transformer提供Light多尺度的上下文建模能力(附论文下载)

最强Vision Trabsformer | 87.7%准确率!CvT:将卷积引入视觉Transformer(文末附论文下载)

全领域涨点 | Transformer携Evolving Attention在CV与NLP领域全面涨点(文末送书)

Transformer系列 | 更深、更强、更轻巧的Transformer,DeLighT(文末获取论文与源码)

Transformer 系列 | 网络架构设计:CNN based和Transformer based

Transformer 系列| Transformer又搞事情!TransReID首次在ReID中应用,结果喜人(文末获取论文)

即插即用 | 通过自适应聚类Transformer来提升DERT目标检测器的速度(文末附论文下载)

项目实践

ChaucerG在这里为大家提供了详细的AI项目实践记录和一键执行的代码,这里给出一部分往期原创:

往期推荐

项目实践 | 从零开始边缘部署轻量化人脸检测模型——训练篇

项目实践 | 从零开始边缘部署轻量化人脸检测模型——EAIDK310部署篇

项目实践 | 行人跟踪与摔倒检测报警(文末获取完整源码)

项目实践 | 基于YOLO-V5实现行人社交距离风险提示(文末获取完整源码)

【项目实践】从零开始学习SSD目标检测算法训练自己的数据集(附注释项目代码)

【项目实践】从零开始学习Deep SORT+YOLO V3进行多目标跟踪(附注释项目代码)

【项目实践】多人姿态估计实践(代码+权重=一键运行)

【项目实践】Pytorch YOLO项目推荐 建议收藏学习

【项目实践】基于PyTorch实现C3D模型的视频行为识别实践

【项目实践】EfficientDet原理讲解与目标检测项目实践

【项目实践】DCGAN绘制理想女朋友照片实践,从爬虫到生产女友

【项目实践】车距+车辆+车道线+行人检测项目实践

【项目实践】多粒度网络MGN-ReID之跨境追踪实践

【项目实践】基于Mask R-CNN的道路物体检测与分割(从数据集制作到视频测试)

【Re-ID项目实践】基于表征学习的行人ReID方法实践

【项目实践】中英文文字检测与识别项目(CTPN+CRNN+CTC Loss原理讲解)

部分AI项目实践结果展示:

1、行为识别:

2、跟踪算法:

3、社交距离检测:


4、车道线检测:

5、语义分割:

最后,欢迎更多的小伙伴添加书童小助手,下面是小助手的二维码,期待你的添加!

长按识别二维码添加小助手

备注:昵称-地区-研究方向

(如:chauerg-杭州-检测)

【集智书童】公众号添加邀请函 

△长按添加集智书童官方微信号 

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:chaucer_g@126.com

觉得有用麻烦给个在看啦~  

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,我可以回答这个问题。以下是一个基于Vision Transformer的图片分类代码示例: ```python import torch import torch.nn as nn import torchvision.transforms as transforms from PIL import Image # 定义Vision Transformer模型 class VisionTransformer(nn.Module): def __init__(self, num_classes=10, dim=512, depth=6, heads=8, mlp_dim=2048): super().__init__() self.patch_size = 16 self.num_classes = num_classes self.pos_embedding = nn.Parameter(torch.zeros(1, (224 // self.patch_size) ** 2 + 1, dim)) self.patch_embedding = nn.Conv2d(3, dim, kernel_size=self.patch_size, stride=self.patch_size) self.transformer = nn.TransformerEncoder(nn.TransformerEncoderLayer(d_model=dim, nhead=heads, dim_feedforward=mlp_dim), num_layers=depth) self.fc = nn.Linear(dim, num_classes) def forward(self, x): x = self.patch_embedding(x).flatten(2).transpose(1, 2) x = torch.cat([self.pos_embedding[:, :1, :].expand(-1, x.size(1), -1), x], dim=1) x = self.transformer(x) x = x.mean(dim=1) x = self.fc(x) return x # 加载模型和预训练权重 model = VisionTransformer() model.load_state_dict(torch.load('vision_transformer.pth')) # 定义图片预处理 transform = transforms.Compose([ transforms.Resize(256), transforms.CenterCrop(224), transforms.ToTensor(), transforms.Normalize(mean=[.485, .456, .406], std=[.229, .224, .225]) ]) # 加载图片并进行预测 img = Image.open('test.png') img = transform(img) img = img.unsqueeze() output = model(img) pred = torch.argmax(output, dim=1).item() print('预测结果:', pred) ``` 这个代码可以将一个.png图片集进行分类,其中使用了Vision Transformer模型和预训练权重。你可以根据自己的需要修改代码中的参数和预处理方式。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值