just_sort
码龄7年
  • 1,308,108
    被访问
  • 1,597
    原创
  • 823
    排名
  • 1,368
    粉丝
  • 41
    铁粉
关注
提问 私信

个人简介:Acdream.

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2015-08-06
博客简介:

I good vegetable a!

博客描述:
本人维护了一个数字图像各种论文复现工程,欢迎STAR: https://github.com/BBuf/
查看详细资料
  • 5
    领奖
    总分 1,806 当月 39
个人成就
  • 获得702次点赞
  • 内容获得522次评论
  • 获得3,866次收藏
  • GitHub 获得2,030Stars
创作历程
  • 12篇
    2022年
  • 29篇
    2021年
  • 115篇
    2020年
  • 154篇
    2019年
  • 70篇
    2018年
  • 732篇
    2017年
  • 483篇
    2016年
  • 33篇
    2015年
成就勋章
TA的专栏
  • 低比特量化
    7篇
  • 人脸识别
    8篇
  • AI移动端优化
    13篇
  • 目标检测
    89篇
  • 语义分割
    14篇
  • SSE图像算法优化
    18篇
  • TensorRT
    6篇
  • AI科技评论
  • openvino
    4篇
  • DL损失函数
    3篇
  • Kaggle
    1篇
  • 生成对抗网络
    7篇
  • 琐事 心情 生活
    9篇
  • ACM_ICPC紫书
    5篇
  • ACM/ICPC_挑战程序设计竞赛
    6篇
  • ACM/ICPC_ BZOJ
    222篇
  • ACM/ICPC_Codeforences
    204篇
  • ACM/ICPC_HDOJ
    121篇
  • ACM/ICPC_POJ
    47篇
  • ACM/ICPC CODE_VSOJ
    3篇
  • ACM/ICPC_SWUST OJ
    17篇
  • ACM/ICPC_BestCoder
    15篇
  • ACM/ICPC_Hackerrank
    3篇
  • ACM/ICPC_UVAOJ
    17篇
  • ACM/ICPC_玲珑OJ
    11篇
  • ACM/ICPC Wanna_fly
    39篇
  • ACM/ICPC_UESTC
    31篇
  • ACM/ICPC LibreOJ
    4篇
  • ACM/ICPC_多校联合训练
    42篇
  • ACM/ICPC图论_水题
    16篇
  • ACM/ICPC图论_LCA
    15篇
  • ACM/ICPC图论_二分图
    11篇
  • ACM/ICPC图论_最短路/生成树
    11篇
  • ACM/ICPC图论_网络流
    40篇
  • ACM/ICPC图论_A*,IDA*
    3篇
  • ACM/ICPC图论_DFS
    23篇
  • ACM/ICPC图论_BFS
    28篇
  • ACM/ICPC图论_TwoSAT
    5篇
  • ACM/ICPC图论_割点/桥/边双/点双
    9篇
  • ACM/ICPC图论_拓扑排序
    2篇
  • ACM/ICPC_计算几何
    28篇
  • ACM/ICPC_数论
    23篇
  • ACM/ICPC_高斯消元
    9篇
  • ACM/ICPC_FFT
    7篇
  • ACM/ICPC_NTT/CRT
    6篇
  • ACM/ICPC_FWT
    3篇
  • ACM/ICPC_莫比乌斯反演/线形筛
    11篇
  • ACM/ICPC_扩展欧几德里/矩阵乘法
    1篇
  • ACM/ICPC_容斥/雀巢原理
    9篇
  • ACM/ICPC_大步小步算法
    1篇
  • ACM/ICPC_动态规划
    120篇
  • ACM/ICPC_概率dp
    19篇
  • ACM/ICPC_树形dp
    25篇
  • ACM/ICPC树分治
    4篇
  • ACM/ICPC_状压dp
    23篇
  • ACM/ICPC_数位dp
    17篇
  • ACM/ICPC_区间DP
    12篇
  • ACM/ICPC单调队列
    14篇
  • ACM/ICPC单调栈
    10篇
  • ACM/ICPC斜率优化
    4篇
  • ACM/ICPC_数据结构
    72篇
  • 数据结构_字典树
    5篇
  • 数据结构_线段树
    6篇
  • 数据结构_AC自动机
    12篇
  • 数据结构_主席树
    9篇
  • 数据结构_Splay树
    13篇
  • 数据结构_2D系列
    2篇
  • 数据结构_莫队/曼哈顿树
    12篇
  • 数据结构_平衡树
    6篇
  • 数据结构_分块法
    11篇
  • 数据结构_线段树
    16篇
  • 数据结构_树状数组
    13篇
  • 数据结构_可并堆
    3篇
  • 数据结构_倍增法
    2篇
  • 数据结构_可持久化
    4篇
  • 数据结构_后缀数组
    5篇
  • 数据结构_并查集
    20篇
  • 数据结构_树链剖分
    11篇
  • 数据结构_树套树
    3篇
  • 数据结构_离散化
    3篇
  • 数据结构_最小表示法
    1篇
  • 数据结构_Hash
    20篇
  • 数据结构_Kmp
    10篇
  • 数据结构_回文树
    1篇
  • 数据结构_KDtree
    2篇
  • ACM/ICPC启发式合并
    3篇
  • ACM/ICPC技巧/脑洞题
    16篇
  • ACM/ICPC二分/三分
    14篇
  • ACM/ICPC双指针
    11篇
  • ACM/ICPC BITSET优化
    6篇
  • ACM/ICPC高维前缀和
    3篇
  • ACM/ICPC组合游戏/SG
    23篇
  • ACM/ICPC 整体二分/CDQ分治
    3篇
  • ACM/ICPC STL
    5篇
  • ACM/ICPC 贪心/思维/构造题
    46篇
  • ACM/ICPC 集训队平时训练题
    26篇
  • ACM/ICPC 随机增量法
    1篇
  • ACM/ICPC 虚树
    1篇
  • ACM/ICPC 2017多校网络赛现场赛解题报告
    25篇
  • 深度学习论文阅读及算法详解
    102篇
  • 机器学习算法
    26篇
  • tensorflow
    12篇
  • 数字图像处理论文和算法复现
    53篇
  • CUDA
    3篇
  • C++ 多线程
    3篇
  • 并行编程方法与优化实践
    4篇
  • 概率论
    4篇
  • leetcode
    5篇
兴趣领域 设置
  • 人工智能
    深度学习
  • 最近
  • 文章
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

OSDI 2021 PET 论文解读

今天来阅读一篇OSDI 2021的论文,《PET: Optimizing Tensor Programs with Partially Equivalent Transformationsand Automated Corrections》。之前也读过OSDI 2020的 《Ansor : Generating High-Performance Tensor Programs for Deep Learning》这篇论文,如果说Ansor是在更微观的角度做代码生成,那么这篇PET就可以说是在更宏观的角度做
原创
发布博客 2022.06.25 ·
428 阅读 ·
0 点赞 ·
0 评论

Buddy-MLIR 项目详解(入门 MLIR 极佳选择)

【GiantPandaCV】前几天洪滨介绍了他们PLTC的Buddy MLIR项目,感觉是一项比较有趣的项目。正值端午就看了一下这个项目并且大致理清了代码结构并且把相关的例子都跑了跑,这中间还发现了一些小BUG并提了一些小的修复的PR。所以这篇文章用来记录一下在我的视角下,Buddy-MLIR为什么是一个优秀的项目,它能为做编译器开发的同行或者小白用户带来什么样的帮助,Let’s Go!整个Buddy-MLIR项目给我的最大感觉就是,无论结果怎么样,我们都可以先 run 起来。虽然 MLIR 已经出现了几年
原创
发布博客 2022.06.05 ·
180 阅读 ·
0 点赞 ·
0 评论

【社区实践】为 TVM 新增 OneFlow 前端

0x0. 背景去年在Summer Code的时候我刚好开始入门 TVM(虽然现在仍然也还是入门阶段,没做过什么有意义的工作),并且恰好来到OneFlow 工作就想着给 TVM 添加一个 OneFlow 前端。但可惜在 Summer Code 发起了这个项目后因为系统选人的 BUG 导致没有选到合适的候选人。后来我私下联系了申请这个项目的第二位候选人胡伽魁同学问他是否愿意来 OneFlow 实习并花1-2个月完成这件事,他同意了并在实习期间做了一个初版出来。感谢胡伽魁同学的贡献。在这个初版的基础上,我做了
原创
发布博客 2022.05.15 ·
314 阅读 ·
0 点赞 ·
0 评论

【TVM 巡礼】How to optimize cpu(x86) gemm串讲

0x0. 前言本文主要梳理一下在21年接触到优化gemm的知识,做一个学习总结。行文的顺序大概为:介绍本文依赖的硬件环境和本文要完成的任务。回顾gflops的计算方法然后计算本地环境的gflops。How to optimize gemm on cpu...
原创
发布博客 2022.05.02 ·
277 阅读 ·
0 点赞 ·
0 评论

【论文解读】基于MLIR的矩阵乘法高性能GPU代码生成:一些早期结果

0x0. 前言本文是对 https://arxiv.org/abs/2108.13191 这篇论文进行解读,学习一下MLIR如何生成高效的GPU代码。本文的阅读顺序分别为:
原创
发布博客 2022.03.27 ·
986 阅读 ·
0 点赞 ·
0 评论

【从零开始学深度学习编译器】二十,MLIR的Pattern重写机制

0x0. 前言这篇文章对MLIR的Pattern重写机制进行梳理和汇总,会结合实际例子把MLIR的两篇文档转化成容易看懂的形式。这两篇文档分别是https://mlir.llvm.org/docs/PatternRewriter/ 和 https://mlir.llvm.org/docs/Rationale/RationaleGenericDAGRewriter/ 。做这件事的动机是因为在我的开发过程中已经大量使用了MLIR的这个Pattern Rewrite机制,也经常回看这两篇文档所以翻译+梳理+总结
原创
发布博客 2022.03.20 ·
957 阅读 ·
0 点赞 ·
0 评论

【从零开始学深度学习编译器】十九,MLIR的Pass机制实践

0x0. 前言
原创
发布博客 2022.03.10 ·
1105 阅读 ·
0 点赞 ·
0 评论

MLIR:摩尔定律终结的编译器基础结构 论文解读

0x0. 前言之前以MLIR的Toy Tutorials教程为切入点了解了MLIR,然后又对MLIR的ODS要点以及Interfaces等知识进行了详解。在继续学习MLIR的相关知识前,我想对MLIR做一个总结。而要了解MLIR的全貌,阅读MLIR论文是一个不错的方式。但论文对一些要点只是简单提出,所以我这篇文章将在用沐神阅读论文的方法阅读MLIR论文的基础上对MLIR的要点在Toy Tutotials中进行对应和指路,并尝试用一些图表来建立起MLIR编译器的整体架构。最后有一段小的个人思考。沐神的论文
原创
发布博客 2022.02.19 ·
493 阅读 ·
0 点赞 ·
0 评论

一个Tensor在深度学习框架中的执行过程简单梳理

0x0. 前言相信看到这篇文章的人都对深度学习框架是有所了解和熟悉的,也多多少少会使用Python写一些神经网络相关的代码。例如我们可以在PyTorch写出下面的代码:import torchx = torch.tensor([-1.0, 2.0], device="cuda")y = torch.relu(x)print(y)使用PyTorch运行之后我们会获得如下结果:tensor([0., 2.], device='cuda:0')对于x这个输入Tensor来说,它被喂给了relu
原创
发布博客 2022.01.27 ·
2182 阅读 ·
0 点赞 ·
0 评论

深度学习框架如何优雅的做算子对齐任务?

0x0. 前言
原创
发布博客 2022.01.16 ·
698 阅读 ·
0 点赞 ·
0 评论

【从零开始学深度学习编译器】十八,MLIR中的Interfaces

0x0. 前言
原创
发布博客 2022.01.06 ·
209 阅读 ·
0 点赞 ·
0 评论

GiantPandaCV 2021年度总结

GiantPandaCV年度总结BBuf篇在2022年的第一天,先祝大家元旦快乐,希望2022年大家学业,工作,论文种种事情都一切顺利。从GiantPandaCV公众号注册发文到2022年1月1日,已过了2年的时间,今天早上睡醒佩杰给我说我们的粉丝数已经超过3w了,我下午打开公众号后台看到确实如此,截图如下:非常感谢大家对GiantPandaCV的关注和支持。接下来我将分享一下自己这一年我为公众号做了什么,以及2022有什么计划。首先,在今年做出了一个重要的决定,就是公众号放弃了维护交流群并不提供
原创
发布博客 2022.01.01 ·
558 阅读 ·
4 点赞 ·
1 评论

用沐神的方法阅读PyTorch FX论文

0x0. 动机最近沐神在B站上分享了一些经典论文的阅读视频,我也跟着看了几个比如TransFormer,VIT等,很赞。所以我就想跟着沐神这种方法来实践一下,找一篇论文来阅读一下。目前我比较关注的是工程方向的论文,正好上周PyTorch 放出了它们FX的论文,所以就以这篇论文为例来试试沐神的论文阅读方法。沐神的论文阅读方法大概是这样(数字代表先后顺序):标题摘要引言结论相关工作FX特性实验评论PyTorch FX论文的链接在:https://arxiv.org/pdf/2112.08
原创
发布博客 2021.12.26 ·
995 阅读 ·
0 点赞 ·
0 评论

【从零开始学深度学习编译器】十七,MLIR ODS要点总结下篇

前言接【从零开始学深度学习编译器】十六,MLIR ODS要点总结上篇 补充完整ODS的要点。11. 约束约束(Constraint)是表驱动Operation定义中的一个核心概念:Operation验证和图Operation匹配都是基于满足约束。因此,Operation定义和重写规则都直接涉及写入约束。MLIR在OpBase.td(https://github.com/llvm/llvm-project/blob/main/mlir/include/mlir/IR/OpBase.td)中定义了Cons
原创
发布博客 2021.11.29 ·
159 阅读 ·
0 点赞 ·
0 评论

【从零开始学深度学习编译器】十六,MLIR ODS要点总结上篇

前言在【从零开始学深度学习编译器】十二,MLIR Toy Tutorials学习笔记一 中提到MLIR是通过Dialect来统一各种不同级别的IR,即负责定义各种Operation(算子)。然后对Dialect和Operation的定义又是通过TabelGen规范构造的,通过TableGen驱动MLIR的Operation定义也被称作ODS( Operation Definition Specification) 。我们目前只是简单认识了Toy Tutorials的Dialect和Operation是如何
原创
发布博客 2021.11.24 ·
374 阅读 ·
0 点赞 ·
0 评论

【从零开始学深度学习编译器】十五,MLIR Toy Tutorials学习笔记之Lowering到LLVM IR

0x0. 前言在上一节中,我们将Toy Dialect的部分Operation Lowering到Affine Dialect,MemRef Dialect和Standard Dialect,而toy.print操作保持不变,所以又被叫作部分Lowering。通过这个Lowering可以将Toy Dialect的Operation更底层的实现逻辑表达出来,以寻求更多的优化机会,得到更好的MLIR表达式。这一节,我们将在上一节得到的混合型MLIR表达式完全Lowering到LLVM Dialect上,然后生
原创
发布博客 2021.11.17 ·
376 阅读 ·
0 点赞 ·
0 评论

【从零开始学深度学习编译器】十四,MLIR Toy Tutorials学习笔记之部分Lowering

0x0. 前言这篇笔记是阅读Toy Tutorials的第五章之后总结的,这一节主要讲了一个Affine Dialect以及将之前获得的MLIR表达式(【从零开始学深度学习编译器】十三,如何在MLIR里面写Pass? 这篇笔记末尾获得的MLIR表达式)进一步转换为Affine Dialect,并根据Affine Dialect中的冗余针对性的进行优化,这个转化被称作Lowering。0x1. Dialect转换MLIR有众多的Dialect,所以MLIR提供了一个统一的DialectConversio
原创
发布博客 2021.11.11 ·
624 阅读 ·
0 点赞 ·
0 评论

【从零开始学深度学习编译器】十三,如何在MLIR里面写Pass?

前言在【从零开始学深度学习编译器】十一,初识MLIR 和 【从零开始学深度学习编译器】十二,MLIR Toy Tutorials学习笔记一 这两篇文章中,我们已经初步了解了MLIR为何物,并且讲到了Toy语法从源文件生成MLIR的具体过程,以及在这个过程中MLIR中的MLIRGen,Dialect,Operation以及TableGen这几个MLIR的核心组成部分以及它们是如何相互作用的。这篇笔记将基于Toy Tutorials总结MLIR中的表达式变形是如何实现的。Chapter3: MLIR中的表
原创
发布博客 2021.11.02 ·
750 阅读 ·
0 点赞 ·
0 评论

【从零开始学深度学习编译器】十二,MLIR Toy Tutorials学习笔记一

0x0. 前言上篇文章简单介绍了MLIR是什么,这篇文章将结合MLIR的 Toy Tutorials来进一步了解MLIR的全貌。0x1. Chapter1: Toy语言和ASTMLIR提供了一种Toy语言来说明MLIR的定义和执行的流程。Toy语言是一种基于张量的语言,我们可以使用它来定义函数,执行一些数学计算以及输出结果。下面要介绍的例子中限制Tensor的维度是<=2的,并且Toy语言中唯一的数据类型是64位浮点类型,对应C语言中的"double"。另外Values是不可以重写的,即每个操作
原创
发布博客 2021.10.27 ·
242 阅读 ·
0 点赞 ·
0 评论

【从零开始学深度学习编译器】十一,初识MLIR

0x0. 前言最近开始做一些MLIR的工作,所以也来分享一些MLIR的知识。这篇文章是对MLIR的初步印象,并不深入,适合想了解MLIR基础的同学阅读,后面再分享MLIR的一些项目。本文主要基于MLIR官方文档的Toy Tutorial完成,并且要大力感谢中科院的法斯特豪斯(知乎ID)同学先前的一些分享,给了我入门MLIR的方向。0x1. 什么是IR?IR即中间表示(Intermediate Representation),可以看作是一种中介的数据格式,便于模型在框架间转换。我理解可以表示深度学习计算
原创
发布博客 2021.10.21 ·
388 阅读 ·
1 点赞 ·
0 评论
加载更多