博客专栏  >  架构   >  18-645:How to Write Fast Code

18-645:How to Write Fast Code

CMU 18-645课程的总结和个人做的项目。主要从多核(OpenMP)、多处理器(CUDA)和分布式系统(Hadoop)对矩阵乘法和K-均值聚类进行加速。以及这门课程我们组做的项目进行一个总结。

关注
0 已关注
9篇博文
  • git的小知识

    1、提交改变: commit -a -m “comment” 2、提交新版本: git push origin master 3、看过去的提交历史: git log 4、看过去的提交历史并...

    2017-02-13 10:16
    179
  • ManyCore Programming GPU: CUDA Part

    介绍 矩阵乘法 原始版本 改成CUDA版本 使用shared memory 使用内存对齐 B cache blocking 去掉条件判断介绍18-645:how to write fast code中...

    2017-02-19 12:47
    659
  • 分配内存按需要对齐

    在VS里面,使用_aligned_realloc和_aligned_malloc进行内存对齐。 https://msdn.microsoft.com/zh-cn/library/y69db7sx(...

    2017-02-15 12:00
    238
  • Multicore Programming SIMD

    SIMD介绍 SSE的指令Streaming SIMD Extensions 函数命名 举例应用SIMD介绍single instruction multiple data就是一条指令执行很多个一样的...

    2017-02-13 11:00
    402
  • Multicore Programming OpenMP: Part 2

    CPU无法达到peak performance的原因 矩阵乘法的讨论 介绍 理论基础 块状矩阵计算 优化技巧 代价模型 strength reduction 内联函数inline f 循环展开loop...

    2017-02-03 23:28
    653
  • Multicore Programming OpenMP: Part 1

    多核共享内存平台multicore shared-memory platform OpenMP介绍多核共享内存API OMP介绍parallel region 创建线程 同步synchronizati...

    2017-02-01 13:15
    706
  • 如何写出运行速度更快的代码:软件篇——加速k均值的代码(OpenMP)

    介绍 并发concurrency VS 并行parallelism 解决问题的步骤 了解当前状态 内在表示 找到替代办法 从替代办法中选择符合的介绍之前的硬件篇: http://blog.csdn.n...

    2017-02-12 20:53
    828
  • 如何写出运行速度更快的代码:硬件篇

    介绍 为什么需要更高效的代码 加速的意义 硬件平台 multicore vs manycore Instruction level parallelism SIMD Simultaneous Mult...

    2017-01-25 11:37
    701
  • 为什么要进行代码加速?

    背景 自动优化 总结How to write fast code不是教你如何写代码更快,而是教你如何写更快的代码。首先我们需要了解为什么需要进行代码加速?要写一些并行的代码进行加速?背景 从这幅图可...

    2017-01-17 10:51
    264
img博客搬家
img撰写博客
img发布 Chat
img专家申请
img意见反馈
img返回顶部