![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
算法优化
文章平均质量分 90
crystal__behappy
这个作者很懒,什么都没留下…
展开
-
OpenMP中几个容易混淆的函数
[转]OpenMP中几个容易混淆的函数(线程数量/线程ID/线程最大数)以及并行区域线程数量的确定说明:这部分内容比较基础,主要是分析几个容易混淆的OpenMP函数,加以理解。(1)并行区域数量的确定:在这里,先回顾一下OpenMP的parallel并行区域线程数量的确定,对于一个并行区域,有一个team的线程去执行,那么该分配多少个线程去执行呢?OpenMP的遇到parallel指令后创建的线程team的数量由如下过程决定:1. if子句的结果2.num_threads的设置.转载 2021-10-12 10:51:35 · 329 阅读 · 0 评论 -
python使用intel 编译器自定义包
python上层应用使用自编译的代码方式:(1)在tensorflow中,当op满足不了我们的需求或者需要自定义op时,可以在tf提供的接口user_ops中export出来方法,在编译tensorflow阶段,可以将自定义的op导出,在python阶段通过tf.user_ops.XXX方法名调用;(2)使用python自定义包,通过pip install 来安装,之后采用跟tensorflow相同的方式引用即可。python自定义包需要包括setup.py、__init__.py、需要编译的c++原创 2020-05-09 11:13:52 · 626 阅读 · 0 评论 -
使用intel tensorflow量化NLP之类的模型
在NLP之类的深度学习模型中,用的最为广泛的两类模型是bert模型和transformer模型,两者都是采用Attention的机制实现的。由于这两类模型处理的时候都比较长,所以在准确率上升的同时,平均延时也随之上升了,对于这两类模型的优化成为了重点,目前针对NLP的优化主要停留在底层的tensorflow优化,但是往往优化的操作比较有限,并且提升的空间并不大。所以进一步考虑对NLP之类...原创 2019-08-27 10:25:06 · 292 阅读 · 0 评论