排序:
默认
按更新时间
按访问量

Intel X86 优化指南阅读笔记--通用优化(后端)

OPTIMIZING THE EXECUTION CORE 通用的优化准则来充分利用超标量cpu的并行性: - 遵循前端优化准则,最大化译码带宽和前端吞吐量。 - 最大化寄存器重命名带宽。本文将讨论包括如何正确处理partial registers, ROB read ports and...

2018-09-04 11:00:02

阅读数:35

评论数:0

Intel X86 优化指南阅读笔记--通用优化(前端)

PROCESSOR PERSPECTIVES 以下优化建议,在不同微架构下收益差别较大: 指令译码的吞吐量很重要。利用好decoded ICache,Loop Stream Detector和macro-fusion能进一步提高CPU前端性能。 充分利用好4个译码器来产生代码。利用好micr...

2018-08-26 21:31:00

阅读数:149

评论数:0

Intel X86 优化指南阅读笔记--基础体系结构

Intel Sandy Bridge Microarchitecture 流水线 前端按顺序取指令和译码,将X86指令翻译成uop。通过分支预测来提前执行最可能的程序路径。 带有超标量功能的执行引擎每时钟周期最多执行6条uop。带有乱序功能的执行引擎能够重排列uop执行顺序,只要源数据准...

2018-08-24 09:43:29

阅读数:140

评论数:0

坑:Centos7.4 升级内核到4.1X后出现glibc的ABI不兼容问题

Centos7升级了最新4.14内核后,发现当内存不足,发生oom killer后。如果杀死的进程是调用pthread锁的多进程程序,恭喜你,被杀掉的进程不会释放锁,华丽的死锁拉。 Centos7 + 原生内核没问题,Fedora 27 + 4.14内核也没问题。Centos 7 + 4.14内...

2018-06-06 10:15:58

阅读数:124

评论数:0

Glibc的一个潜在的坑

问题描述: https://sourceware.org/ml/libc-help/2016-09/msg00000.html 为什么会出现内存无法真正回收给系统呢?答案是永远不会回收给系统。 当需要分配的内存小,达不到需要走mmap内存模式时,glibc会用brk()分配内存,如果brk(...

2018-06-06 08:12:36

阅读数:150

评论数:0

在ICT求学时最大的痕迹

好好的新书被我看成了这样。

2018-06-03 09:52:00

阅读数:116

评论数:2

学生时代的Linux内核读书笔记

翻硬盘时找到了2007年时阅读Linux内核的读书笔记。没想到那时居然对着英文原版书居然总结了那么多内容,加起来快300页了。他们见证了我苦逼的研究生生活。 工作后都忘记了有写过这些笔记。传上来希望对学弟学妹们有所帮助。可以随意修改和转载。。。 博客不能上传附件,只能传到csdn的下载中心了,系统...

2018-06-03 06:20:13

阅读数:170

评论数:0

(转载)浅谈高端CPU Cache Page-Coloring

cache利用是提升网络处理的永恒的话题。老文章了,需要好好琢磨下。http://www.valleytalk.org/2011/04/11/

2017-06-15 12:35:13

阅读数:447

评论数:0

《What Every Programmer Should Know About Memory》学习笔记(第三章)

概述对网络包处理中,提升性能的关键在于CPU Cache的利用情况。因此,从体系结构角度深刻理解Cache的原理,对写出高性能数据包处理程序是必要的理论基础。这篇文档写于2007年,有点久远,但是其描述的原理仍然适用现在的主流CPU。我将从程序员的角度总结该文章的要点。 CPU Caches L1...

2017-05-19 15:56:57

阅读数:1173

评论数:0

思科VPP源码分析(dpo机制源码分析)

基本概念VPP的dpo机制跟路由紧密结合在一起。路由表查找(ip4_lookup)的最后结果是一个load_balance_t结构。该结构可以看做是一个hash表,里面包含了很多dpo,指向为下一步处理动作。每个dpo都是添加路由时的一个path的结果。 dpo标准类型有: DPO_D...

2017-02-27 22:46:53

阅读数:1562

评论数:1

思科VPP源码分析(Bihash分析)

基本概念VPP里的Bihash全名为Bounded-index extensible hash。它的最大特点是,在查找时是无锁并且线程安全的。修改操作之间会有互斥,但是修改操作时仍然可以进行查找操作。 vpp里的Bihash优化成了两种,bihash_kv_8_8和bihash_kv_24_8,区...

2017-02-14 16:11:00

阅读数:1543

评论数:0

思科VPP源码分析(feature机制分析)

基本概念早期的VPP本身的node框架比较固定,各个node之间逻辑连接已经固化。为此新版本增加了feature机制,每个feature是一个node,用户可以启用/停止某个或某些feature,也可以自己写插件,把自定义node(自己的业务逻辑)加入到指定位置。 vnet_feature_arc...

2017-01-29 09:42:36

阅读数:2215

评论数:0

思科VPP源码分析(路由框架分析二)

基本理论

2017-01-10 07:47:29

阅读数:2076

评论数:2

思科VPP源码分析(路由框架分析一)

基本概念VPP作为思科开源项目,路由系统基本继承了Cisco快速转发(Cisco Express Forwarding,CEF)设计思路。作为理解VPP路由源码第一步,首先要掌握起理论基础。 - Cisco Express Forwarding: 内容摘自:http://www.epubit....

2016-12-19 12:18:13

阅读数:3719

评论数:0

DPDK ACL算法介绍(转载)

http://www.jianshu.com/p/0f71f814d73ehttp://www.jianshu.com/p/0f71f814d73e关于dpdk acl算法分析,以后慢慢琢磨。

2016-11-21 20:24:53

阅读数:1438

评论数:0

思科VPP源码分析(trace机制分析)

基本概念核心函数

2016-11-17 15:01:10

阅读数:1370

评论数:1

思科VPP源码分析(CLI支持分析)

基本概念 核心函数

2016-11-15 15:38:39

阅读数:2392

评论数:0

思科VPP源码分析(多线程支持分析)

基本概念 核心函数

2016-11-12 11:51:20

阅读数:2289

评论数:0

思科VPP源码分析(ethernet node分析)

基本概念核心函数施工中。。。

2016-11-10 09:38:04

阅读数:2119

评论数:0

思科VPP源码分析(dpdk node分析)

VPP使用者几乎都会使用dpdk node作为收包驱动,本文将分析其源码。- 基本概念vlib_buffer_t dpdk收到的数据包用rte_mbuf结构描述。vpp为了兼容其它收包node(netmap,pcap等)改为使用vlib_buffer_t来描述数据包。 vlib_buffe...

2016-11-07 15:29:03

阅读数:3777

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭