这也是一篇长文。
Build a Large Scale Cloud Native CI/CD System Based on Tekton
![4ad5e04bb9d555a7319a8dfc298c228d.png](https://i-blog.csdnimg.cn/blog_migrate/f5bbf7e726968deb3a79bbfa965a58b9.png)
原子能力非常优秀了。
![a2ad0b0a218776266ef23c465bf9c0f2.png](https://i-blog.csdnimg.cn/blog_migrate/a1410cc121540cbe968af70a51759584.png)
基于 Tekton 做扩展。
![b0d7996cac3539a00bb846001e10cf51.png](https://i-blog.csdnimg.cn/blog_migrate/34db977273ebc28d6e42a4eb06614d87.png)
![d755ad70618946f8ad38f886b390b1a0.png](https://i-blog.csdnimg.cn/blog_migrate/ac65e07b9bc9f746edb76001899e03c9.png)
cp-controller 支持了 sharding。
![b07e5c23926ff1ee3138259f06178d4a.png](https://i-blog.csdnimg.cn/blog_migrate/96b78e0048cd7123038dd9ed3313519e.png)
解决 Etcd 性能问题的方案就是不用 Etcd,改用 database。
Improve FUSE Filesystem Performance and Reliability
这个 Session 也很硬核。
![f7aed4a8851effacd007b1a6b1feca53.png](https://i-blog.csdnimg.cn/blog_migrate/3167d4aea460c1f8c6e8f98696e2a4ba.png)
![4a590c5ec4b66fd8f5d75e452cf4bbb4.png](https://i-blog.csdnimg.cn/blog_migrate/4031b977e2a172570560fa8f9cb629de.png)
FUSE device driver 会有额外的数据拷贝和上下文切换,是造成性能损耗的关键因素。
![8b810c69f86d0ac0c8739450356af70a.png](https://i-blog.csdnimg.cn/blog_migrate/409a71ec65e85db39754b6d34cae1310.png)
![d1995a3559180dd6dfa2eb203649411d.png](https://i-blog.csdnimg.cn/blog_migrate/07cc9597ad40325583b59b2fa08b480c.png)
![c4da465894f7051e0ef309f2dde2c4cd.png](https://i-blog.csdnimg.cn/blog_migrate/05fd7226973dc3c98b7754a03481fa6b.png)
![95c251f225dd9575d48fa7e8b4318e84.png](https://i-blog.csdnimg.cn/blog_migrate/53c338a3b4705259853aef6a936ef3ff.png)
![9e2bba3f30eb8746583598bb2dd630e9.png](https://i-blog.csdnimg.cn/blog_migrate/39e9a4e8b25520333a55e38c1fd78a3b.png)
FUSE FD Passthrough 这块参考 PPT 中的链接一起看会好一点:https://lwn.net/Articles/843093/
![78b509206424ca7c02cc871cfbf840b1.png](https://i-blog.csdnimg.cn/blog_migrate/dc6332ed9a1aeaba08b46b6ff1e0d0ea.png)
![44279c488dc7f5530ea0c835ccf6ac7b.png](https://i-blog.csdnimg.cn/blog_migrate/df948711395c33eaf74e95dc54b9d551.png)
![61b175cffc294d3e52b402adfbc003df.png](https://i-blog.csdnimg.cn/blog_migrate/343409e850d6072c606de0b70be0d0a2.png)
![a0e33ab7b1c9c0e8f80c06cbbc017ffd.png](https://i-blog.csdnimg.cn/blog_migrate/b0fa4ee2235759992a6bb0d23e291349.png)
![5cd770a09bf3fd61f478804c4858d3ab.png](https://i-blog.csdnimg.cn/blog_migrate/0ff08339f2612e5aab2e5b460325518f.png)
![db0ae6addc95f799ca6a084fc8fbe5f7.png](https://i-blog.csdnimg.cn/blog_migrate/a83609c6fb86bfc0d075888110b0a93b.png)
![80969ea125706d43c62b5d9c947c005e.png](https://i-blog.csdnimg.cn/blog_migrate/98fa07b5e6cd562a72065aeaa69defa9.png)
通过 fuse_conn
、fuse_dev
实现 failover。
![ed8a9d953aa2a2337afb1089ebc20433.png](https://i-blog.csdnimg.cn/blog_migrate/421c0a1a2e31b4e32d64c57068bc1837.png)
![4d4a75cf0620d9de54b7b7b85f4a8f22.png](https://i-blog.csdnimg.cn/blog_migrate/e6eabdf7c61833ab329a82530320f00b.png)
通过 requeue 操作防止在 failover 时,FUSE server panic,造成正在操作的文件发生异常。
Chaos Mesh 2.0 Make Chaos Engineering Easy
![fdea994d1ee10b685f30c89a531b666f.png](https://i-blog.csdnimg.cn/blog_migrate/8c0ecf2cb38ae949950819620a63d74e.png)
终于有 Workflow 了。
![d478ed8354d5e4c9da47bec97694a5ed.png](https://i-blog.csdnimg.cn/blog_migrate/d3ae79064bd9fe8edab5ef9bb4e1f9fa.png)
![edabb6c1deaf2d15c72baa1a7d1bdd89.png](https://i-blog.csdnimg.cn/blog_migrate/55587d9e8898d2207aad95407cb5e767.png)
那么,问题来了,刚执行了主机关机的 Chaos 实验,如何开机呢?
![3f456e014f028afca4eea20c290b26e4.png](https://i-blog.csdnimg.cn/blog_migrate/7338963f000c6eb00a66fb970a1c70df.png)
Run wasm applications on kubernetes edge cluster
K3s + Krustlet,有点非主流啊。
![6c41b597f8fd651c83f28ca354615932.png](https://i-blog.csdnimg.cn/blog_migrate/25c69c07927d7d596a3a52c3ad82de92.png)
Deep Dive CRI-RM-based CPU and NUMA Affinity to Achieve AI Task Acceleration
不得不说 Intel 这个东西设计的可以的。上篇还说 Kubelet 应该出个插件机制来解决这种问题,Intel 就换另一个思路解决了。
![c7b4eae07966e504dddd29c2b4a7377d.png](https://i-blog.csdnimg.cn/blog_migrate/1ef122cbf22f4c8a580caa37c4b07dc1.png)
![f2ff66d9efe24a1b5216609ef3fca0a4.png](https://i-blog.csdnimg.cn/blog_migrate/d68f06eb130cd5bf0fa9bfd22488bc59.png)
![f6b9ca491e4e64457046f7eb9f8eb22e.png](https://i-blog.csdnimg.cn/blog_migrate/ae79dc7cb296bbdc9d78ffe70a4d3d22.png)
“吵闹的邻居”经典问题。
![2c9d9b4e3c14cdeceb7ae8c0608b8fce.png](https://i-blog.csdnimg.cn/blog_migrate/4e81a46a2804908a6a289ca490892ab2.png)
![2f16b0f9796aa647791d3d71619c7db4.png](https://i-blog.csdnimg.cn/blog_migrate/f6d796ce6befd92a98f10c03adf96dbc.png)
![a0871e544b49210805d67e8d289994ad.png](https://i-blog.csdnimg.cn/blog_migrate/614c3ec6cc63361a1d46dafd709a844c.png)
还支持了傲腾。
![7603f1a403c9d0344eaa5a2df0230d0f.png](https://i-blog.csdnimg.cn/blog_migrate/4e7566997c4711cadc24d5e0390b1f0d.png)
![3da75987718c29a64d750e4325adca5c.png](https://i-blog.csdnimg.cn/blog_migrate/a2a0b6a5ba7236131c70a30a04c89acc.png)
在每个节点上做了小粒度的 CPU 池化,将 CPU 分成能共享和不能共享两类。
![5ee032a796a20f481254633e5d38c202.png](https://i-blog.csdnimg.cn/blog_migrate/3f3b3a764726899a239748a53001adbb.png)
![bb5c80c9203598a540cd178e743408f2.png](https://i-blog.csdnimg.cn/blog_migrate/468713d94d7404428e7a20d92934f052.png)
![11f083a24fcc365cb362657049d7304d.png](https://i-blog.csdnimg.cn/blog_migrate/ffbed6bedfd0a982bed401483f2ef223.png)
![f7bdb0293aa50fa39aabd7928bce272b.png](https://i-blog.csdnimg.cn/blog_migrate/1d696622f189732644715867427cddcc.png)
![d3d70ae432e716dd75be3143da42eff7.png](https://i-blog.csdnimg.cn/blog_migrate/af0a36ff731c49ff4dfe561c0a0e6334.png)
![d8dc88bd9d2e11ea088a3293e08325cd.png](https://i-blog.csdnimg.cn/blog_migrate/8f18df75b3fdde3636e4563c5c8d9f35.png)
![1f2a365ed3a5b326399ed442f80eaa01.png](https://i-blog.csdnimg.cn/blog_migrate/dca8d3e0f0e66c24dc6d0927050a8616.png)
项目开源仓库地址:https://github.com/intel/cri-resource-manager
有个 PDF 可以参考:https://www.intel.cn/content/dam/www/central-libraries/cn/zh/documents/inspur-aistation-unlocks-compute-with-intel-cri-rm-for-cpu-affinity-scheduling.pdf
BFE Modern Layer 7 Load Balancer for Enterprise Application
BFE 支持了 Ingress。
![7fe1581bcfdeab644704d650c5c67b91.png](https://i-blog.csdnimg.cn/blog_migrate/86db819447b0da9ddc13c8b90fa29fc3.png)
![08373da42162474c64046f04feba2f31.png](https://i-blog.csdnimg.cn/blog_migrate/4dab5b4294cae93421ae0e7a7ac25e83.png)
控制平面也开源了:
https://github.com/bfenetworks/dashboard
https://github.com/bfenetworks/api-server
https://github.com/bfenetworks/conf-agent
BFE 没什么好说的,用就对了。
Best Practice DNS Failure Observability and Diagnosis in Kubernetes
![f1f074905b193f2a3f84452864171c10.png](https://i-blog.csdnimg.cn/blog_migrate/a9a25388da8d33e99273d4f676937b79.png)
![61679af4c7e9be02d0de69983c505db9.png](https://i-blog.csdnimg.cn/blog_migrate/ac30e9fc7cbb2f5d3bc4839dded15f22.png)
![ec2aa79caa65845cf33154862a16047e.png](https://i-blog.csdnimg.cn/blog_migrate/1fd58e3c90979a9e2e54edd4444d39ee.png)
![cabbd6f0524b5023d4b4ae2e179eeaf5.png](https://i-blog.csdnimg.cn/blog_migrate/83126eeb190ded22e405619301030e58.png)
![88ca440716741ebd6971f644a63f4ff2.png](https://i-blog.csdnimg.cn/blog_migrate/0082e9c4fe3a5e50b45e4d67fe6a74b4.png)
![f3f8c4e17d837d45ba7f8fc487b3e07a.png](https://i-blog.csdnimg.cn/blog_migrate/7ad30365ab2c41cc43f1b8eb38494f4f.png)
都是常见问题,基本都遇到过。
可以配合官方文档食用:https://kubernetes.io/zh/docs/tasks/administer-cluster/dns-debugging-resolution/
服务端诊断:
![3c539d0c9d5072a5d26ac8f2aaef7a38.png](https://i-blog.csdnimg.cn/blog_migrate/396ad7e088773242a638ec8c96f85428.png)
![53e7363819cee311554d538d163ca364.png](https://i-blog.csdnimg.cn/blog_migrate/29085b1e72e0bce1fcc3a9beea881dec.png)
![28e11c1ad42db481e4bc75b20e10070b.png](https://i-blog.csdnimg.cn/blog_migrate/656b1f97989ba7dde3807ee6acc16061.png)
![02f858568741406f109572387b1a385a.png](https://i-blog.csdnimg.cn/blog_migrate/ad085586440e7794d2c13cecbc3b065f.png)
dnstap 插件比较有用。
客户端诊断:
![e6aac9ebb4f887c48d98bf2df2ee5571.png](https://i-blog.csdnimg.cn/blog_migrate/fa563e601c948f1dc2e8bfff6cdc90b1.png)
https://gist.github.com/xh4n3/61d8081b834d7e21bff723614e07777c
果然,也提到了 pwru。pwru 才是 YYDS。
pwru 刚开源没多久:https://github.com/cilium/pwru
![85654fda5e54b4ecf23faa7813d2657a.png](https://i-blog.csdnimg.cn/blog_migrate/9d3148e762d1cbb0b3dfb3e1e1876c33.png)
Packet, Where are you 的视频讲解:https://www.youtube.com/watch?v=NhlR11Fp69g
![3b69d7dc30b2574659af522380c32c7b.png](https://i-blog.csdnimg.cn/blog_migrate/9c5d056161b3e9603c8bd5245e16fef8.png)
![8ced39079b4d1aaaf70d524f277b459b.png](https://i-blog.csdnimg.cn/blog_migrate/602c04974684fa341ef3ac7f1183aa24.png)
More Secure and Confidential Computing on Linux with Nitro Enclaves
虽然也是打广告,但 Nitro Enclaves 这个东西还是挺有意思的。
![2fa4d72fdd546473dd59dd10924b0b0e.png](https://i-blog.csdnimg.cn/blog_migrate/b4619f0d0dc4e194424a19e8602c89e4.png)
![ac9a19f961e46686807fcfd0aa31c77a.png](https://i-blog.csdnimg.cn/blog_migrate/7bd4b2a8f3e3527bfeffb62c0b186006.png)
![a2ed8dbf58a14502874dd26ff5e08451.png](https://i-blog.csdnimg.cn/blog_migrate/bebd0f6f5754cb97b5f79dda70f2d1ef.png)
连 SSH 都没有。
![df1f2111cfe1a7d65025f188d8ed87a9.png](https://i-blog.csdnimg.cn/blog_migrate/abab07a5b904291a041a147ac3f17677.png)
![37beea821f4a7b9122951b68433c09d5.png](https://i-blog.csdnimg.cn/blog_migrate/31fd384ddef1bf0d24c937c4412b5bbc.png)
Exploring Cloud Native Big Data Platform in SPDB
一个新项目 Piraeus Datastore:https://github.com/piraeusdatastore/piraeus
DRBD 是老技术了,没想到在 K8s 场景下还能接着用起来。
DRBD 是一个基于软件的、shared-nothing、复制机制的存储解决方案,在主机之间镜像块设备(硬盘、分区、逻辑卷等)的内容。
real time,数据的修改会被实时同步
transparently,应用程序不需要感知数据存储在多个主机上
synchronously or asynchronously
DRBD 构成了一个虚拟块设备的驱动程序,DRBD 位于系统 I/O 堆栈的底部。DRBD 无法识别文件系统是否损坏。
![e2f7a8e577051914656bde3a36adfdc5.png](https://i-blog.csdnimg.cn/blog_migrate/132d12aaef427991ebff9e4933981ed5.png)
Vivo's AI Computing Platform on Kubernetes
拼积木大合集,没有太多新意,但都非常落地,遇到了大家都可能会遇到的问题,也有一些通用的解决方案。
![d2a16e6e914b55761a1f995549f32018.png](https://i-blog.csdnimg.cn/blog_migrate/685499813cd481ef5b0c36d966af58c1.png)
![2e9762954696028608facb789ec1132a.png](https://i-blog.csdnimg.cn/blog_migrate/a2a4b067f264c684611dd44f5369d553.png)
都是老生常谈的问题:
Ring Allreduce
任务调度顺序
![aa8f450960c1734faa979b570ee7caf1.png](https://i-blog.csdnimg.cn/blog_migrate/fc7b4314b213cb1a71d1d5a273096d3f.png)
![eb2e83a3cc2d3c442e490e7435d26639.png](https://i-blog.csdnimg.cn/blog_migrate/d8e88e353fdda599ee3ed46129a13f05.png)
![b8b4171ecca235e621f32b0f461f65aa.png](https://i-blog.csdnimg.cn/blog_migrate/c0721d7699ee69e4447a9f804b24715f.png)
![7c73f1eda6061c1685f99b96b7c264de.png](https://i-blog.csdnimg.cn/blog_migrate/7106abe2f2f77e169fea759d05af732b.png)
![d781aa4a0281e39175a023bf82c7bced.png](https://i-blog.csdnimg.cn/blog_migrate/ce044ea9ba1275be56aaf80e7c69ab33.png)
KEDA 其实也问题多多,即使自己写插件也只能解决一部分问题。
![c57bc7381878317a2808cf2204b321ed.png](https://i-blog.csdnimg.cn/blog_migrate/4fce5febd080cb45dcb6a87d9d54c81a.png)
VictoriaMetrics 才是 Prometheus 的最佳归宿。
![6c6851a83c270d499fa92abb568e3d14.png](https://i-blog.csdnimg.cn/blog_migrate/6eb9331a8937bfc3276ae5b99fc5cf53.png)
VK 问题也很多。
![755da772d693f466354d7500b5b6becc.png](https://i-blog.csdnimg.cn/blog_migrate/88bca463554337fafc05bd9c75248097.png)
DGL Operator Distributed Graph Neural Network Training with DGL and K8s
一个 Operator 从 0 到 1 的实现过程。
项目已开源:https://github.com/Qihoo360/dgl-operator
![18a1ef2ed3a1a98146c533b9676524b9.png](https://i-blog.csdnimg.cn/blog_migrate/1be1afb038e374a001b8b19c3f3e0ae0.png)
![f4c0e4b6a6d130fdb04c34cd8ed6aaae.png](https://i-blog.csdnimg.cn/blog_migrate/892996bd16df6c5529206ddfc7d13daa.png)
![de2a86635b33461910c0c51aac886565.png](https://i-blog.csdnimg.cn/blog_migrate/3fa863ffd822d0ebb044ffdc7a6ddf55.png)
![f651c10c373876fdfade34b2f0f22ef6.png](https://i-blog.csdnimg.cn/blog_migrate/a352c4c4d2ebf7bb26dd0d2db01ff36a.png)
![bb24a0f6b9e15bdc5ee8a3d0e73247c2.png](https://i-blog.csdnimg.cn/blog_migrate/be49c13337dbf59efcf1eccdf3593b9e.png)
![a6dbefb2d9c5cb9a952be1c5dc96c062.png](https://i-blog.csdnimg.cn/blog_migrate/b31060b94c49df37e529c7ea0ccd84aa.png)
![acbeb72e7fb3dbf8f09966e19137a3a5.png](https://i-blog.csdnimg.cn/blog_migrate/fd2cf9c3c84fde9f588cbe946a567c2f.png)
![f629a4723654420a17b88fcdf92fb53c.png](https://i-blog.csdnimg.cn/blog_migrate/bd2090cd1fdf1a37250805746271c381.png)
![6a65b7bf569c6716d254b5197a4e6052.png](https://i-blog.csdnimg.cn/blog_migrate/e45ef5a0573042a86c3362a5238f252b.png)
![7c167953fb9525316ee1ba9d22514eeb.png](https://i-blog.csdnimg.cn/blog_migrate/7320bde79631c3114d716d7e907a1227.png)
![4fb5eee8f39e062160e6df89ba7e9595.png](https://i-blog.csdnimg.cn/blog_migrate/2f6628b7b7b2400c26fd49f8cc3b468f.png)
![29fb1b9a35bbd0a918657bcad57480cf.png](https://i-blog.csdnimg.cn/blog_migrate/9c5c47197a773eb3ce2299b388625dbe.png)
![02d8943f8caca825558154c9d5bf034f.png](https://i-blog.csdnimg.cn/blog_migrate/ae3b97f991d459eeda953c76b931b8b0.png)
SuperEdge Promoting Kubernetes to the Edge of Technology Decryption
![2577115bc3fc1ca13d29b0a4cd2c220d.png](https://i-blog.csdnimg.cn/blog_migrate/c31ac540b22e55b82352c340aa145e02.png)
![8e2042ce6d88b5d316e505d60f52fb19.png](https://i-blog.csdnimg.cn/blog_migrate/1f2b059edcc8e8fc778c13696a4108f3.png)
![b2e5f3239b3d4d6b6f0ac36849cfa117.png](https://i-blog.csdnimg.cn/blog_migrate/0d6283d8d7c4f43d284b17c18aa3546b.png)
lite-apiserver 可以抽出来做通用的 apiserver 缓存层。
![0ba246b907d955753b36c2fe1b8eb341.png](https://i-blog.csdnimg.cn/blog_migrate/22506e352b2a66a9a6ebd15c989cfd85.png)
![4b550b1e16ca7350a06341afa4886f9c.png](https://i-blog.csdnimg.cn/blog_migrate/6203f5d9d78a828738ea4efa8d8dafd9.png)
![e4f6d726557d609cbbd55683e257f836.png](https://i-blog.csdnimg.cn/blog_migrate/a18fb1e64940db58be5f8e700bf9847e.png)
![c9099eda1bb5821c478152982f7e1c08.png](https://i-blog.csdnimg.cn/blog_migrate/ccc459bdd9c0e1830366a78252e13b37.png)
用 For 循环也能实现嘛。
![61d140fefa0a5c87c4bd16b8fc762378.png](https://i-blog.csdnimg.cn/blog_migrate/bacf436088490aa5bd3948637da8a6d6.png)
![230c4ff70c588d92da1437b92f15cfbe.png](https://i-blog.csdnimg.cn/blog_migrate/fb514d5012f114d3d441eab3b72e1894.png)
云边通信还需要看一下 fabedge。
BPF Introduction, Programming Tips and Tricks
科普型 Session。
![ccca407b00818286419cea887477c872.png](https://i-blog.csdnimg.cn/blog_migrate/a021a3ba5a7f9dd3a8ae325f2a6d7c34.png)
![99a77acf72ca8f14ff3fbb4d375edc89.png](https://i-blog.csdnimg.cn/blog_migrate/600c917b12d74c29d3159a0d1e7ed370.png)
![7cbd13e320f4ce00f40a8567e5d696c5.png](https://i-blog.csdnimg.cn/blog_migrate/cd44813a14db831a94d9860c5eb3a340.png)
![7e6d8532cb418742853a9a125a38e494.png](https://i-blog.csdnimg.cn/blog_migrate/596cf789edc5be3950380eef4933539b.png)
![ccdb7262f6ed36b8c4dabac2bdeb1ee4.png](https://i-blog.csdnimg.cn/blog_migrate/32c9cecbd9b4d9ec9c027a799bbdbbe1.png)
![879c8f715d261745134996ce76eb4f0a.png](https://i-blog.csdnimg.cn/blog_migrate/57af697628a30c9baffcfec61424ac5d.png)
![dc1e3b2281a2f4beec13bb6e8bc40a50.png](https://i-blog.csdnimg.cn/blog_migrate/7b434513da7a64640c0a4e9f22824bdc.png)
![c9098e33f409180ad547f01cf2e3cbf0.png](https://i-blog.csdnimg.cn/blog_migrate/cc1d4bf2735311aa043867b27dd8dad0.png)
![28470c4026024b1042513b5eb6a8adf7.png](https://i-blog.csdnimg.cn/blog_migrate/1f02c248702577bdf73ea7d82bca20c9.png)
![fefe00c46c96c829ba20714bdbc3f239.png](https://i-blog.csdnimg.cn/blog_migrate/509e5695a1b1cbe61d47288250aefe8f.png)
![7d1c80f018874af46ba7e4d814c763aa.png](https://i-blog.csdnimg.cn/blog_migrate/3bf901e17bf47a2a869638e75decba58.png)
![aea6129e94c30c305231981df42321c6.png](https://i-blog.csdnimg.cn/blog_migrate/9e660ba785dea3e61cd0e3f7ae1ffef8.png)
![8a1232bf130af5af2f925842c3935c13.png](https://i-blog.csdnimg.cn/blog_migrate/555b11e669a0e862fe506c7a438b2a05.png)
![3ed7f995e1360b56f4820165f8185d1f.png](https://i-blog.csdnimg.cn/blog_migrate/25bed11317c810538d321232fb6656e4.png)
![517a48a4711357a2311f24fbc27475a7.png](https://i-blog.csdnimg.cn/blog_migrate/f114e65fb8eae70c6c3292343c046425.png)
https://nakryiko.com/posts/libbpf-bootstrap/
https://github.com/libbpf/libbpf-bootstrap
https://github.com/iovisor/bcc/tree/master/libbpf-tools
https://nakryiko.com/posts/bcc-to-libbpf-howto-guide/
https://en.pingcap.com/blog/tips-and-tricks-for-writing-linux-bpf-applications-with-libbpf
BPF 看似很火,实则用不起来的原因:
内核版本太低 3.10,不会升级也不敢升级内核
对操作系统知识很陌生,hold 不住,只能用用现成的 BCC 之类的工具,或许也不用
Monitor mesh for edge clusters
![e7a653377089bcd573f95bcf0cd9366b.png](https://i-blog.csdnimg.cn/blog_migrate/6c881b337cfcafbf77ff6a0bfe4fd1e7.png)
思路不错,应该也适用于用户自定义/多集群/多云/混合云场景。
Data panel 相当于做了 sharding。
![6265fa73f6dd0ce90a4c472e779871fa.png](https://i-blog.csdnimg.cn/blog_migrate/d226f3536cd3e5617f334f84001ed834.png)
![66da8799879efc68a98f2b5c31fa3d4e.png](https://i-blog.csdnimg.cn/blog_migrate/ca4a832ea09e91c5c6b3787d5b8dfcbc.png)
![788452112e2010c61f1d9433b31e4133.png](https://i-blog.csdnimg.cn/blog_migrate/3ef172a9fd57c1a1351df9af5a48f1ea.png)
监控数据双写。
![c389f0e6c4c55a8ca29b1d76750a7b19.png](https://i-blog.csdnimg.cn/blog_migrate/35ccbaab08cdded27705fc18d9c0e80a.png)
InfluxDB 主备 + 分片。
十个分布式时序数据库,七个用 InfluxDB,两个用 TDengine,还有一个用 Apache IoTDB。
Keep Persistent Volumes Healthy for Stateful Workloads
![d50db5e9ca5dcd7dbb4638c2a395ef15.png](https://i-blog.csdnimg.cn/blog_migrate/367e4ba81e73d10ef6f12b40c427b0e9.png)
![fb86cb0a3b6a4c92125eeeeb1415fa53.png](https://i-blog.csdnimg.cn/blog_migrate/cd00567df07805636f57bef00ab9380d.png)
![6d2e4ae01577646e7fb83035b13ea45f.png](https://i-blog.csdnimg.cn/blog_migrate/10aad03f31ac35a18008679bc3c804dc.png)
![d2cfdcb23228870bf8c7796a40b3669e.png](https://i-blog.csdnimg.cn/blog_migrate/cc1b5a30998fee597210edca53ad10d9.png)
![a7c4d9e78066ee0140bada20e3573805.png](https://i-blog.csdnimg.cn/blog_migrate/2b158f28032d82ca3ebaf232cb0d96a3.png)
![81104797241f9cd97cc395c35fee871a.png](https://i-blog.csdnimg.cn/blog_migrate/bb060ce53f15262b30fce5f6bf3c0499.png)
![cf7cb924e2d546bb6047e2561faa8989.png](https://i-blog.csdnimg.cn/blog_migrate/a90df980320e2617fdae86fdd59044bd.png)
![96c55cac3cf2afcb6fe372bfd6b269c8.png](https://i-blog.csdnimg.cn/blog_migrate/809e6d315ba0c0cfd272be7a8ed95c67.png)
权限控制和操作滞后还是有必要的。
数据及时备份。不过 Velero 能做的很有限。
CSI Driver 平滑重启/升级也是个问题。
![c98f83737af67255f7dcd52d23ad1ff3.png](https://i-blog.csdnimg.cn/blog_migrate/d0e8a37d38e9bbe20dde49cc7935c15a.png)
![936fa33d9ed976482f81fd981e82e287.png](https://i-blog.csdnimg.cn/blog_migrate/5d971752ac1957e3f7ec1598ac9b4b64.png)
![715b64de769a43b5681ba3429cf0e981.png](https://i-blog.csdnimg.cn/blog_migrate/9ecf09725533a9420fabdf8e887b7b81.png)
但这种对客户端要求又很高,好多客户端实现上不是那么优雅。
上述图片来自:https://yunify.anybox.qingcloud.com/s/VkmOPXFNFVjMdhbfvbTfDjk1AZuwqXqO?type=file&id=4312918
Effective Data Access In Kubernetes for Data-Intelligence Application
Fluid,没有什么好说的,用就对了。
![0a87e6d07d0defa60ba26834dfaaa2e3.png](https://i-blog.csdnimg.cn/blog_migrate/a7361ad5ab5ab40627189f652e967018.png)
![aac6f9fcd2a72efea7a630269d452cbd.png](https://i-blog.csdnimg.cn/blog_migrate/43310af4c950fa38c76aaaca28dbf4e3.png)
期待 Fluid 能支持更多的 Runtime,为更多的数据调度场景服务。
Intro and Deep Dive into ChubaoFS
ChubaoFS 还是很好用的。
![32e371c33025eb475209a70d02647779.png](https://i-blog.csdnimg.cn/blog_migrate/59a726138880ec545c1ab06b01685f21.png)
![d33307923760fa388aac8d5cebe15d78.png](https://i-blog.csdnimg.cn/blog_migrate/a5e8c254d2f2e220a530726539cc9181.png)
![18d85f8d9cd5321dcdaeffd2d2e30b53.png](https://i-blog.csdnimg.cn/blog_migrate/cda3ba891e7b9fe129274eac5cba80fb.png)
![43c272baf5b33902e7c152d21c68dc50.png](https://i-blog.csdnimg.cn/blog_migrate/315f48afb734d75abb582ae62a1d2fb3.png)
![e82bae512a4fcea6491fda94f63fc68e.png](https://i-blog.csdnimg.cn/blog_migrate/954d9c522fb9d84d45542838f7bb7315.png)
![ca6aa80ac604389e3987dfa708e56386.png](https://i-blog.csdnimg.cn/blog_migrate/f795bc69342653093cb97998ddae5e40.png)
![9cc53f81c462425cc11739614582ff7c.png](https://i-blog.csdnimg.cn/blog_migrate/50cf24c730235918fa23e4b96a91c498.png)
如何让 FUSE 在容器环境下跑的又稳又好,应该是 FS 都亟需解决的吧。
Extend the operations for container runtime in OpenKruise
![0d27402c87c7e9d696090a834796520c.png](https://i-blog.csdnimg.cn/blog_migrate/038645f3c46817cc29ff6395f6cebf47.png)
![8066c757c5fbb4a51e133b51e129c391.png](https://i-blog.csdnimg.cn/blog_migrate/001df997453ad509f3b0a4079176b919.png)
尽在 Kruise-daemon。
不过感觉 Kubelet 真的需要插件机制。
![dea7afb0cdad31cd2bf0b2b13f53bef2.png](https://i-blog.csdnimg.cn/blog_migrate/0e50af5f658801d169e273915cf9058d.png)
![b5aae1bdb9b82f63ea09fd72337a02e0.png](https://i-blog.csdnimg.cn/blog_migrate/7722365d68f7a96503f3208cf7b6ec8f.png)
![658d0f6d6f045e41aae70bbda09337d8.png](https://i-blog.csdnimg.cn/blog_migrate/aa5e2bd977bb69c03f492ac438ad6481.png)
原地升级也是老牌需求了。
可以配合官方文档一起看:https://openkruise.io/zh/docs/core-concepts/inplace-update/
![2a3475a9a61953e9674cf1c4288a2b13.png](https://i-blog.csdnimg.cn/blog_migrate/4216f48ec14e8c14ccc3aa1d5a149858.png)
![f217f79fc05f2f4c458886dd7eef7eb1.png](https://i-blog.csdnimg.cn/blog_migrate/cc057cef23baf7095d94665fe6e8ddb0.png)
Protect your database workloads in K8s
Velero 相关的 Session。
![8fe3ef3f8ee8c8fa882feacaf729dfa0.png](https://i-blog.csdnimg.cn/blog_migrate/ae1f92893961062e3561451b23a182e8.png)
![d2a3a6b5abc6986fa5ffaa2b764b9ed5.png](https://i-blog.csdnimg.cn/blog_migrate/eef235fb3c9f2c6531a34e9b54bbace4.png)
应用的数据一致性,还是需要依赖应用自身啊。
![f8037e6f1b0127d1d08b2120f1347cb6.png](https://i-blog.csdnimg.cn/blog_migrate/e45d0585285e6594b0916896704d7af4.png)
![e67c46e512a5d4568a47a6c1db0b158a.png](https://i-blog.csdnimg.cn/blog_migrate/a1ff1df9e549789a4be6ba956d21de9c.png)
Amberapp 主要是为了解决 Velero hook 的局限性。
项目已经开源:https://github.com/jibudata/amberapp
现阶段支持:
PostgreSQL
MongoDB
MySQL
ML training acceleration with heterogeneous resources in ByteDance
![d96ee7f67e51bcc720c0ede476b6bdce.png](https://i-blog.csdnimg.cn/blog_migrate/0dc87e711e2f7984133506d8d326f21f.png)
![5b7ec5b61b3b89a227283288de8df437.png](https://i-blog.csdnimg.cn/blog_migrate/56a1a9e9455b3b2821b9b4e3e9357231.png)
![219ad272576b36a119c67912cc16c53e.png](https://i-blog.csdnimg.cn/blog_migrate/80ddb84217cf41b9e89efaa99c0fa000.png)
![028c1fabda83ca05aae4f4df3f638db5.png](https://i-blog.csdnimg.cn/blog_migrate/1e6d8461e536b85a60f34019811cadc1.png)
![fca48c1ca2d48719186f383aeb9f2bd8.png](https://i-blog.csdnimg.cn/blog_migrate/2028f1bf520cb8dde9a46fcde0ec4154.png)
![e718a1386bd8f337663ce9d8eda2a0d4.png](https://i-blog.csdnimg.cn/blog_migrate/8c6ea997e9cc3eda9e7264a145c76402.png)
如何实现分配 0.1 卡、如何做隔离没有展开讲(除 MPS 外)。
![564546923264107aabd7cfba1d33f6b3.png](https://i-blog.csdnimg.cn/blog_migrate/9763f4011a8e2cefa079b5b35f880154.png)
主要依赖 VK 实现。
![f863696714aee9e06d2d37ada08a6c9b.png](https://i-blog.csdnimg.cn/blog_migrate/9baa9e70c669e2dea9addcd51cb8a90d.png)
异构硬件的资源隔离与亲和性,包括异构的 GPU 网卡直通,应该是件有趣的事情。
![316e2171f17808edb218d44eb6ed88cb.png](https://i-blog.csdnimg.cn/blog_migrate/7d343a17d20adbd3c1f2f7a4dda899ec.png)
更丰富的调度策略。
想要性能好,还是得靠钱堆,感觉没什么黑科技呀。A100、V100、RDMA、智能网卡都需要钱,小公司根本玩不起。
Overview of CNI 1.0.0 and preview of CNI 2.0
![49db8698b753e0a7818cc45bb02f8214.png](https://i-blog.csdnimg.cn/blog_migrate/02ddf100d814fe5b8f0f0aaa1a9aa72c.png)
![c3e633e9f5c8e76cdce10161e9f8bfad.png](https://i-blog.csdnimg.cn/blog_migrate/a08345bc7f71182e2a5cf25436ea5056.png)
如果能在 2.0 改成 gRPC 会灵活很多。
![a43e4d184fb2223e187a55965fed3324.png](https://i-blog.csdnimg.cn/blog_migrate/60ff5b018a53399b07931b27c39be4bd.png)
![64c67726ba10d24a8450e6e1b6d8bb12.png](https://i-blog.csdnimg.cn/blog_migrate/70b7ef7e82d626ab3434ac9e59673db9.png)
![cd87b0f02529c62f9c6c057fcfb73380.png](https://i-blog.csdnimg.cn/blog_migrate/d60b99ca6b9a59ed4965fe7f1a527ff0.png)
![3f79d22a25a315c1bcf6a91beae4b385.png](https://i-blog.csdnimg.cn/blog_migrate/ef85b5215ca6973cd769c77dfd17f765.png)
![f61d667b7069e6fd8c559e05acb36996.png](https://i-blog.csdnimg.cn/blog_migrate/e1385b8aaaaaead787d2e46f21db3b3d.png)
![fce0c479dc9f011161af24667d73dd5a.png](https://i-blog.csdnimg.cn/blog_migrate/837f5844120779b83b6efdd5f4d77edd.png)
![f142a4afa04eae3b4f1f1d241429ebfa.png](https://i-blog.csdnimg.cn/blog_migrate/86cd65e1e32eae8d14cb1c801a026ced.png)
如果能解决中心化 IPAM、通用化多网卡配置就非常棒了。
![eaa40d07deaed1f44e741332bafd28cc.png](https://i-blog.csdnimg.cn/blog_migrate/6e670401521d08f4630909703d846f90.png)
![f894c55c26e7070c7cd0619262609b69.png](https://i-blog.csdnimg.cn/blog_migrate/cd351c9a1422f27dc8da84c2040c9a2e.png)
![1d7aa4401600722f4bd04443f1ba0fc1.png](https://i-blog.csdnimg.cn/blog_migrate/a1f4dedc4611bd27597c9047f3fcd2f0.png)
![be8d472ec46bc94298ea8ea4ce3f7070.png](https://i-blog.csdnimg.cn/blog_migrate/bd52f7f19fa526ef53c02a432abf9b9b.png)
又回到了 API First。
![7bce7e647390944cc452ffc4b4c73eba.png](https://i-blog.csdnimg.cn/blog_migrate/271beef981e8c25eb952c4cd34c3fbf7.png)
1.0 -> 2.0 能不能平滑升级是个问题啊。
![42f09d3fe0a812a9125c7e32cbe7ae84.png](https://i-blog.csdnimg.cn/blog_migrate/67eb4eaaa514cfacbd4bd373900c2d22.png)
![e2a68db55e9f8834361c394d5fecd82f.png](https://i-blog.csdnimg.cn/blog_migrate/a854eabbf5680ddd931a8912be88053e.png)
如何做到动态升级,而应用层无感知?
多租户如何做隔离?
Kubernetes SIG Storage Introduction and Update
![3f88c89a66a59be2d682fab392102219.png](https://i-blog.csdnimg.cn/blog_migrate/54b3aa757014d96981d1986cd78e8c84.png)
![f943be28c47d05fc1e0a4b5c466be067.png](https://i-blog.csdnimg.cn/blog_migrate/7b0116fe4be7026a3fd254cb36d75df1.png)
![f602ecb494f4c4bf3eb018a7d2a84d61.png](https://i-blog.csdnimg.cn/blog_migrate/71f9d6537cbbaf7d09b483fbcbfc15ab.png)
![bafd1a5816da10964b80554fa9db4eb3.png](https://i-blog.csdnimg.cn/blog_migrate/76b93d3f5f26a681393201281ed3ff92.png)
和 CNI 遇到了同样的问题,就是如何兼容厂商的多样性。
Heterogeneous multi-cluster full mesh communication practice
![b96340b5104326fde4e10823762eeac6.png](https://i-blog.csdnimg.cn/blog_migrate/d963585af900c78dd6d893cd5034da0a.png)
![b3a410455ba49e862a2c288d8f559344.png](https://i-blog.csdnimg.cn/blog_migrate/0234cea8118c9d367d24d1c80f3406ca.png)
![9840350a2911c814a6f705fdacae5853.png](https://i-blog.csdnimg.cn/blog_migrate/816fb2ab5c212fcc276af0ba3b17f4c2.png)
![e65e2d492ee5c0bd7ce21d5e16d65546.png](https://i-blog.csdnimg.cn/blog_migrate/71b1fc7d4db371335979816ca53cfc3d.png)
![7f7efc8e4b0091473a3d9e47aac545a0.png](https://i-blog.csdnimg.cn/blog_migrate/e8e5a8a23a85532b5eb56d096d072516.png)
![62431ee9594f92f8367a863d6dbcee2b.png](https://i-blog.csdnimg.cn/blog_migrate/6a8388fb6d3fa0cf8ab3f2ac10c77036.png)
![0b0590cd513320b903050ab5e1e9380b.png](https://i-blog.csdnimg.cn/blog_migrate/f7e620f376e051401a0ef0799dd3256f.png)
其他参考资料件:
https://github.com/antrea-io/antrea/blob/main/docs/design/ovs-pipeline.md
Antrea 架构详解 https://mp.weixin.qq.com/s/5KI3AXP5AWFE3lCJ7n-U5A
小总结
所有视频均可以在 CNCF 的油管 channel 上观看。
https://www.youtube.com/playlist?list=PLj6h78yzYM2PjmJ9A98QCXnMsmONhU--t