- 博客(1437)
- 收藏
- 关注
转载 朋友出了一本deepseek的“入门”书,必须支持一下!
出了一本《DeepSeek超级简单入门》,必须支持一下。画外音:30+高频工作场景,500+实践指导案例。- 自媒体创作者从创意到内容的全流程支持应用。- 与海绵音乐,剪映,可灵等工具结合的应用。DeepSeek超级简单入门》是本什么书?- 办公,教育,绘画,数字人等应用。2. DeepSeek提示词技巧;4. DeepSeek私有化部署;1. DeepSeek基本功能;,全民AI时代,真的来临了。朋友出书,必须支持一下。欢迎感兴趣的同学入手。
2025-04-19 23:58:09
29
转载 计算机,有哪些方向非常火,可后来却凉了?
网页三剑客(Dreamweaver,Fireworks,Flash)这个概念,对于那些从十几年前开始接触网页/网站制作技术的人,应该是无人不知无人不晓吧?计算机网络曾经是一个非常有价值的学科,由于有价值的问题被研究完了,所以后来没几个人学网络理论了。亲戚家的孩子计算机毕业,问我哪些方向火,我说后端,大数据,算法,AI... 他又问,哪些方向曾经非常火,可后来又凉了呢?我说不知道,但可以看看网上的讨论怎么说。现在一个人,门槛非常低,比Python还要简单,复制黏贴运行就可以,拖动几个图标就可以搞AI。
2025-04-18 23:43:55
43
原创 微信:群消息,我们绝对不可能丢!(第56讲)
对于一个群用户,在ta登出后的离线期间内,肯定是所有的群消息都没有收到的,不用对所有的每一条离线消息存储一个离线msg_id,3. 在消息msg_detail存储到群消息表后,不管用户是否在线,都先将msg_id存储到离线消息表里;对于离线的每一条消息,虽然只存储了msg_id,但是每个用户的每一条离线消息都将在数据库中保存一条记录,增加一个群消息表,用来存储所有群消息的内容,离线消息表只存储用户的群离线消息msg_id。1. 不管是群在线消息,还是群离线消息,应用层的ACK是可达性的保障;
2025-04-16 13:19:08
837
原创 北京小公司,月薪2W,属于什么水平?
而我,只是分享经验方法,牵引思考,自身表率实践,打辅助。职场心态,技术发展,管理转型,通用素质,晋升关键,跳槽面试,AI时代,第二曲线,人际关系,生活与健康...最后,问题转化为,要采用什么方式来解决技能提升,晋升涨薪,第二曲线的问题?还不妨看看一下,我是如何用这些方法,这些工具,来解决自己创业所遇到问题的。进行了多维度分析(时间,岗位,城市),全是我自己。北京,小公司,月薪2W,属于什么水平?问答,图文,活动,实践作业,直播...其次,我在想,你为什么会问这个问题。加入星球后,加我工作微信,我拉大伙进。
2025-04-15 21:53:59
420
原创 如果不试一试,你可能永远不知道,自己有多牛逼!
加入知识星球后,请在文章(就是本篇)评论“已加入星球”,24小时内我会加你微信,拉你入微信群。这一次,不再是我一个人单向输出,不再是大家“看”我的经验与方法了,更多的是,想让大家充分理解,这个社群是如何运作的,帮助职场人提升和进步的机制是什么。大家自己参与进来,借鉴我曾经验证可行的方法,自己去思考+输出+行动。(图文+直播):我的经验分享,我的深度思考+输出+行动分享;大家5天思考+输出了7W字,小伙伴们的执行力,远超我的想象。:针对大伙的输出,彼此反馈,互动,讨论;牵引社群内的小伙伴思考+输出+行动。
2025-04-14 11:57:56
416
转载 无法理解,为什么网上这么多人黑阿L出来的员工?(4500W+讨论)
一天不表演,不刷刷存在感那就全身难受。经常测试不同类型、不同产品、不同时段的内容,试图找出规律、对比择优。有个阿L的水友面试被歧视,在评论区吐槽,为什么网上这么多人黑阿L。好像只要演好了哪一幕神奇的戏,一切问题就都不是问题了一样。请通过以上两个案例总结出共性经验,或者比一比,哪个效果好。某次我绩效完成度200%,要我写经验、写方法、写展望。我直白点讲,阿L这家公司简直就像是一个精神病院,A产品,发布在B渠道,取到了C效果。D产品,发布在E渠道,取得了F效果。她:也行,B、C也是可以试的方向。
2025-04-13 10:07:15
182
原创 1亿数据量,uid分库,tid上的查询该怎么办?(第55讲)
按照uid分库,同一个用户发布的帖子落在同一个库上,需要通过索引表或者缓存来记录tid与uid的映射关系,通过tid来查询时,先查到uid,再通过uid定位库;1. 90%的tid请求,以及100%的修改请求,不能直接定位到库,需要先进行一次索引表的查询,当然这个查询非常快,通常在5ms内可以返回;在“1对多”的业务场景,使用“1”分库,在“多”的数据id生成时,id末端加入分库基因,就能同时满足“1”和“多”的分库查询需求。新的问题出现了:如果使用uid来分库,确保了一个用户的帖子数据落在同一个库上,
2025-04-11 18:54:54
890
原创 40岁创业做社群,我为啥不选择微信?
2. 建群简单,维护起来也更容易,每天发起一些主题讨论,让大家自由发挥;过了一段时间,发现好像没什么用,于是就折叠了。久而久之,用户就流失了。问答,图文讨论,深度思考实践作业,直播纪要,社群规划,福利发放。点进去微信群,99+的消息,扫了一眼,没有几条有价值的内容。对于我想做事情:帮助用户思考+输出+行动,帮助用户职场发展。其次,是信息干扰,也就是用户的“时间效率”。职场成长,用户需要:思考+输出+行动。我未来5年的事业,就在这个社群里。从走出校园,到架构师,到CTO。最大的原因,星球适合内容沉淀。
2025-04-11 18:54:54
456
原创 40岁,终于下定决心,创业做社群了!
从去年10月份开始,在家几个月,写文章/录视频,身边没了同事,一直一个人,人是社群的动物,我也需要与大伙交流;》所述,如果大家读文章/看视频只满足情绪,而没有改变,我能发挥的价值则太受限了呢?25年,我在想,如何。最重要的,我需要寻找一个未来5年,10年的重心,能够值得自己倾注精力去经营的事业。:自己每天的思考,零零碎碎,未必成体系,希望有个地方记录下来;,而非交流,评论互动效率低,很难双向高效互动;欢迎群志同道合的小伙伴,一同学习,一同进步。40岁,我创业了,一个人...行动类的活动,完全无法支持。
2025-04-10 18:42:58
402
原创 微信:我绝不丢离线消息!(第54讲)
例如,上述步骤第三步执行完毕之后(删除了离线消息),第四个步骤离线消息返回给客户端过程中,服务器挂掉,路由器丢消息,或者客户端crash了,那离线消息岂不是丢了么。这样的效果是,不管拉取多少页离线消息,如同在线消息的应用层ACK机制一样,离线消息拉时,不能够直接删除数据库中的离线消息,而。:先拉取各个好友的离线消息数量,真正查看离线消息时,才往服务器发送拉取请求。那么问题来了,B登录微信的时候,不止要拉取A发给他的离线消息,还需要拉取。问题又来了,用户B一次性拉取所有好友发给ta的离线消息,消息量很大时,
2025-04-10 18:42:58
732
原创 40岁,一个人创业第二天,很充实...
分享我的思考,我的破解工具,我的解题实践,我的行动与改变;牵引大伙一起思考,一起输出,一起互动,一起行动。如昨天社群介绍所述,社群里没有老师,都是伙伴,除非自愿,没人能逼我们思考,输出与进步。直播(微信群私域,没有回放),会调研大伙时间,满足多数票。实在错过,星球会有直播纪要。问题三:思考,输出,互动,作业,还要为社群做贡献吗?,众多主题,“技术发展”和技术强有关,大部分主题,都是通用的。4. 互动反馈:针对大伙的输出,欢迎彼此反馈,互动,讨论。,欢迎参与,欢迎思考,输出,互动,有文字必回。
2025-04-09 17:44:23
854
原创 40岁,我创业了,一个人...
大家思考+输出,这样下来,自己的经验和方法应该能或多或少复制一些吧,大家的收获应该比单纯的阅读更大一些吧。加入知识星球后,请在文章(就是本篇)评论“已加入星球”,24小时内我会加你微信,拉你入微信群,观点输出,日常讨论,提问回答(有问必答),福利发放(大会门票,技术书籍,行动营福利)另一方面,除了架构知识,自己在研发管理,技术战略,职场发展,第二曲线等很多方向上。首先,扫码加入知识星球,图文分享与深度思考实践,以及直播纪要都在知识星球里。之后的一段时间,写文章,录视频,疯狂的输出。
2025-04-08 18:35:58
993
原创 数据库与缓存不一致,你会怎么办?(第53讲)
(3+4+5)接着立刻一个读请求,读缓存,cache miss,读从库,写缓存放入数据,以便后续的读能够cache hit(当主库上发生写操作之后,从库binlog同步的时间间隔内,读请求,可能导致有旧数据入缓存。假如主从不一致没法彻底解决,引入缓存之后,binlog同步时间间隔内,也无法避免读旧数据。(7)通过工具订阅从库的binlog,这里能够最准确的知道,从库数据同步完成的时间;如此这般,至少能够保证,引入缓存之后,主从不一致,不会比没有引入缓存更坏。(1+2)先一个写请求,淘汰缓存,写数据库;
2025-04-07 08:11:01
926
原创 第7篇10W+,它来了...
这似乎是我,做的最长的一件事了。看了下后台数据,又有两篇9W+了,也有希望进一步突破。另外,大家建议的社群,预计4月份就能推出,大伙静候!有朋友问我:你这些10W+有什么共同的特点吗?图文里有扩展阅读资料,适合沉浸式阅读。《1000W延时任务如何高效触发?《如何高效管理100W定时事件?《架构设计中的100个知识点》《MySQL在线表结构变更》画外音:大伙帮忙一键三连。纯技术内容,无一例外。从20年开始玩短视频。
2025-04-05 18:26:47
532
转载 阿L的,凭什么面试官不要!(千万别被键盘侠们误导)
我弟弟毕业于电子科大,硕士研究生,计算机专业,毕业校招进入华W,工作5年后离职。张嘴闭嘴,给你来个行业黑话,什么“组合拳”,“颗粒度”,“势能”,“私域”...周报有个错别字,标点符号全是逗号,开会能喷半天,说这不是能力问题,是态度问题。阿L出来的人,搞技术的都没啥好说的,搞管理的不用处多久就能看出来他是阿L人,你跟他说假没用完,有计划要休假,他会跟你说谁谁谁假也没用完也没休假。请该请假就请假,一下班就回家,休息时间尽量不要联系,不要联系!按正常计划汇报进度,他说你这工作没变化,没起伏,不好向领导汇报。
2025-04-04 21:10:39
443
原创 MySQL主从,一定会不一致!(第52讲)
2. 将哪个库,哪个表,哪个主键三个信息拼装一个key设置到cache里,这条记录的超时时间,设置为“主从同步时延”;任何脱离业务的架构设计都是耍流氓,绝大部分业务,例如:百度搜索,淘宝订单,QQ消息,58帖子都允许短时间不一致。,说明1s内刚发生过写请求,数据库主从同步可能还没有完成,此时就应该。强制读主过于粗暴,毕竟只有少量写请求,很短时间,可能读取到脏数据。”,假设主从延时为1s,这个key的cache超时时间也为1s。,时延期间读从库,主从同步未完成,可能读到脏数据。
2025-04-03 08:15:53
1248
原创 据说,微信搞不定状态同步,才取消了“在线”的概念?(第51讲)
依然假设20%的用户在线,那么为了保证群友状态的实时性,每个用户登录,就要将自己的状态改变通知发送给20*200*20%=800个群友,N=800,意味着,uid-B状态改变时(由登录、登出等动作触发),服务端不仅要在缓存中修改uid-B的状态,还要将这个状态改变的通知推送给uid-B的在线好友。,是既能满足用户需求(用户感觉是状态是实时、一致的,但其实是进入群才拉取的),又能降低服务器压力。有童鞋问我说,听说QQ状态同步过于复杂,微信的架构师搞不定,才取消了“在线”的概念,是这样吗?
2025-04-02 08:15:49
795
原创 CTO问我,为什么不按照教材上的3NF来设计数据库?(第50讲)
数据的双写不再由服务层来完成,而是由线下的一个服务或者任务来完成,最常见的,就是利用DTS这类异步数据同步服务,完成数据的冗余。数据的双写并不再由服务来完成,服务层异步发出一个消息,通过MQ发送给一个专门的数据复制服务来写入冗余数据,如上图。1. 业务线返回成功时,数据还不一定异步插入到T2中,因此数据有一个不一致时间窗口,这个窗口很短,最终是一致的;2. 由于扫描的数据量大,扫描一轮的时间比较长,即数据如果不一致,不一致的时间窗口比较长;中,因此数据有一个不一致时间窗口,这个窗口很短,最终是一致的;
2025-04-01 08:11:09
975
原创 微信:我们绝不丢消息!(第49讲)
要想让发送方client-A确保接收方client-B收到了消息,必须让接收方client-B回复client-A一个消息的确认。发送方client-A生成一个消息去重的msgid,保存在“等待ack队列”里,同一条消息使用相同的msgid来重传,供client-B去重。一条“你好”的发送,分别包含上下两个半场,即msg的R/A/N三个报文,ack的R/A/N三个报文,这是IM系统中消息投递的核心。client-A发出了msg:R,收到了msg:A之后,在一个期待的时间内,如果没有收到ack:N,
2025-03-31 08:11:16
1258
转载 吴军,数学之美,90W册...(免费送一批)
两百年后,谷歌工程师用同样的理论设计网络爬虫——把整个互联网看作“超级七桥地图”,网页是“节点”,超链接是“桥”,高效抓取海量信息。刨开人工智能、语音识别、搜索等领域专家+原腾讯副总裁+风险投资人等头衔不谈,他还著有《浪潮之巅》,《计算之魂》,《文明之光》,《硅谷之谜》... 等耳熟能详的畅销书籍。书中剖析把每篇新闻转化为“关键词向量”,计算向量之间的夹角余弦值,相似度高的自动归为一类,如此一来,看似毫不相干的领域,就能通过向量计算实现精准分类。一本能让90万人发现数学之美,并爱上数学的奇书。
2025-03-30 19:39:23
588
转载 “万事俱备,就差一个写代码的了!”这个梗是什么意思?
于是托同事的朋友,也就是我的同学,找到了我,想把这个事情外包给我来做,我大概了解了一下需求:cms+众筹+crm+支付+产品wiki。已经和宇航局打过招呼了,也找到乘客了,你找两个航天专业刚毕业的把航天飞机做出来吧,样子嘛像美国那样两个翅膀的就行,第一期先不用考虑太多,火箭我们先买别人的,两个月够不够?下午去看房子,独栋的别墅价格还行,1000平方米的,门口有花园,能停车,折扣已经谈好且定下了。,一点点告诉我的合伙人们。,我看看了这行业还算不错,而且想来既然是同学介绍的,那应该还算靠谱,就答应先做做看。
2025-03-29 11:55:37
614
原创 微博网页端通过轮询收发消息,凭什么没有延时!(第48讲)
举个栗子,在火车上想上洗手间,挤到洗手间旁,却发现洗手间有人,于是你只能回座位继续等。过了N分钟,又朝洗手间的方向挤过去,却发现洗手间还是有人,又只能回坐等。浏览器与web-server之间将永远有一条能够接受服务器通知的专用消息连接,以此,来保证WEBIM消息收发的绝对实时性。,某一时刻刚拉取完消息,突然又产生了一条新消息,这条消息就必须等到N分钟之后,下次轮询时,才有机会获取到。其中1和2是基于TCP长链接实现的,水友问的问题,主要是第三类,用HTTP短连接轮询的方式实现消息的收发,能否能保证消息的。
2025-03-28 08:48:07
1034
原创 我们绝不存储用户聊天记录!(第47讲)
画外音:此时黑客能截获密文,也知道是通过pk1加密的,但由于黑客不知道私钥pk2,是无法解密的。2. 根据客定理二,客户端和服务端提前约定的加密算法是不安全的,于是乎,黑客能得到加密算法;1. 根据黑客定理一,网上传输的内容是不安全的,于是乎,黑客能得到加密key=X;使用“具备用户特性的东西”作为加密密钥,一人一密,是安全的。但这仍不是最优方案。(公钥pk11,私钥pk22),并将公钥pk11,通过pk1加密,传给服务端,用户客户端内存是安全的,属于黑客远端范畴,认为是安全的。
2025-03-27 09:24:05
1234
原创 DeepSeek-V3模型更新,中文能力全面提升!
我要对调研AI大模型市场占用情况,请帮我系统性分析AI大模型产品,特点,用户使用情况(不限于这3点),并输出1000字左右的市场洞察报告,并为我选型AI大模型提供思路。我观那"卷王",形销骨立,却面带喜色,仿佛真得了甚么好处。一日深夜,我见他伏案而眠,电脑屏幕犹自闪烁,映着他额上"优秀员工"的奖状。工位上坐着一位"卷王",眼窝深陷,面色青白,十指却在键盘上飞舞如蝶。"九点上班,九点下班,一周六天",这便是"九九六"的章程了。我听了不觉骇然,细看那"卷王",果然脖颈后有缝合的痕迹,像极了流水线上返修的零件。
2025-03-26 09:12:52
1165
原创 DeepSeek为什么这么牛?幻方三大核心技术解密!
的显存中,完全可以装得下一个完整的模型和批次样本数据。因此,模型的加速主要是依赖大量的数据并行,模型,而在实际落地的环节中,模型代码往往面临着性能、准确度、资源等各种各样的问题。既然已有的分布式文件系统无法满足需求时,幻方就说,那我自己重写一个。如上图所示,对比传统通信方案,训练速度提高了多少,不用我多说了吧。画外音:记住重要的,忘记无关的,核心是根据重要性打分。幻方的软件架构优化三大核心技术,正好与其一一对应。),传递梯度到不同的显卡上,再各自计算总梯度。幻方软件架构三大核心技术,对于幻方的发展,对于。
2025-03-25 11:55:41
1727
原创 MySQL能不能双主?有没有一致性问题?(第46讲)
3. 两个主库设置相同的虚IP,在主库1挂掉或者网络异常的时候,虚IP自动漂移,备用主库顶上,保证主库的高可用;,可以实现在主库1出现问题后,延时一个时间,再进行主库切换,以保证数据一致性,但牺牲了几秒钟的高可用;2. 网络抖动前,主库1对上游提供写入服务,插入了一条记录,主键为4,并向备用主库2同步数据;在主键4的数据同步成功之前,主库2插入了一条记录,也生成了主键为4的记录,结果导致数据不一致。引发不一致的根本原因,是保证高可用的两个主库都对外提供服务,如果只有一个主库对外提供服务,
2025-03-24 08:05:33
1791
转载 我觉得程序员应该是最适合女性的职位,但是为什么女程序员那么少?
自己不上进还挑我代码的毛病,真正有本事的编译器不会挑程序员的逻辑bug,它们自己就会处理。不是女性做不好,而是这个行业本身就是为男性设计的,这个行业排斥女性,我们需要更多元包容的行业环境。我记得有个前端妹子曾经在我思路打不开时,建议我我在脑袋上抹开塞露,真TM奇效,当时思路就打开了。永远是我说什么就做什么,我说new一个对象它就只new一对象,我不说就不做,眼里没有一点活。朋友,将心比心一下,你摸鱼的时候很喜欢看别人在你的专业上拷打你吗?当初我不就是看你做事一板一眼有原则,觉得你有安全感才用你的吗?
2025-03-23 21:04:57
970
原创 DeepSeek开源周项目汇总,世界上从来没有什么腾空出世!
分级,冗余,就近,动态... 工程架构领域,哪有什么新鲜事,可偏偏在deepseek手里大放异彩。幻方官网,最显著的位置,说明了3FS是他们最大的三大核心竞争力之一。用通俗易懂的话,讲述DeepSeek开源的那些项目。DeepSeek开源一周,自己学了一个月。训练/计算更快,成本更低,模型迭代更快。但这两条路,都被死死的卡在漂亮国的手里。DeepSeek开源周,6天,7个项目。在这期间,收获最大的人,一定是我自己。,EPLB保证了GPU负载的均衡。先进的卡,不卖给你,谁叫你你落后。
2025-03-22 12:05:54
1425
转载 一个无价的DeepSeek闭门会,送10张门票,只要求能去现场
有个现场现场就有凑了几个合伙人,就准备开始干了... 这执行力,实在是佩服。无论是中国还是美国的大厂都没能形成垄断,创新往往出现在DeepSeek,Manus这样的公司;人才会向着容易实现梦想,有发挥空间,机制不僵化的地方流动,而并非大厂;画外音:例如这次,定向邀请TVP,上海长三角符合的就只有几十人了。:DeepSeek使得各岗位效率都极大提升,毕业的人会越来越多;举办方这周准备再筹办一场,我厚着脸皮,找举办方要了10个名额。1. 线下,名额特别少,官方一般不宣传;2. 邀请制,一般很难参与进去;
2025-03-21 08:10:47
1067
原创 架构师究竟要不要懂细节?分布式ID生成的6种方法(第45讲)
假设系统至少运行10年,那至少需要10年*365天*24小时*3600秒*1000毫秒=320*10^9,差不多预留39bit给毫秒数。每秒的单机高峰并发量小于10W,即平均每毫秒的单机高峰并发量小于100,差不多预留7bit给每毫秒内序列号。,1024台机器(服务)每秒能生活40Y的ID,完全能满足业务的需求。其四,每个机房机器小于100台,预留7bit给每个机房内的服务器标识。是一个本地算法,生成性能高,但无法保证趋势递增,且作为字符串。,例如:消息ID,订单ID,帖子ID...
2025-03-21 08:10:47
2051
转载 探秘!DeepSeek老板梁文峰,何许人也?
所以,这里还要劝一下我大A股民,一定要多努力,每天要勤奋地研判市场,分析公司,聚焦操作。上面提到,梁文峰在数学上有些天赋,本科专业又是电信,这两个东西一结合,最好的应用场景,就是股市。就一直以散户状态,在大A里面折腾,不断尝试用量化、自动的方式编写策略,去市场实践,看能不能有收益。,突破了一期的物理限制,算力扩容翻倍。梁文峰,1985年出生于湛江市吴川市覃巴镇米历岭村,家境普通,父母都是小学老师,没啥背景,核心管理层,自己不懂,又占着资源,又掌握着话语权,还不让懂的人上,这TM能搞得出来才怪!
2025-03-20 08:10:47
1207
原创 DeepSeek开源V3/R1架构设计思路,原来545%的利润率,它也只是被逼无奈?
让大家能够更系统更全面的了解其推理系统的设计过程,以及更深刻的理解之前开源的。多机多卡的专家并行会引入比较大的通信开销,所以DeepSeek使用。计算和通信交错进行,一个通道计算的时候,另一个通道通信。计算与通讯交错进行,通过流水线来实现计算和通信的重叠。晚上负荷低的时候,减少推理节点,以用来做研究和训练;另外,由于白天的服务负荷高,晚上的服务负荷低,因此。15.deepseek-V3/R1架构设计思路。只需要计算更少的专家,访问更少的数据,从而。的潜力,提升训练效率,缩短训练时间。
2025-03-19 08:10:57
1621
转载 总有人问,出海怎么用DeepSeek满血版(别问了,上答案)
例如:Anthropic的Claude系列、Meta的Llama系列、Mistral、Stable Disffusion、Cohere。模型在不同云平台上的表现可能天差地别,这背后的关键在于平台的开发生态和工具链的完备程度。我就问你,你见Amazon CEO为哪个大模型的站台的吗?,更好地管理大量提示词,减少响应时间,提高质量,降低成本;这不是一次简单的大模型上云,而是一场真正的技术革命!2. 对平台上大模型的接入,是严格,还是放水?你出海,别人也出海,看看别人怎么选的,AWS以。
2025-03-18 11:19:55
1212
原创 第6篇10W+,原来不跳舞也可以...
这似乎是我,做的最长的一件事了。上了一天班,累成狗了,想娱乐,想消遣,想满足情绪价值。看了下后台数据,又有两篇9W+了,也有希望进一步突破。他们想看小姐姐跳舞,谁TM想看一个中年男人讲干货。有朋友问我:你这些10W+有什么共同的特点吗?图文里有扩展阅读资料,适合沉浸式阅读。架构设计中两个重要指标,延时与吞吐量。《架构设计中的100个知识点》但无论如何,我成不了小姐姐。《MySQL在线表结构变更》可我相信,总有同频的人。跳舞,我确实可以学学。纯技术内容,无一例外。于是,24年底启动了。从20年开始玩短视频。
2025-03-18 11:19:55
1379
原创 DeepSeek开源3FS,一个文件系统而已,有啥值得吹的?
额,这是一个偷懒的设计,不用复杂的回放恢复,简化了恢复流程,数据恢复期间比较占流量。有人说,deepseek一个搞AI的公司,不干正事,开源一个文件系统,有啥值得吹的。机制,允许用户在不修改内核代码的情况下,在用户空间实现自己的文件系统。就能用高效的语言,高效的工具,高效的开发适配自己业务的分布式系统了。幻方官网,最显著的位置,说明了3FS是他们最大的三大核心竞争力之一。或者这么说,文件损坏是小概率事件,不值得因此把整体设计搞复杂,说,已有的分布式文件系统无法满足我的需求时,我就自己重写一个。
2025-03-17 08:11:02
1929
转载 为啥DeepSeek爆火之后,中国人想到的是大量裁员,而不是上三休四?
彼时的科技水平虽然没有很先进,但大家普遍认为完全有可能,并对未来充满了信心,早期的一些科幻作者也诞生了,在他们的作品里,未来的世界里智能化机器人可以自己工作,人类不再需要工作,只需要伸手就有机器人递过来的面包。而纺织女工们,则由每天工作14小时增加到16小时甚至更多,乃至由于工作时长的增加,她们在生产线上难免犯困打盹,结果被机器绞掉了手指或者胳膊,然后失业,悲惨的流落街头出卖肉体。而庄园里的老板们,还在喝着红酒,烤着壁炉,跟发明家、大学学者讨论着新机器改进的可能性,是不是能再提高20%的自动化程度?
2025-03-15 21:10:32
1275
原创 炸裂官宣!大佬亲自站台,AWS全力支持DeepSeek!
例如:Anthropic的Claude系列、Meta的Llama系列、Mistral、Stable Disffusion、Cohere。它通过提供多样化的预训练基础模型和统一的API接口,帮助开发者快速集成高级AI功能,无需管理底层基础设施。模型在不同云平台上的表现可能天差地别,这背后的关键在于平台的开发生态和工具链的完备程度。它不设围墙,不画边界,足够包容,在这里,你不会被单一技术路线束缚。,更好地管理大量提示词,减少响应时间,提高质量,降低成本。这不是一次简单的大模型上云,而是一场真正的技术革命!
2025-03-14 08:27:16
1562
原创 DeepSeek开源EPLB,世界上从来没有什么腾空出世!
《deepseek原理应用与实践》13.deepseek极限潜能 - EPLBdeepseek开源DualPipe的同一天,还开源了EPLB。今天来简单聊聊EPLB,包懂。【1】EPLB是干嘛的?EPLB,Expert Parallelism Load Balancer,是一个动态负载均衡算法。在使用专家并行EP时,不同专家会被分配到不同的GPU,而这些GPU的负载可能不均衡,此时就需要EPLB...
2025-03-13 08:10:32
2159
原创 DeepSeek开源的DualPipe,居然是梁文峰写的,你感性?
《deepseek原理应用与实践》12.deepseek极限潜能 - DualPipe继DeepGEMM之后,deepseek开源了第四弹DualPipe。今天来简单聊聊DualPipe,包懂。【1】DualPipe是干嘛的?Dualpipe,一个双向管道并行算法,提高了前向传播/反向传播过程中的计算+通信效率,降低了单向流水线的等待时间(pipeline bubbles)。【2】前向传播和反向...
2025-03-12 08:20:45
2364
原创 CAS下的ABA问题及优化方案!技术交流,没必要张口闭口就...(第44讲)
《架构师之路:架构设计中的100个知识点》44.ABA问题《库存扣减异常怎么办?(41)》采用CAS思想,两行代码解决并发扣减异常。有童鞋留言:那ABA问题呢?今天和大家聊聊CAS下的ABA问题。前文回顾:如何巧用CAS机制,1行代码搞定并发导致的库存异常问题?将库存设置接口执行的:update stock set num=$y where sid=$sid升级为:update stock set...
2025-03-11 12:06:55
2205
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人