自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(97)
  • 收藏
  • 关注

原创 写文档的原则

拿画树来做比方,简笔画树是简洁明了的突出了树的神貌,你可以看出来树种类,叶子稀疏程度之类的。汉字树只有其抽象概念,不知道任何细节,信息太少;最后一张树的照片,太详细了,作为文档来说,文字太多了,淹死人。故事要讲完整,有头必有尾,画一个树要完整画出其所有部分,尤其是最终要结论部分。表格要写注释,每个列是怎么意思,怎么来的,计算公式是啥?人是视觉动物,一图胜千言。

2025-01-09 09:32:04 297

原创 AI工程师自我修养---自我检查--超额完成任务的秘诀。

要自我检查,并在文档中说明。

2025-01-08 11:19:26 219

原创 深度学习小白入门---语义查找的相似曲线是什么形状?

在语义检索中,对于某一查询,其向量检索结果按照相似度从高到底排序,以横轴代表名次,以纵轴代表相似度,其曲线形状如何?正常来说,曲线分为三种情况,如下图所示:绿色是较好情况大多数类似这样的曲线,黄色次之,紫色相当于没训练出现概率最小。因为大部分的训练使用的是交叉熵损失是类似的凹函数,而且模型中的激活函数也是类似凹函数,所以曲线当然长这样子。

2025-01-08 11:00:19 162

原创 数据清洗--常见问题

数据清洗搞好,分类:数值类型:是否带有单位,是否多值并列。------不用管?字符类型统计出来词表。频数。长度。是否含有数字,观察是否去掉。符号是否去掉。罗列高频字符,观察其值,看看是否需要去掉或者保留。

2024-12-19 09:22:58 102

原创 我命由我不由天的可笑事实

天天沉下心来做事情的人,大概率也不会去想所谓的"我命由我不由天",因为他太专注于自己的事情了,脑袋里没有任何念头。天天喊口号,天天相信我命由我不由天的,大部分三分钟热度,虎头蛇尾,适合去演讲忽悠人,成功概率很小。除了中狗屎运,大概率只有后沉下心来做事情,你的财富才能一步一步积累,最后改命。对于90%的以上的人来说,出身就决定了命运,要想实现阶级的跃迁,大概率很难。成长的阶段,见过聪明的,见过智商高的,可只有勤奋+机遇才最后混的好。改革开放那么多年,那么多的红利,可大部分人还是穷人,富人只是少数。

2024-12-04 10:55:50 238

原创 runtimeerror: unknown model (vit_mediumd_patch16_reg4_gap_256)

更新timm包。

2024-10-14 15:55:43 354

原创 世界上最凶狠酷刑--活着

历经一切苦难,无能为力的看着发生,并且活下来了。然后,不断的一遍遍回忆痛苦。

2024-09-17 13:38:49 202

原创 成功的秘诀

成功跟颜值、身高、学历、运气、品行、道德、时代、知识、努力等等,不绝对相关,只跟你在正确的道路上走了多远相关。这是一篇清楚明白的废话,却又是实话。

2024-09-13 11:53:00 337

原创 如何长生?重要的是对内求索!

小说中的九转大还丹,修仙中的仙丹,蟠桃是不存在的。这是理所当然的废话。但是世界上总有很多广告词,用老山参、野生、纯天然,补肾、补肝等词来形容自己的产品,而且价格高,销量多。天天淫邪,最后,男的骨头易折(色是刮骨钢刀),尿毒症,精神萎靡。女的妇科病,腰痛,宫颈癌,老无所依。肾虚,如果病人不停止一些对身体有害行为,就算是天天人参,天天鹿茸也无济于事,依然会魂飞魄散。天天发脾气,怒大伤肝,气在心头,肝气郁结,郁郁寡欢,什么药都难医,最后身死道消。人的思想对于身体健康影响是非常大的,什么样的思想,什么样的结果。

2024-08-09 10:14:43 265

原创 小白批量文本图片转向量--DataLoader/ DataSet ignore bad sample忽略报错样本!

在批量图片转向量时,遇到了bad image,说图片不全,需要忽略掉。自定义一个方法,核对过滤掉坏数据。

2024-08-03 16:45:45 273

原创 Milvus load 加载速度很慢!load so slowly!

就是说,你插入的数据有重复向量,重复本身会对计算index造成负担,数据量也会上来,对计算index造成负担。测试方法:找一个空的机器去,上milvus试一下,或者将现在milvus服务器释放一些内存试试。测试方法:1 消除重复,2.增加随机向量,保证总条数不变,看看index会不会变快。由此推测,您的load函数非常慢,很有可能是index环节速度太慢或者出了问题!向量百万,计算index,需要比较多的内存和计算量。看看您的机器是否内存不足了。到内存时,速度很慢,比如20分钟没有结果,这是什么原因?

2024-08-02 10:12:59 1555

原创 大丈夫生于天地之间,志存高远!

你等年纪轻轻一遇挫折,便松散懈怠。日后怎成大器,虽称满腹经纶,却是鸡肠鼠肚,连几句恶语都容它不下,你等且记住,为人者,有大度成大器也!夫处世之道,亦即应变之术,岂可偏执一端?

2024-08-01 09:28:09 410

原创 小白对抗训练入门(1)--FGM

如何施加一定的变形呢,而且还不会把模型搞为白痴呢,而且施加的形变太小,容易没啥用,施加的太大又容易搞错边界。作者提出对每个样本施加一个梯度变化方向上的。在NLP领域,每个样本最后会变成embedding,输入到模型进行预测。所以只需要对embedding层进行施加变化就好。FGM核心思想是:在训练时对样本施加一定的变形,从而提升模型的健壮性。,即可以解决此问题。先想再做,对比总结!

2024-07-31 18:33:09 380

原创 jupyter notebook安装不上python包 package

这种方式,你安装了包,但是有可能安装到了base环境或者其他环境中,而不是安装到了当前环境中。最保险的方法是在Terminal中使用此命令。命令安装了某个包,但是使用import命令发现。你在jupyter中使用。

2024-07-30 11:03:44 412

原创 find命令

参数负责删除掉查找到的文件。

2024-07-15 16:35:29 231

原创 PyMysql error : Packet Sequence Number Wrong - got 1 expected 0

pymysql的主进程启动的connect无法给子进程中使用,所以读取大批量数据时最后容易出现了此类问题。

2024-07-13 10:19:29 1231

原创 本人瞎说--分形与混沌--中医为什么是准的

所谓的西方先进的医学,依然十分鄙陋无知,所以年轻人不要可劲地造自己的身体,它根本无法知道你是否健康,你是否正在慢慢得癌症,只能马后炮地跟你说你得了癌症,等死吧!从大的方向来看,地球有一些鲜明特征:白天和黑夜、空气和水、重力等,在地球上生存的生物都要无条件接受这些事实,这是显而易见的,因为不适应这些的都死了。冷酷无情,能够给予,也能够收回,它给予的时候,多是类似大地母亲博爱后发,它要收回的时候,天降大灾,水火无情收回它所给予的生机。本人不是中医专业,也不是医生,也不会看病,我的观点都是来自于网上学习及思考。

2024-07-08 10:20:47 479

原创 pandas不要存储Excel和CSV

不推荐您用excel保存pandas数据,因为如下一些原因。解决方案:使用parquet和html。

2024-06-05 11:43:53 985 1

原创 Schemdraw小白从入门到放弃---原理工具书

6.1 请问您觉得设计者的编程方法是否别扭?这种别扭带来的好处是什么?6.2 请问您是否觉得schemdraw是否在编程上是相对高效的?体现在哪里?6.3 请问本文第一个例子中,schemdraw是怎么将之自动封口成为一个四方形的?

2024-03-25 23:05:42 1561 4

原创 生活小妙招(2)---正确选购垃圾袋!

垃圾袋不就是一个袋子吗?商贩也经常买袋子,而且他们扣,所以买他们买的袋子,价格就比较低,而且比较足量,因为他们可能真的会去数。TIPs:我也数了,每把50个袋子,给了10把,500个不少。15块钱,包邮,透明的有耳朵,yyds。把买垃圾袋,转成买袋子,这思路不就打开了吗?嗯嗯,可以的,说不定您还有更加省钱的,比如错版的。其实再想想,咱们也可以买不带任何图案的装包子的小袋子,更加便宜。商家都知道你是白领,你有钱,愿意花钱,所以垃圾袋都贵。

2024-03-25 16:10:18 257

原创 docker小白采坑---启动失败---空间不足

如果格式报错,就把你的json,粘贴到json格式化检验工具中检测修改一下。格式错了,就把你的json,粘贴到json格式化检验工具中检测修改一下。,写错的话docker就启动失败。设置一下,镜像保存的路径,即,在。

2024-03-23 14:57:11 547

原创 程序员养生学(一):爱护眼睛--闭眼编程

古人虽然没有良好的仪器,但是眼睛不瞎,心智也全的,通过几千年的观察也自然看出来一些门道,脏器虽然神经不发达,但是也会通过告诉你的大脑,某个脏器不好受。脏腑的脏在繁体字中写作"臟",是个人观点认为,臓中带有藏字,意味着,人之生命精华藏在此中,要好好爱惜,不作死不会死。去户外,摘掉眼镜,睁大眼睛,看看蓝天白云,看看大树,看看远山,看风吹草动,不需要看清,10分钟后,您的眼睛就有不一样的感受。第三次是24年3月21日,下午,右眼很痛,睁不开眼睛,尤其是在等灯光下,疼的厉害,就算闭上眼睛也痛。

2024-03-23 14:28:19 754

原创 生活小妙招---如何正确网购测量式产品

一次性买两个及以上产品,在相同条件下测量,查看数值差异。如果数值差异太大,就说明产品质量不行,起诉或者退款。比如:您买甲醛检测仪,买两个,放在同一个位置,每隔10分钟查看一下读数变化,查看差异大小。

2024-03-20 09:36:38 427

原创 TIMM库--hugging face--models存储路径修改---TIMM本地读取huggingface模型

【代码】TIMM库--hugging face--models存储路径--修改。

2024-03-12 19:17:04 2984

原创 python合并多个dict---合并多个字典值---字典值相加

主要是借助Counter、函数传参和+运算符重载!,但是它只适用于值为整数或者小数类型**,否则报错!请您对以上三种方法的弊端进行复现。

2024-01-23 17:30:52 1290 1

原创 深度学习烦人的基础知识(2)---Nvidia-smi功率低,util高---nvidia_smi参数详解

三个人,一个在举重,一个人在跑步,一个人在走路。他们都在运动,都是忙碌的,也就是GPU-Util占用高。但是很显然举重的,对外做功高,跑步的做功低,走路的最差,也就是GPU的耗电情况。如下所示,其表格中,有这么多参数,且参数名与值的其位置是一一对应的。我用不同颜色进行标识,同一种颜色的方框和箭头,标识出参数名和其值的位置关系。Pwr是指GPU运行时耗电情况,如图中GPU满载是300W,目前是86W与GPU2的空载情况功率相等。如下图所示,GPU功率很低,Util占用率高。,也就是人员到位了,在等活干,

2024-01-13 11:37:55 4207 7

原创 深度学习烦人的基础知识(1)---&@在bash中的作用---positional parameter详解

Parameter Parameter是管理具体输入参数的,Special parameter是管理shell的一些参数的,不可被赋值。是指整个输入参数的list的字符串,你可以制定间隔符IFS(Internal Field Sperator),Positional Parameter就是调用shell脚本时,传入的参数!深度学习,反展到现在,真的是要融会贯通很多东西。是当前脚本background运行时的PID。则是参数的string的list。是指整个输入参数的list,是script的pid,

2024-01-12 17:31:04 640

原创 Python 进程池Pool Queue,运行不出来结果!

上边的代码queue的size为0,为什么不是10?因为,Pool不支持这么用!Process支持Queue,但是Pool并不支持!

2023-12-15 17:44:08 226

原创 milvus采坑一:启动服务就会挂掉

硬盘满了,Eric数据文件存储在硬盘上,当硬盘不足,它就会启动后就挂掉。此时pymilvus连接一直是timeout。

2023-11-20 11:48:33 1530

原创 程序员的护城河

GPT4 出现了,你还护城河,护屁的河。除了高精尖的,将来都得失业。但是如下5点原因,可能是的护城河。

2023-11-13 19:36:06 139

原创 Tabby All configured authentication methods failed

遇事千万不要冷静,要生气,要怼天怼地,要骂人,要墨守成规,然后你的人生就毁了。千万不要看提示语,千万不要搜索提示语的意思,然后你就各种抓狂,浪费时间。别人写的软件都是错,BUG百出,自己就是天下第一,不会出错,错的一定是别人,然后你就死循环。

2023-10-11 10:43:44 4710

原创 知识图谱小白入门(1):neo4j的安装与CQL的使用

所以,设计者按照图论相关知识设计Neo4j,Cypher和py2neo的相关语法,均可看到C程序设计相关的身影。知识图谱,是一种实体间的信息与关系知识的网状结构,借用图论中点与边的概念进行组建,易于结构化和可视化。安装过程中,数据默认是在C盘中,请看清一点,如果有需要请装到其他盘中。装错了也没事,报错重新安装就好了。自行搜索,JDK下载。下载后,请配置一下,您的JDK路径home和path路径。如果还不行,再尝试重新安装desktop,然后重启电脑。下载安装JDK,切记不要下载最新版版本,切记。

2023-10-01 19:57:44 2538

原创 Jupyter杂症二:导航目录不显示或展示不全--空白--部分显示--TOC2--侧边目录问题--插件问题--nbextensions

有些问题,解法还真的是莫名其妙,就如同拍了一下电视机就好了。。。。。难道是在拍的时候,我们传了内力给了计算机?

2023-09-15 11:00:22 3931 35

原创 Pandas小白入门散记(3)---Series.str--源代码定位问题

源码解读探索

2023-09-04 19:49:00 210

原创 Pandas小白入门(2)---DataFrame的列赋值、多列赋值ValueError: Must have equal len keys and value when setting with a

Pandas是一个杰作,其创作团队将现实的事物抽象成DataFrame和一系列相关操作,是一个完整的体系。一般来说,一款成熟的软件处处透漏着规范,如函数命名、参数位置等等,而且这种规范在软件间大部分情况下是通用的,一通百通,触类旁通,也算是各种隐藏彩蛋,祝各位收货颇丰。Series 是DataFrame 的单列的数据结构,不仅在概念上,而且在字面上,即DataFrame中的数据实际上作为Series的集合存储在内存中。的本质是:将新列的值转为Serise对象,传给DataFrame注册为其列。

2023-08-29 14:08:50 1254

原创 multiprocessing.pool.MaybeEncodingError: Error sending result

这个问题我没有找到系统性的介绍,只能去网上找只言片语,结合我自己的理解给出自己的答案。如果您也有相关烦恼未解决,请贴出来代码,我弄懂了就发出来。

2023-07-28 17:33:52 1403

原创 小白如何高效刷题Leetcode?

学习前人总结好的各种类型算法套路。你在Leetcode上遇到的没一题目,基本都属于某种套路。尽可能先去跟某人、某公开课、某视频、某书去学习当前问题类型。注意我说的顺序,这里表示其学习难以程度。跟人学是最简单最容易的,因为人具备最高的交互性、生动形象。硬币称重----信息熵问题。兔子繁殖,上楼梯的方法----递推问题:前面几项值可以推断出当前项的值。有限空间内如何装最大价值的货物----背包系列问题。取石子,问先手输赢------博弈论。

2023-07-26 00:03:37 960

原创 ONNX小白入门(1):sentence-transformer 提取embedding模型转onnx

onnx转换的时候,tokenizer部分是无法被onnx的,只有你backone模型才能进行转onnx,不要问我为啥,因为我也不知道。很多时候,我也不知道这段代码啥意思,但是作为应用人员,不要在意这段代码到底干了啥,除非必要。这里不仅展示了如何转onnx,还有你部署时候,所需要的所有的文件,都打包到一个文件夹中了。本文适合小白入门,以自己训练的句子embedding模型为例,像大家展示了如何手动将。误差数值很小,结果OK。的模型转为onnx。

2023-07-21 18:54:01 4090

原创 编程术语名字艺术

思而不学则殆,学而不思则罔。为什么他们这么起名字?

2023-05-30 11:25:55 134

原创 huggingface模型--下载超时--各种方法总结

下载模型超时,模型存放在哪里?

2023-05-05 10:25:59 12404 7

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除