随笔
文章平均质量分 93
submarineas
不积跬步,无以至千里
展开
-
rag笔记(一):技术介绍与实践
检索增强生成(RAG)是指对大型语言模型输出进行优化,使其能够在生成响应之前引用训练数据来源之外的权威知识库。大型语言模型(LLM)用海量数据进行训练,使用数十亿个参数为回答问题、翻译语言和完成句子等任务生成原始输出。在 LLM 本就强大的功能基础上,RAG 将其扩展为能访问特定领域或组织的内部知识库,所有这些都无需重新训练模型。这是一种经济高效地改进 LLM 输出的方法,让它在各种情境下都能保持相关性、准确性和实用性。原创 2024-03-19 18:51:15 · 1440 阅读 · 0 评论 -
sora笔记(三):diffusion transformer模型的发展历程
::info💡 在一文中介绍了目前未开源的sora模型可能涉及到的技术点,包括介绍了Vision Transformer,作为transformer正式用于图像的一种范式,为本文中将提到的内容打下基础,同时一文对diffusion model的数学原理推导,也为后来模型的演化提供更加完整的认识。而本文将要介绍的是后来的ViViT与DiT两种模型架构,并对其进行了更进一步的源码分析。原创 2024-03-16 13:13:55 · 2357 阅读 · 0 评论 -
sora笔记(一):sora前世今生与技术梗概
::info💡 近日,OpenAI发布了视频生成模型Sora,最大的Sora模型能够生成一分钟的高保真视频。同时 OpenAI称,可扩展的视频生成模型,是构建物理世界通用模拟器的一条可能的路径。**📃 **Sora能够生成横屏19201080视频,竖屏10801920视频,以及之间的所有内容。这使得Sora可 以兼容不同的视频播放设备,根据特定的纵横比来生成视频内容,这也会大大影响视频创作领域, 包括电影制作,电视内容,自媒体等。原创 2024-03-02 20:39:37 · 937 阅读 · 0 评论 -
个人向非企业,基于目前主流图床的选购指南
基于目前国内外数十种可搭建图床业务,做了基于个人的总结,并在最后,给出了选购建议与使用经验原创 2023-06-24 15:53:26 · 1595 阅读 · 1 评论 -
minigpt4搭建过程记录,简单体验图文识别乐趣
从3月开始,aigc进入了疯狂的开端,正如4月12日无界 AI直播 在《探索 AIGC 与人类合作的无限可能》中关于梳理的时间线一样,aigc的各种产品如雨后春笋般进入了不可逆的态势,里面有句话很形象,人间一日,AIGC十年。这产变革像是有计划性的沧海桑田,让每个参与者亦或者体验者都感觉时过境迁,本文是针对前几天刚发布的minigpt4,简单写了个部署教程,最近GitHub trending中有太多的奇思妙想,在基于chat的这么一个模型下,每个人都能让故事开始变得天马行空,充满无限的可能。原创 2023-04-25 15:38:03 · 9171 阅读 · 20 评论 -
kaggle RSNA 比赛过程总结
自20年最后一场后(其实之前也就打过两场,一场打铁,一场表格赛是金是银不太记得,当时相当于刺激战场,过拟合lb大赛太刺激了,各种trick只有敢想就敢做,但最近发现账号都忘了),RSNA开赛那段时期,有个群里正好有人说要参加,具体啥情况忘了,然后我正值年底,阳了后又恍恍惚惚参加了一场考试,转阴后方觉大梦一场,梦醒茶凉(当然,这只是我现在的说辞,从11月发生了太多意料之外的事情,我现在也只能用一梦黄粱来搪塞),需要做一些事情排解一下新年的迷茫与惆怅,于是顺势就加入原创 2023-03-02 00:14:56 · 1013 阅读 · 1 评论 -
DNS服务解析与原理笔记
DNS 是 Domain Name System(域名系统)的简称,DNS 是一个分层的分布式命名系统,用于连接到互联网或专用网络的计算机,服务或其他资源。它将各种信息与分配给每个参与实体的域名关联起来。简单来说其最大的功能就是将域名翻译成 IP 地址,例如bilibili的 IP 地址就是一串毫无规则的数字,其中之一为,或者后查询到的IP为,这不利于记忆,且因为有CDN等因素外,并不唯一,同样,同个IP,也可以具有多个DNS,这个后续会解释原因,所以,还是直接输入B站的com域名更加方便。原创 2023-02-02 22:21:25 · 2726 阅读 · 0 评论 -
数学二高数公式总结
本篇因为是考试后写的,虽然保不准也算下一次考试前,创作初衷也就今天突然想总结一下之前一直在用的公式,周期可能也就这两天,但参考了一些别人的博文或者帖子,觉得还是与自己想的侧重点有点不太一样,所以就有了上面这张思维导图的大纲,如果不太完整的地方,后期我会去尽量完善,本篇公式有些图是我自己做的,有些是参考文献中引用的几篇知乎帖子,考虑到公式美观性,与参考文献也没有对公式加上水印,所以本篇大部分图片都去除了,希望能作为以后的备用资料。极限极限的概念与性质两个重要极限:limx→0sinxx=1lim.原创 2022-01-29 00:40:53 · 34621 阅读 · 15 评论 -
pycharm直连Linux内部docker过程记录
引言本篇想大概记录一下在这之前所遇到的一些问题,主要是从一些安装过程,还有一些不当方式进行总结。docker中安装ssh首先需要在docker里面安装ssh,一般跟宿主机一样,在docker里的操作为:root@xxxxx:/# apt-get updateroot@xxxxx:/# apt-get upgraderoot@xxxxx:/# apt-get install vimroot@xxxxx:/# apt-get install openssh-serverroot@xxxxx:/#原创 2022-01-20 23:08:29 · 1723 阅读 · 2 评论 -
英语二大小作文总结笔记
引言对于英语二来讲,我其实花的时间不多,除了大小作文和阅读,其它基本没怎么做题。所以本篇主要总结作文相关方面的内容。可能我花的时间很少,所以对其理解不深,以下是为各PDF截图以及一些我的主观理解,仅带有参考意义。小作文2022与2021一样,为邀请信的邮件,作为一个主办方邀请同学参加一场food festival,没啥生词,基本套模板,下面我将总结一下几位老师和空卡的小作文模板与方式说明。空卡小作文模板建议信邀请信抱怨信告示个人笔记上面四张均截取自空卡的作文模板PDF,前三种原创 2022-01-09 19:59:19 · 2819 阅读 · 0 评论 -
车道占有率和车道密度等参数笔记
Traffic density车流密度K=N/LK = N / LK=N/L式中:K—车流密度,辆/kmN—观测路段内某瞬时车辆数,辆L—观测路段长度,km最佳车流密度——能够使道路上的交通量达到最大时的密度阻塞密度——车流几乎无法移动,即发生交通阻塞时的车流密度,此时,v=0,Q=0.v=0,Q=0.v=0,Q=0.临界密度——道路上运行车流量达到最大时的交通密度。在道路某一区段范围内的交通密度每时每刻都在变化,因此,所谓密度,总是指某一瞬归的密度值或某原创 2021-10-24 21:15:26 · 8746 阅读 · 0 评论 -
近期某面试汇总以及之后的规划
引言今年的行情确实如疫情发展得一样,岗位非常少,并且甲方的难度有点难过,大部分都不问项目,而是直接底层了,问得头皮发麻,和去年相比,问的问题都是两个层次,这也导致我迷茫了很长一段时期,因为本身我自己的硬性条件就不是很好,可能要考虑转型,计划从学go变成Java,在学会Java之前,之后的博客可能以LeetCode刷题为主,我也需要拿出跟以前一样的热情去迎接新的挑战了:面试题总结哈希表的设...原创 2020-04-29 23:29:49 · 681 阅读 · 2 评论 -
ucinet网络分析使用总结
ucinet介绍UCINET为菜单驱动的Windows程序,可能是最知名和最经常被使用的处理社会网络数据和其他相似性数据的综合性分析程序。与UCINET捆绑在一 起的还有Pajek、Mage和NetDraw等三个软件。UCINET能够处理的原始数据为矩阵格式,提供了大量数据管理和转化工具。该程序本身不包含 网络可视化的图形程序,但可将数据和处理结果输出至NetDraw、Pajek、Mage和Kr...原创 2019-08-20 17:10:32 · 139448 阅读 · 61 评论 -
每天做好一件小事
一曲新词酒一杯,去年天气旧亭台原创 2019-04-01 23:06:16 · 343 阅读 · 0 评论 -
《中式英语之鉴》笔记总结
中式英语之鉴笔记2:不必要的动词这一段的笔记是用word写的,本来没打算水一篇博客,后来发现有人用md写了英语笔记,感觉蛮好,之后有想法试试,顺便也在这里做个记录。...原创 2019-02-08 23:53:11 · 7413 阅读 · 1 评论