自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(68)
  • 收藏
  • 关注

原创 【2024德国签证】去德国读博士需要申请什么签证?

德国留学签证面签的经过及注意事项 ✨!希望我的经验可以帮助大家顺利通过签证,顺利开启德国留学之旅 。记得带上足够的现金和材料哦 !一、选择适合自己的签证类型在选择签证类型时,一定要根据自己的实际情况来选择合适的签证种类 。按照德国大使馆的分类,长期签证分为以下几种类型:1️⃣厨师签证2️⃣读博士签证(拿学位的那种)3️⃣语言班签证️4️⃣工作签证5️⃣研究人员签证(联合培养博士生就选这个类型)​

2024-07-02 21:38:11 864

原创 【2024德国留学签证申请】留学签证申请要多久?

​签证时间不一样比如德语语言班签证处理时间约为 8 - 12 周,留学签证4-6周,博士签证2-4周首先讲讲,2024留学签证材料清单(简单版)后面有更详细的说明和要求:签证申请表,护照复印件,德国高校或语言班录取通知书,大学授 课语言和要求达到的语言级别的说明,资金证明,已获得的德语语言水平证明,毕业证书, 个人简历,留学动机说明信, 留德人员审核部的审核证明/审核证书/APS传真,医疗保险证明​

2024-07-02 21:32:20 707

原创 【2024LLM应用开发】使用Chroma DB实现语义搜索的向量数据库系统

a) 文本嵌入:使用预训练的语言模型(如BERT、GPT等)将文本转换为dense vector(稠密向量)。这里使用Chroma DB创建了一个持久化的客户端,数据存储在"chroma_tmp"目录下。中的每个元素,将其添加到集合中。在本例中,Chroma DB负责了这些底层操作,使得用户可以专注于数据的添加和查询。向量数据库的核心是将文本或其他类型的数据转换为高维向量。a) 语义搜索:传统的关键词搜索无法捕捉语义相似性,而向量搜索可以。c) 灵活性:可以搜索任何可以表示为向量的数据,不限于文本。

2024-07-02 19:37:41 625

原创 【2024LLM应用-数据预处理】之如何从PDF,PPT等非结构化数据提取有效信息(结构化数据JSON)?

🥰大家知道吗,之前在给AI大模型"喂数据"的时候,我们往往需要把非结构化数据(比如PDF、PPT、Excel等)自己手动转成结构化的格式,这可真是太累人儿了。有了这些技能,我们就能把海量的非结构化数据高效地转换成结构化格式,喂给大模型"吃"啦!幸好现在有了Unstructured这个神级库,它内置的数据提取函数可以帮我们快速高效地完成这个转换过程。对于Excel文件,官方文档里也有介绍,应该也是类似的操作。方法,传入之前定义的参数,就能获取PDF里的结构化数据啦!对象来存PDF文件的内容,然后定义一个。

2024-07-02 17:49:24 316

原创 【LLM教程-llama】如何Fine Tuning大语言模型?

今天给大家带来了一篇超级详细的教程,手把手教你如何对大语言模型进行微调(Fine Tuning)!(代码和详细解释放在后文)

2024-07-01 22:03:16 888

原创 【LLM教程】为什么做大语言模型fine tuning时,要将 drop_last_batch设置为True?

1.drop_last_batch 是什么?drop_last_batch=True是一个常见的数据加载/预处理选项,用于在处理最后一批样本时丢弃不完整的批次(batch)。2.drop_last_batch有什么用?训练神经网络模型:大多数神经网络模型在训练时使用批量梯度下降(mini-batch gradient descent)优化算法,这需要将数据分成若干个批次。如果最后一个批次的样本数量不足一个完整批次的大小,可能会导致计算不一致或效率低下。通过设置drop_last_batc

2024-07-01 20:28:08 385

原创 大语言模型预训练数据集及清洗框架介绍【简单版】

大语言模型预训练数据集及清洗框架总结,多语种数据集 🌍1. CC100🗣️ 100种语言📊 总规模:2.5TB🧠 用于训练XLM-R模型2. OSCAR🌐 基于Common Crawl📊 总规模:6.3TB🗨️ 151种语言3. ROOTS

2024-06-28 23:16:17 1158

原创 【2024大语言模型必知】做RAG时为什么要使用滑动窗口?句子窗口检索(Sentence Window Retrieval)是什么?

检索到的是整个文档,而不是具体与查询相关的片段。这可能会给生成模块带来额外的负担,因为它需要从较长的文本中识别出真正相关的部分。将文档分割成多个滑动的段落窗口(overlapping sentence windows),每个窗口包含几个连续的句子。:对于较长的文档,将整个文档作为一个向量可能会导致上下文信息的丢失。:检索的是与查询更加相关的文本片段,而不是整个文档。:生成模型只需关注较短的相关片段,而不是处理整个长文档,从而降低了计算开销。在查询时,首先检索与查询最相关的句子窗口,而不是整个文档。

2024-06-28 22:54:36 230

原创 【留学党必看】超全GPA计算公式汇总:英美澳新德国香港等 (建议收藏,硬核无广)

在美国,一般的等级分值为A=4,B=3,C=2,D=1,F=0。香港高校绩点算法: • 4分制:A+=4.0, A=3.8, B+=3.3, B=3.0, C+=2.3, C=2.0, D=1.0, F=0 • 100分制:A+=100, A=90, B+=85, B=80, C+=75, C=70, D=60, F=0。• 5分制:90-100分 = 4.0-5.0,80-89分 = 3.0-3.9,以此类推 • 4分制:90-100分 = 4.0,80-89分 = 3.0-3.9,以此类推。

2024-06-26 23:13:38 1378

原创 【2024德国工作】蓝卡攻略:人在中国,怎么去德国工作?

一种针对特殊行业的工作签证,更快拿永居。

2024-06-24 18:00:00 826

原创 【2024德国签证】资金证明-留学签证线上开户超详细指南!

什么是德国保证金(自保金Sperrkonto)?来自非欧洲国家的国际学生必须提供经济资金证明,以证明你能支持你在德国的生活和学习。保证金用途:非欧盟国家的公民,需要签证来德国,必须提供经济证明来申请学生签证。账户持有人须事先在该账户中存入一定的资金(至少10332欧元/年)作为保证金,然后在到达德国后,每个月可以从中提款出一定的金额作为每月的生活费用。

2024-06-23 16:14:35 1057

原创 【2024德国签证】德国公保从线上开户到签证申请超详细指南!

德国留学递交签证的时候,需要办理哪些保险(递签+入学分别需要办理什么保险)德国语言班需要办理什么保险?德国本科/硕士入学需要办什么保险?德国博士入学需要办理什么保险?

2024-06-23 15:14:05 1018

原创 【2024德国留学】签证被拒的十种原因.....

如果递签时没有这些成绩,大使馆还是会怀疑你的德语水平,从而拒签。虽然学了四年德语,但如果还没达到德福4或DSH2的要求,德国大使馆也会怀疑你的留学能力,然后拒签。计划去德国语言学校的小伙伴们要注意,德国要求外国学生至少要有B1水平的德语基础才能去学语言。分为自我介绍、国外导师信息、选择他的原因、在国外的研究计划、去德国留学的动机和访学结束后的计划等部分。有良好的出国经历,特别是发达国家的出国记录,会对你有帮助。办理签证时,要对自己的旅游行程、探亲信息、商务邀请等情况有所了解,确保回答与提交的材料一致。

2024-06-23 14:40:30 1080

原创 【2024德国工作】外国人在德国找工作是什么体验?

挺难的,德语应该是所有中国人的难点。大部分中国人进德国公司要么是做中国业务相关,要么是做技术领域的工程师。先讲讲人在中国怎么找德国的工作,顺便延申下,德国工作的真实体验,最后聊聊在今年的德国工作签证申请条件(比如攻略),希望真的可以帮到你。

2024-06-21 22:08:46 843

原创 【2024Python教程】-MongoDB数据库连接

所以,这段代码的作用是:遍历指定目录下的所有PDF文件,提取每个PDF文件的文本内容,对文本内容进行简单分类,然后将PDF文件名、文本内容和分类信息作为一个文档存储到MongoDB的。举个例子,我们希望把很多份技术文档(PDF格式)转为TXT,并将文章内容,文章标题存到。是一个Python字典,包含了PDF文件名、文本内容和分类信息。详细讲讲这里的MongoDB的数据连接。将这个字典作为一个文档插入到。MongoDB数据库连接。

2024-06-21 21:33:49 195

原创 【 2024德国签证攻略】签证类型+办理流程+材料+有效期+费用+常见问题

德国工作签证材料清单简单版

2024-06-19 02:59:13 1316

原创 2024 独立开发者必备--自己开发app一定要知道的设计原则!

我最近一直在做AI应用方向的开发,今天根据我个人的经验,来讲一讲,APP里的UI和UX设计:首先,让我们可以谈谈 UI 和 UX 的区别。UI(用户界面)和 UX(用户体验)是密不可分的,它们缺一不可。✨一款成功的移动应用,绝对离不开精heart制的 UI 设计和出色的 UX 体验。它们的目标就是给用户带来深刻的好感,留下难忘的第一印象。🤩。

2024-06-13 17:23:20 771

原创 2024 Python-Flask框架:网页版 邮件超时自动提醒器(超简单)

(注意我们的原时间是年,周,日的计算方式)最后在templates文件夹下创建。首先安装flask框架。

2024-06-12 17:49:32 238

原创 【2024Python教程】Python文件打包成exe,如果有图片怎么打包?有手就会的超简单教程

在VScode中安装模块:pip install pyinstaller(可以用这个,也可以用下面这个)在VScode中安装模块:pip install pyinstaller(可以用这个,也可以用下面这个)在VScode中安装模块:pip install pyinstaller(可以用这个,也可以用下面这个)注意:这里已经进到了主文件夹,所以不是路径了,是你的文件名就行)注意:这里已经进到了主文件夹,所以不是路径了,是你的文件名就行)注意:这里已经进到了主文件夹,所以不是路径了,是你的文件名就行)

2024-06-11 18:56:00 1029 1

原创 Python报错:Error sending emails: Cannot mask with non-boolean array containing NA / NaN values

【代码】Python报错:Error sending emails: Cannot mask with non-boolean array containing NA / NaN values。

2024-06-05 15:53:05 181

原创 Python报错:AttributeError: <unknown>.DeliveryStore 获取Outlook邮箱时报错

因为如果Parent返回的不是一个有效的电子邮件账户对象,那么当代码尝试访问这个对象的DeliveryStore属性时,就会引发AttributeError异常,因为这个对象根本没有DeliveryStore属性。综上所述,第二种方法的失败原因不是由于获取到了共享邮箱,而是它只考虑了当前登录用户的默认收件箱,而没有处理其他情况下的账户类型。通过这种方式,第一种方法可以遍历所有的账户对象,只处理有效的电子邮件账户,从而可靠地获取用户的邮箱地址。不存在,那么代码就会跳过该账户对象,继续检查下一个账户对象。

2024-06-04 21:05:17 1023

原创 The error ValueError: not enough values to unpack (expected 2, got 1) occurs when you try to unpack

这是原本的xlsx文件,有很多空字符,而full_name.split()函数是用空格拆分 full_name 字符串,并将结果部分分配给 first_name 和 last_name 变量。在这种情况下,我们将 name_parts 的第一个元素(如果存在)分配给 first_name,并将 last_name 设置为空字符串。最后,我们使用 first_name 和 last_name 构造 email_name,但前提是 first_name 不为空。

2024-06-03 16:27:18 414

原创 【Python报错:xlsx文件 PermissionError】xlsx文件的 [Errno 13] Permission denied: ‘C:/Data.xlsx‘

解决方案:更改工作目录:不要使用绝对文件路径(“C:/Users/Desktop/Data.xlsx”),而是用相对文件路径或将工作目录更改为具有写入权限的位置。使用管理员权限运行脚本:右键单击 Python 脚本或 Python 解释器(例如 IDLE、PyCharm 等),然后选择“以管理员身份运行”。如果 Excel 文件已在另一个应用程序(例如 Microsoft Excel)中打开,则 Python 脚本无法修改该文件。如果没有该文件或该文件所在目录的写入权限,则会遇到此错误。

2024-06-03 16:13:28 185 1

原创 [桌面端应用开发] 从零搭建基于Caliburn的图书馆管理系统(C#合集)

图书借阅时,应标记为“已借”,并在借阅图书列表中列出借阅该图书的会员。Book和User分别拥有了不同的属性,而Library实现了User和Book类之间的数据共享,比如用户能从Book类中获取图书信息。2.会员管理:系统应该能够向图书馆添加新的会员。定义library,让Book和User之间的数据实现共享,以及Book和User之间的编辑和删改操作都放在这里。4.(可选)报告:系统应该能够生成报告,例如借阅的书籍数量、最受欢迎的书籍、活跃会员数量等。User类,每个会员都有唯一的姓名和会员号。

2024-05-23 15:36:39 556

原创 【2024最新Sora 教程】超详细提示词汇总

一个小的,圆的,毛茸茸的生物的 3D 动画与大的,富有表现力的眼睛探索一个充满活力的,迷人的森林。这是一个 60 多岁留着胡子的灰发男人的特写镜头,他坐在巴黎的一家咖啡馆里,思考着宇宙的历史,他的眼睛注视着屏幕外的人们,他几乎一动不动地坐在那里,他穿着一件羊毛外套和一件有纽扣的衬衫,他戴着一顶棕色的贝雷帽和一副眼镜,有着非常专业的外表,最后他微笑着闭上了嘴,好像他找到了生命之谜的答案,灯光非常有电影的味道,背景是金色的光线和巴黎的街道和城市,景深 35 毫米的电影胶片。美丽的东京,白雪皑皑,熙熙攘攘。

2024-03-15 10:01:02 1007

原创 2024大语言模型LLM基础|语义搜索Semantic_Search全解

使用 Pinecone 向量索引的目的是将一批文本数据的嵌入向量上传到 Pinecone 索引中,以便后续进行相似性搜索。Pineacone 的索引服务提供了有效的相似性搜索功能,可以大大简化开发者在这方面的工作。向量索引是一种在高维向量空间中组织和存储向量的结构,使得对于给定查询向量,可以快速找到相似的向量。LSH 是一种哈希技术,它在向量空间中对相似的向量映射到相同的哈希桶的概率更高。Pinecone 是一个云端的向量索引服务,用于存储和检索高维向量,支持高效的相似性搜索。

2024-03-04 08:39:26 1045

原创 Error: Illegal arguments: undefined string at bcrypt.hashSync

用react写后端的signUp时出现报错,代码和这个类似。

2024-02-11 08:27:11 1019

原创 2024年Github最新教程|如何将本地代码上传自github仓库?

首先,在GitHub上创建一个新的仓库。你可以登录到GitHub,点击右上角的加号,然后选择“New repository”创建一个新的仓库。在GitHub上创建的仓库页面中,你会看到一个类似下面的URL,其中。这会将所有更改添加到暂存区。如果你只想添加特定文件,可以使用。在引号中,你可以提供关于本次提交的简短描述。如果你在主分支之外的其他分支上工作,将。是你的GitHub用户名,替换为你当前分支的名称。

2024-02-09 00:13:05 577

原创 pip install openai AttributeError: module ‘pexpect‘ has no attribute ‘TIMEOUT‘(in jupyter )

使用如下代码安装opanai模块报错。

2024-02-07 04:45:11 395

原创 LLM应用开发报错与解决:langchain_Core not installed, pydev debugger: CRITICAL WARNING: This version of python

已经安装了langChain_core后,仍有以上报错,解决如下,首先升级了pycharm(网上有人说是pycahrm版本低导致不兼容,出现debug错误)但这个方法,没有用,仍有报错。

2024-02-04 08:40:04 556

原创 #从零开始# 在深度学习环境中,如何用 pycharm配置使用 pipenv 虚拟环境

比如我之前装的python 3.10,但由于我用的LLM应用的python版本为3.11,即pipenv python 版本为3.11,就会出现报错,但它默认需要python 3.11的版本,所以我移除了原本的3.10版本,选择了升级python 版本。在深度学习环境和一般python环境中安装pipenv基本一致,只需要确认好pipenv指定的python版本即可,安装pipenv前,可以通过python --version来确认安装版本。为Python项目创建虚拟环境。1.3 为虚拟环境安装指定包。

2024-02-03 22:17:44 802

原创 Git指令大全:如何同步github代码,12个你必须了解的最常见Git命令!

【代码】Git指令大全:如何同步github代码,12个你必须了解的最常见Git命令!

2024-02-03 07:25:50 429

原创 react后端开发:如何根据特定ID创建新的用户信息?

不过在这之前,我们一般先需要进行判断,新写入的唱片是否存在,比如某用户已经上传了周杰伦的青花瓷,而另一名用户又再次上传了同一首歌,我们就不会让该用户上传这首歌,并在他的页面进行报错。这里为了简单我们用的是ID进行判断(实际上需要判断,歌手名和歌曲名,用find)1. 以音乐app开发为例,我们想要在想要创建新的唱片库,就需要使用Post连接服务器端新建唱片ID,并在该ID处插入唱片信息。

2024-01-22 05:13:14 622

原创 React开发指南:如何在一个数据model中,引用或调用另一个model的数据作为参考?

album: {type: Schema.Types.ObjectId, ref: "Album"}//将唱片信息作为参考写入Purchase的数据中。已知我们有两个数据model,一个是唱片信息数据Album,另一个是购入唱片所需的信息Purchase。那如何在purchase的model中应用唱片的model呢?

2024-01-22 04:27:03 532

原创 100个程序猿每天必看的网站

20世纪50年代的一个视频,说明了在没有现代电子的情况下机械计算机是如何工作的。: 开发者在java中使用OpenGL制作的一个3D游戏的博客和指南。">计算机科学资源 : 针对自学者的mooc列表。: 浏览Java库的源代码,并且学习如何实现。: 关于热门话题的视频和在技术界的一些趣事。: 与技术界相关的开发人员的好的面试。">Java : 有关Java的会谈。: 针对那些想知道如何达成目标的人。: 一个大的编码面试的问题的汇总。: 针对面试的编码训练。: 最好的Java手册。

2023-12-13 06:23:37 276

原创 Git零基础教程一|如何上传Github代码?[2024年小白必看!!]

Git 只能跟踪文件的改动,所以需要在新创建的文件夹内添加至少一个文件。: 使用命令行工具(如 Git Bash)创建一个新的文件夹。注意:只有新文件被添加到该文件夹中,Git 才会track追溯该文件夹。的目录中创建一个名为。

2023-11-16 23:55:53 196

原创 如何理解transformer中mask多头注意力机制 -masked multi-head attention 详解

编码器以并行模式工作 - 它可以在恒定数量的步骤内生成输入序列("I love you")的向量表示(步骤的数量不取决于输入序列的长度)。在训练期间,我们知道I love you翻译成德语,应该是"Ich liebe dich"(在训练期间我们总是知道期望的输出,也就是监督学习)。假设编码器生成了向量表示为11、12、13(分别代表I love you,实际上,这些向量会更长,因为我们忽略了其它标记,如-序列的开始、-序列的结束等),但为简单起见,我们使用了短向量。当执行 #C 时,它会隐藏第3个输出。

2023-10-27 10:24:16 1277

原创 vscode快速生成html模板 --两种方法,亲测有用

注意:如果你的 HTML 文件中存在语法错误,自动格式化可能会失败。第二步,打开刚刚新键的空白html,在html页面内输入英文感叹号!在空白的html页面先输入英文的!(感叹号),选择第一个!,再回车,即可快速进入html的模板页面中。此时创建的是空白的html,但是html里面有很多重复标签我们不想每次都手动敲,怎么办?注意下面的三个感叹号是html的声明,按需选择使用哪个。

2023-10-09 22:16:09 11613

原创 Javascript报错: array undefined,数组未被定义

所以只需要将newArr[i]改为newArr,输出整个数组,而非数组中某一特定数据即可。注意,是因为最后一行代码报错:数组未定义,原因是因为i是在循环内被定义。系统无法确定newArr[i]中数组的具体的数据指向。

2023-09-27 20:27:36 500

原创 【React实战】vscode安装react

package.json:是webpack配置和项目包管理文件,项目中依赖的第三方包(包的版本)和一些常用命令配置都在这个里边进行配置,当然脚手架已经为我们配置了一些了。package-lock.json:是锁定安装时的版本号,并且需要上传到git,以保证其他人再npm install 时大家的依赖能保证一致。在vscode的【终端】写入:create-react-app my-app 即可创建项目名称为【my-app】的cli。3.初始化create-react-app【安装react的cli工具】

2023-09-23 06:28:36 1423

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除