- 博客(125)
- 收藏
- 关注
原创 使用twilio完成网上拨打电话和发送短信
to是你要拨打的电话,from是它送你的虚拟电话,或者你可以去买一个手机号码,url是这个电话拨通后,虚拟电话会说的话,你可以更改为自己的xml文件来说具体的话。首先是注册账户,然后它会给你个key和token,你可以免费用几次,但是只能给注册的手机号码打电话。这里我是用的python启动的本地服务,然后用ngork来使这个服务能够被本地访问。或者也可以采用twiml。
2024-09-06 13:41:11 373
原创 llamaindex实现rag
RAGAs为RAG系统的评估提供了一种灵活且高效的方法,尤其是在缺乏人工标注数据的情况下。通过利用大语言模型的能力,RAGAs能够在多个维度上评估检索和生成的质量,从而帮助开发者优化和改进他们的RAG应用。
2024-09-05 15:02:31 957
原创 livekitAI对话实践(python+next)
export LIVEKIT_URL=http://192.168.1.138:7880/(是启动的livekit的服务ip+端口号)export DEEPGRAM_API_KEY=(去官网创建就行)export OPENAI_API_KEY=(同上)启动成功后访问页面192.168.1.138:7800。2)根据下面的教程启动前端(next)和后端服务。1)根据上面的教程启动livekit服务。
2024-09-04 17:15:14 287
原创 关于语音合成这方面的一个工具包的使用
3) VoiceTranscriber 该工具会将语音文件的内容批量转换为带时间戳的文本并以字幕文件的形式保存。1)AudioProcessor 该工具会将媒体文件批量转换为音频文件然后自动切除音频的静音部分。2)VoiceIdentifier 该工具会在不同说话人的音频中批量筛选出属于同一说话人的音频。4)VoiceConverter 该工具会将文字转为语音并生成音频文件。
2024-09-04 10:34:01 160
原创 关于searxng
GitHub - ptonlix/LangChain-SearXNG: AI Q&A Search Engine ➡️ 基于LangChain和SearXNG打造的开源AI搜索引擎关于实习第一个任务就是部署SearXNG并且把集成搜狗微信这件事_searxng 架构-CSDN博客【好玩儿的Docker项目】SearXNG——自建一个属于自己的免费搜索引擎平台!尊重隐私、完全开源!-我不是咕咕鸽
2024-09-03 14:47:12 196
原创 区块链Hyperledger Fabric2.2 环境搭建
3)运行 sudo ./network.sh up很慢很慢,于是手动下载。# step 4:更新并安装Docker-CE。4)下载docker镜像是最慢的,卡住了,换源。2)进行到最后一步了,但是docker报错。# step 1: 安装必要的一些系统工具。1)compose-up用的是apt安装。# step 3:写入软件源信息。
2024-09-03 11:48:15 284
原创 fast-voice-assistant
but,你发现,这只是第一步,真正的难点在于完成.env中各个key的配置。首先我们来到这个据说50行代码就可以创建个人语音助手的github地址。一个提供大模型api-key的平台,类似于altogether。,主要用于构建高质量的音视频通话、实时数据传输和互动应用。这里需要申请,需要我用openai的key代替使用。后端python main.py dev。除了方便以外的大优势就是它提供了丰富的。一个最快的文本转语音模型Sonic。是一个开源的实时通信平台,基于。,支持多种平台,包括。
2024-09-02 12:12:01 682
原创 关于一些搜索的longchain实践
请把对于问题'{query}'的答案从里面提取出来,如果里面没有相关信息的化就说“找不到”template = '''在>>> 和
2024-08-21 13:34:44 335
原创 Transformer模型的调用过程与步骤
解码器(Decoder):与编码器类似,解码器也是多个堆叠的层,每个层由三个子层组成:自注意力层、编码器-解码器注意力层(Encoder-Decoder Attention Layer)和前馈神经网络层。自注意力层的输入是词嵌入和位置编码,输出是经过自注意力计算的编码。它还提供了把模型的输出转化回文本的方法。编码器-解码器注意力层:在解码器中,这一层用于获取编码器输出的信息,以帮助生成下一个单词的预测。前馈神经网络层:通过对自注意力层的输出进行一系列线性和非线性变换,得到最终的编码输出。
2024-08-19 17:37:25 279
原创 Applied-Machine-Learning代码记录
最后,它使用训练好的模型对新的评论进行情感分析,输出正面情感的概率。首先介绍了一些关于聚类的方法,然后用假数据画图,告诉我们肘部法则确定簇是多少最合适,然后开始应用k-means解决一个现实世界的问题:根据客户数据对客户进行细分,以确定新产品或促销活动的目标客户,从而增加他们的购买活动。使用著名的[iris数据集]构建一个简单的监督学习模型(https://en.wikipedia.org/wiki/Iris_flower_data_set),其中包含150个描述三种虹膜测量结果的样本。
2024-08-14 14:43:05 773
原创 Axolotl微调Qwen2-7b开源大模型!AutoGen+Marker自动生成数据集!AutoGen Studio+GPT4评估Qwen2文章能力,vllm部署qwen
配置文件中fp16设为false bfp16设为true。4.用Axolotl 和生成的数据集微调qwen。2.autogen studio 安装和启动。3.AutoGen+Marker生成数据集。从huggingface下载模型并部署。qlora-fsdp.yaml配置。如果数据集内容太少,需要将。导入模型刚才运行的模型。
2024-08-14 11:48:52 351 1
原创 firefly推理和微调qwen
这里我是将chat.py代码放到component文件夹下了,所以untils,而不是component.utils。在训练中,我们只保存adapter的权重,不保存合并后的模型权重。qwen-7b-sft-qlora.json内如如下。adapter与base model进行权重合并。environment.yml内容如下。train_qlora.py内容如下。6.docker打包conda环境。创建dockerfile。1.conda环境准备。6.合并后的模型推理。
2024-08-12 11:55:09 228
原创 gpt4o-mini+CrewAI+RAG检索增强生成打造提示词工程师AI智能体
稍后我会更新如何用本地大模型来完成这个过程。运行docker,获得向量数据库。运行下面的代码将pdf向量化。运行代码,获得你先要的提示词。
2024-08-08 14:03:36 276
原创 vscode+git解决远程分支合并冲突
现在的场景是我们本地cxh分支远程关联着远程cxh分支,我希望远程main分支合并远程cxh分支,但是报错,而且冲突太多不可以直接在github合并。合并冲突测试1/合并测试冲突1+合并测试冲突2/合并测试冲突2就行。上面的思路是首先切换到本地main,拉取远程main最新的代码。2)但如果是复杂的冲突,让我们回到vscode里面。再将本地main最新代码推送到远程main分支。1)远程分支和远程分支不复杂情况合并。然后将本地cxh合并到本地main。例如readme的冲突。《《《/》》》也要删掉。
2024-07-29 18:06:46 969
原创 完成stable将图片转换为二维码
sd-webui-controlnet不显示,报错ImportError: cannot import name 'load_file_from_url' from 'modules.modelloader'1)首先会遇到安装pip install -i https://pypi.tuna.tsinghua.edu.cn/simple basicsr==1.4.2卡住的问题。3.安装依赖(-i https://pypi.tuna.tsinghua.edu.cn/simple 清华源安装)
2024-07-29 16:17:34 718
原创 llama3.1-8B-微调
库中用于特定任务(例如微调)的训练类。代码配置了训练参数、数据集和模型,并为训练过程定义了一些关键设置。3)应用LoRA技术来减少模型训练和推理时的内存使用,同时保持模型性能。进行模型推理,生成一个给定指令的响应。9)推送模型到hugging-face。4)加载一个数据集,并规范格式。实例,用于训练一个语言模型。使用unslothai微调。10)加在本地模型进行推理。
2024-07-26 15:09:49 846
原创 Transformer自然语言处理实战pdf阅读
文本摘要的目标是输入一段长文本,然后生成包含所有相关事实的简 短版本。这是一项比前面所讲任务复杂得多的任务,因为它需要模型 生成连贯的文本。我们通过以下熟悉的模式实例化文本摘要:得出的摘要还不错!尽管其只是简单地复制粘贴部分原始文本,但该 模型能够捕捉到问题的根源,并正确识别“Bumblebee”(出现在输入 文本的末尾)是投诉者。
2024-07-23 18:01:13 1047
原创 阿里云ubuntu宝塔面板部署uni-app-flask-websocket前后端项目
但是令我惊奇的是,我发现,打开ip,不仅仅前端有了,后端也有了,好吧,打包的时候忘记改前端对应的后端ip了,一会再打包一下吧。========================面板账户登录信息==========================现在访问ip还是会报错,原因是打包的前端文件里访问的是本地的后端接口,改为我的ip才对。#SSL-START SSL相关配置,请勿删除或修改下一行带注释的404规则。部署成功后,在浏览器输入你的ip即可访问,我们可以看一下宝塔面板的nginx设置。
2024-07-22 15:21:55 1198 1
原创 GraphRAG+ollama+LM Studio+chainlit
这里我们进一步尝试将embedding模型也换为本地的,同时熟悉一下流程和学一些新的东西1.环境还是用之前的,这里我们先下载LLM然后你会在下载nomic模型的时候崩溃,因为无法搜索,无法下载解决办法如下按照上面的教程依旧无法下载模型,但是可以搜索了,没什么用直接hugging face下载,然后导入llm models文件夹注意有格式要求将模型放在这个文件夹里才能被识别,然后加在模型然后修改配置。
2024-07-19 14:43:05 757
原创 解决一下git clone失败的问题
然后我git clone http://github-private:github_pat_11A6PKOQI0INufjeDoJTUXUIY2IF62Vblnvn@github.com。git clone http://token名字:token的值@github.com/用户名/仓库.git。然后我们git clone git@github.com:lx1/sun01.git。然后我又用了我同事的token试了一下,依旧不行,我真的裂开。于是我用我同事(创建者的token)试了一下,终于成功了。
2024-07-16 11:55:42 1741
原创 前端传给你用户id和token,你该如何做
2.如果token不为空,你要对这个token进行解密:看解密后的用户id与传过来的id是否对的上,如果对的上,则返回你想返回的东西,如果对不上,则返回error。3.解密后的时间对的上吗,如果token你设置的有效时间是2小时,过期了,就要重新返回一个新的token。1.如果一开始传过来的token为空(即用户第一次使用这个功能),你要生成一个token并返回。前端传给你用户id和token。作为后端,你要进行思索。curl命令进行测试。
2024-07-15 16:47:34 227
原创 复学数据结构
线段树的时间复杂度为 O(logn)O(\log n)O(logn),在需要频繁更新和查询的场景中非常有效。链表是一种数据结构,它由一系列节点(Node)组成,每个节点包含两部分:存储数据的部分和指向下一个节点的指针(或引用)。链表的第一个节点称为头节点(Head),最后一个节点的指针指向空(NULL或None),表示链表的结束。在下一步中,搜索A的最近节点的邻居,并且在后续步骤中继续处理。通过差分数组,我们可以将复杂的区间修改操作简化为对差分数组的简单操作,从而提升效率。例如,在我们之前的哈希函数(
2024-07-15 12:10:35 1071
原创 transformer的了解
3)有encode和decode两种模式,前者可以看到去拿不信息,后者可以看到部分信息(Transformer模型由编码器(Encoder)和解码器(Decoder)组成,两者共同用于序列到序列的任务(如机器翻译)。要减少 KV 缓存的大小)多头机制的实现:通过多个头(多个不同的Q、K、V矩阵),可以并行地处理输入数据,从不同角度进行注意力计算,从而增强模型的稳定性和泛化能力。Pre-Norm:在一些更深的网络或初期训练更困难的模型中,预规范化可以提供更稳定的梯度,防止训练过程中的数值问题。
2024-07-09 16:39:26 422
原创 有关区块链的一些数学知识储备
比如我们需要定义函数 f,满足 𝑓(1)=𝑥,𝑓(2)=𝑦,𝑓(3)=𝑧f(1)=x,f(2)=y,f(3)=z ,那么只需要定义两个集合 {1,2,3},{𝑥,𝑦,𝑧}{1,2,3},{x,y,z} ,二者进行笛卡尔积,并取结果的子集即可得到目标映射关系 (1,𝑥),(2,𝑦),(3,𝑧)(1,x),(2,y),(3,z)。得到最大公约数 gcd(30,24)=6gcd(30,24)=6, 而 (𝑥,𝑦)=(𝑥0,𝑦0)=(1,−1)(x,y)=(x0,y0)=(1,−1).
2024-07-09 15:16:33 1538
原创 ERROR in ./src/utils/route.js 2:0-24Module not found: Error: Can‘t resolve ‘path‘ in ‘C:\Users\lzt\
vue.config.js添加。
2024-07-05 10:24:04 116
原创 proto的前后端使用
生成 JSON 文件供 JavaScript 使用。首先定义一个input.proto文件。# 生成 Python 代码。
2024-07-01 10:42:26 228
原创 部分力扣题记
然后如果map(char)不为真,意味着是右边的部分)】},我们就进行判断,如果map(char)=现在栈顶的元素stack.pop(),就返回真,不然报错。二叉树是一种树形数据结构,其中每个节点最多有两个子节点,通常称为“左子节点”和“右子节点”。然后遍历,如果map(char)为真,就意味着是左边的部分(【{,将其入栈。这个题首先你得手动构建一下二叉树结构,然后写一个方法将数组变为二叉树结构。我们利用map的特性,将()【】{},分别一一对应。这题用到了map和栈的知识点。最后用入栈和出栈实现。
2024-06-28 15:31:17 144
java的压测道具java的压测道具java的压测道具java的压测道具java的压测道具java的压测道具java的压测道具j
2024-08-15
vscode+git基本操作vscode+git基本操作vscode+git基本操作vscode+git基本操作
2024-07-29
基于对话记录生成用户画像
2024-04-18
TA创建的收藏夹 TA关注的收藏夹
TA关注的人