自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(195)
  • 资源 (5)
  • 收藏
  • 关注

原创 langchain 基于ES的数据向量化存储和检索

3、多语言模型:BAAI/bge-m3 支持的输入长度

2024-05-08 21:06:45 725

原创 elasticsearch 关于向量化检索

向量检索,RAG

2024-04-18 16:54:50 1103 1

原创 语义相似性计算

语义匹配

2024-04-08 16:38:07 1037

原创 ASR工业化语音模型总结

ASR模型罗列,不做进一步展开

2024-03-26 10:58:28 365

原创 对文件进行邮件的定时生成和发送

send_email("name1@yourcompany.com",["name2@qq.com"],"test","hi, 大家好",save_file_path)#此处决定你发送的邮件范围,多个用空格分开,比如要发送给111555555@qq.com则对应的域名为qq.com。创建一个邮件目录,如/opt/email,并进入/opt/email。5、 telnet localhost 9925 验证是否部署成功。3、编辑docker-compose文件。2、在当前目录下编辑main.cf。

2024-03-19 15:26:04 424

原创 ASR语音识别纠错-fast correct

vi train_pretrain.sh (第9行数据赋值为data-bin,第12行为data-pretrain,第13行修改增加CUDA_VISIBLE_DEVICES=3,4)align_cal_werdur_v2.py original_query_file target_query_file 可以将纠错内容进行对齐生成对齐数据集。**********************下载sentencepiece对应的模型*************************************

2024-03-12 19:51:25 1438

原创 python 服务 fastapi

服务执行:uvicorn correct_service:app --host 0.0.0.0 --port 22101。fast api 服务。

2024-03-11 19:17:03 466

原创 gpu 相关知识

CUDA_VISIBLE_DEVICES 进行多GPU使用时,决定哪几块GPU对程序可见,多用于多GPU训练推理等。

2024-03-05 16:29:06 326

原创 python第三方包总结(有好用的包欢迎留言)

python 优秀的第三方包工具总结

2024-02-23 10:58:25 366

原创 basicsr 安装问题

安装时,如果使用单一源安装,由于原的包不完整性,容易导致安装失败:tb-nightly清华源不存在。basicsr依赖torch和torchvision和tb-nightly。其中torch根据自己的需要指定版本(不指定会使用最高版本)

2024-02-20 15:06:23 1415 1

原创 AIGC:文本生成视频

AIGC:文本到视频生成的算法模型总结积累

2023-11-29 19:23:53 518

原创 pyqt5使用经验总结

值为:Lib\site-packages\PyQt5\Qt\plugins。健名:QT_QPA_PLATFORM_PLUGIN_PATH。

2023-10-02 20:50:25 436

原创 大模型lora微调-chatglm2

llm_question="ddsfdsfddsfsdg\nA. 非常满意\nB. 满意\nC. 不满意\nD. 非常不满意\n答案:".format(line_format)[{"instruction":"阅读下列短文,从每题所给的四个选项《A、 B、 C和D)中。[{"instruction":"阅读下列短文,从每题所给的四个选项《A、 B、 C和D)中。"output:"A"}]训练数据文件配置到dataset_info.json中。ckpt_path = "lora微调后的模型"

2023-09-25 17:45:11 578

原创 elasticsearch 遍历索引数据

【代码】elasticsearch 遍历索引数据。

2023-08-22 15:58:50 246

原创 已经开源的中文大模型对比,支持更新

已经开源的中文大模型对比

2023-08-17 13:40:59 912

原创 hive 和hadoop相关总结

7、表查询聚类(先聚类-再查询-再排序):select a,count(*) as frequency from mydb.t1 group by name order by frequency desc;11、给已经存在的表级联插入新列:alter table mydb.t1 add columns (name string) cascade;10、给已经存在的表插入新列:alter table mydb.t1 add columns (name string);1、表复制(五分区表复制)

2023-07-26 20:06:52 390

原创 bark 环境部署相关

conda create -n bark python=3.10.9 cudnn=8.4.1.50 cudatoolkit=11.7.0 ffmpeg x264conda activate barkpip install torch==2.0.0+cu117 torchvision==0.15.1+cu116 torchaudio==2.0.1 --index-url https://download.pytorch.org/whl/cu117pip install -r requirmen

2023-05-15 15:24:08 356

原创 在bat脚本中激活conda环境

显示的是base环境,实际已经激活。

2023-04-28 16:42:55 942

原创 numpy 常见函数总结

numpy 常见函数总结

2023-04-14 16:12:54 457

原创 mongo docker 部署

镜像拉取(最新的镜像拉取后显示异常)

2023-04-09 11:24:36 102

原创 亲测可用,scrapy爬虫展示例

scrapy爬虫展示例

2023-04-04 15:10:37 642

原创 tensorflow 常见方法总结

tensorflow 常见方法总结

2023-03-22 09:54:08 198

原创 多目标推荐:MMOE

多目标推荐:MMOE

2023-03-20 18:43:38 345

原创 使用anaconda 安装paddle gpu环境

使用anaconda 安装paddle gpu环境

2023-03-20 15:32:50 2887 1

原创 关于FM模型的相关知识梳理

关于FM模型的相关知识梳理

2023-03-16 14:11:19 154

原创 国外资源国内镜像访问(亲测)

国外资源国内镜像访问huggingface、git、pip源、conda源

2023-03-16 11:15:09 23646 4

原创 python3.6.8 基础镜像

dockerfile 关于python3.6.8

2023-03-08 09:42:16 364

原创 基于T5的模型微调以及对应的数据介绍

基于T5模型实现多任务训练

2023-03-07 18:10:27 3277 3

原创 基于序列化的预测

本文实现了基于lstm的预测模型的训练代码,感兴趣的自行复制

2023-03-03 18:30:24 84

原创 gradio 关于tab展示内容演示代码

gradio 关于tab展示内容演示代码

2023-03-03 11:12:32 3062

原创 asr 语音识别方法 基于paddle的方法

asr声音内容识别

2023-02-27 09:31:29 556

原创 关于gpt2生成的训练验证

gpt2生成的训练验证的感想

2023-02-21 19:33:29 257

原创 tensorflow gpu环境安装

tensorflow2.x gpu环境配置

2023-02-15 16:09:35 845

原创 基于tensorflow keras的simcse训练以及bert相关知识

基于bert的下游任务训练实现样例:simcse

2023-02-14 16:32:08 467

原创 基于transformer和相关预训练模型的任务调优

基于transformer和相关预训练模型的任务调优

2023-01-31 19:12:06 516

原创 从tf.math.log_softmax和tf.keras.losses.SparseCategoricalCrossentropy看softmax的上溢和下溢问题

softmax的上溢和下溢问题

2023-01-16 19:05:06 422

原创 tf.keras.losses.SparseCategoricalCrossentropy 学习总结

SparseCategoricalCrossentropy相关参数解析

2023-01-13 18:27:00 861

原创 推荐策略之als基于tensorflow2

推荐策略之als基于tensorflow2

2023-01-11 18:53:59 150

原创 tensorflow serving 的相关知识

tensorflow serving 关于模型的部署,客户端的请求方式

2023-01-09 18:20:21 235

原创 tf.keras.layers.TextVectorization层介绍及自定义分词器

TextVectorization的相关介绍:普通字符串如何进行快速数字化转换

2023-01-05 19:12:00 726

基于CDH的spark集群搭建

基于CDH的spark集群搭建,包括了httpd等服务的部署过程

2022-09-15

xencenter.zip

物理机虚拟化管理客户端

2022-09-09

数字人(虚拟人物)技术架构和分析

虚拟人物逐渐火爆,类似虚拟主播、虚拟人物、数字人、孪生技术等的发展,虚拟人物的技术研究充满了诱惑力。为此我们梳理了相关技术以供参考

2022-05-16

spark-streaming-kafka-0-8稳定版

spark流式读取kafka的数据

2022-04-12

单向同义词库,可用于智能改写,语义替换

单向同义词库,可用于智能改写,语义替换

2022-04-06

elasticsearch 分词器总结

elasticsearch 分词器总结

2022-03-15

linux与防火墙实践经验

在东软实习中学习的301重定向内容,关于其中的的模式配置、linux命令行操作做了一个总结

2015-08-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除