自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

在网搬砖的日常

平平无奇的互联网民工

  • 博客(31)
  • 资源 (1)
  • 收藏
  • 关注

原创 速度800Token/s超快的Gorq和GPT4比较

Gorq 的 iOS 应用已经推出,支持的模型有 Llama3 8B 、 70B 、 Llama2 70B 、 Mixtral 8X7B 、 Gemma 7B。每秒800Token/每秒。

2024-04-22 20:01:37 195 1

原创 开源大模型微调工具 XTuner

支持几乎所有 GPU 上对 LLM 预训练或微调,可在 8GB GPU 上微调 7B , Llama3、Mixtral-8x7B、Qwen 等模型, LMDeploy、OpenCompass 集成。支持完整从微调,到部署,评测的一整套工具链。

2024-04-22 18:57:40 430

原创 网页内容压缩与解压教程

网页内容压缩是一种在网络上传输数据时,通过减小文件大小来提高传输速度的技术。它可以显著提高网站的加载速度,降低服务器带宽消耗,从而提高用户体验。在本教程中,我们介绍了网页内容压缩的概念,并详细讲解了gzip、deflate和brotli这三种常用的压缩方法。我们还分别演示了如何使用Node.js、Java和Python进行网页内容的压缩与解压。在实际应用中,我们应根据项目需求以及浏览器和服务器的兼容性来选择合适的压缩方法。同时,我们需要不断学习和实践,以便更好地掌握这些技术。

2024-04-17 15:52:27 575

原创 一遍关于自动AI小说推文的实现

PS: 市面上已经出现不少收费的软件工具, 类似极虎漫剪、速推之类封装好的工具, 但其核心功能实现都是一样, 要考验的还是GPT效果;今年出现的Sora相当这个赛道方向的进化版本, 在以后更有可能冲击影视制作领域(UE4)

2024-04-17 15:50:50 961

原创 Nginx基础2

在这个例子中,通过在Nginx配置中添加以上location块,可以通过访问 http://your_server/nginx_status 来获取Nginx的实时性能统计,包括活动连接数、请求数等。其中,ngx_http_stub_status_module 模块是一个常用的模块,用于提供Nginx的基本状态信息。在这个例子中,通过 log_format 指令定义了一个名为 main 的日志格式,然后通过 access_log 指令指定了日志文件的路径和使用的日志格式。

2023-11-30 09:33:33 100

原创 Nginx基础1

反向代理是Nginx的一项重要功能,通过反向代理,Nginx可以接收客户端的请求,并将这些请求转发到后端的服务器上,然后将后端服务器的响应返回给客户端。事件模型: Nginx使用的是基于事件的模型,主要包括两种事件,即连接事件和定时器事件。反向代理: 客户端不直接访问后端服务器,而是通过反向代理服务器,反向代理服务器负责将请求转发到后端服务器,并将后端服务器的响应返回给客户端。通过以上配置,Nginx会将后端应用的响应缓存起来,当下一次有相同的请求时,直接返回缓存的响应,减少了对后端服务器的请求。

2023-11-30 09:33:30 139

原创 数据竞赛top

【代码】数据竞赛top。

2023-11-29 11:46:21 80

原创 搬运_chatglm3 AutoDL 微调AdvertiseGen数据集

在 4090 上面运行 chatgm3 速度还是挺快的。然后找到官方的 AdvertiseGen 数据集,就是对商品的标签和文案的匹配数据。然后根据内容进行训练,然后再输入相关类似的标签,就可以自动生成广告文案了。这个是AIGC的挺好的落地场景。可以在 4090 上完成训练,并验证成功了!

2023-11-29 11:28:10 830

原创 2022年机器翻译评测报告

从上述皮尔森相关系数(Pearson correlation coefficient)可以看出,在英-德、英-葡、英-荷、英-法、英-西、英-朝鲜语语言对中, 相比BERTScore、hLEPOR、TER,COMET和人工评测的相关性更接近。近日,Intento公司与e2f公司合作发布《2022年机器翻译评测报告》,从9个行业领域、11个语言对评测了全球市场31个机器翻译引擎。其中,将几个自动评估方法与人工评测进行了比较,发现在15个语言对中的10个语言对中,COMET与人工评测的相关性优于其他评测方法。

2023-11-27 13:46:08 137

转载 clone-voice web声音克隆 6569ca92c6d243bca43cda850d5ab71d

整理: No。

2023-11-27 13:43:03 514

原创 Notion Github Actions 自动备份

因为 Notion 官方目前没有 API 支持导出备份整个空间, 所以需要从 Cookie 中获取相关值来实现自动备份.仓库一定要选 Private, 不然就公开啦!还是这个页面, 点击。

2023-11-27 13:23:50 254

原创 LLM大模型2_量化

完整值:https://github.com/ymcui/Chinese-LLaMA-Alpaca/blob/main/SHA256.md。合并LoRA,生成全量模型权重。可以直接指定🤗模型库的地址,也可以是本地存放地址。工具对上一步生成的全量版本权重进行转换,生成4-bit量化模型。这一步,我们将模型转换为ggml格式(FP16)。使用下述命令评测后发现两者相同,合并无误。

2023-11-27 13:15:32 598

原创 LLM大模型1_基础知识

其次,由於原始模型体积大速度慢等因素很多大老们发明了将其缩小但是不那么影响模型品质的方式,那就是量化,现在最常见的量化方式就是GPTQ和GGML.我们一般都是使用量化后的模型因為他们需要的VRAM或RAM能够降低很多.比如33B的模型没有量化大概需要50G~65G的VRAM或RAM,量化后24G就足够了.实际模型载入大概1XG,剩下的空间用来推理使用,已经完全足够.

2023-08-08 19:42:44 307

原创 从零开始训练一个GPT大语言模型

分词(tokenization) 是把输入文本切分成有意义的子单元(tokens)。[{‘generated_text’: ‘吕布回·曹操怒�\xa0却说姜维’}]

2023-08-02 22:35:33 1119

原创 Google Colab使用问题解决方法

按Ctrl+ Shift + i (Mac:command + option + i)

2023-06-28 16:29:24 769 5

原创 机器学习赛事-科大讯飞基于论文摘要的文本分类与关键词抽取挑战赛

一、赛事背景医学领域的文献库中蕴含了丰富的疾病诊断和治疗信息,如何高效地从海量文献中提取关键信息,进行疾病诊断和治疗推荐,对于临床医生和研究人员具有重要意义。二、赛事任务本任务分为两个子任务:机器通过对论文摘要等信息的理解,判断该论文是否属于医学领域的文献。提取出该论文关键词。

2023-06-28 10:25:00 289

原创 Notion trash垃圾箱一键清空

浏览器打开notion 开发者模式F12 Cookie里有’token_v2’

2023-06-10 13:26:51 1046

原创 pyaudio 音频录制区分声道设备 demo

常用采集率RATE = 16000。

2023-06-10 00:13:05 135

原创 selenium 去除cmd窗口

修复代码路径: (python环境)/Lib/site-packages/selenium/webdriver/commom/service.py。解决启动浏览器时win打开cmd窗口。

2023-06-10 00:05:44 382

原创 模型下载的几种方式

但是,这种方案也存在着一定的问题,即会下载仓库中的所有文件,会大大延长模型下载的时间。我们可以看到在目录中包含着flax_model.msgpack、tf_model.h5和pytorch_model.bin三个不同框架模型文件,在bert-base-uncased的版本中,还存在着rust版本的rust_model.ot模型,如果我们只想要一个版本的模型文件,这种方案就无法实现了。拷贝命令在终端执行,就可以下载了。下载后的格式,和前面自行实现的代码是一样,但是就使用体验上来看,这种方式明显会更加优雅!

2023-06-09 10:20:11 1509

原创 Whisper OpenAI开源语音识别模型

Whisper 是一个自动语音识别(ASR,Automatic Speech Recognition)系统,OpenAI 通过从网络上收集了 68 万小时的多语言(98 种语言)和多任务(multitask)监督数据对 Whisper 进行了训练。OpenAI 认为使用这样一个庞大而多样的数据集,可以提高对口音、背景噪音和技术术语的识别能力。除了可以用于语音识别,Whisper 还能实现多种语言的转录,以及将这些语言翻译成英语。语音转文字在许多不同领域都有着广泛的应用。

2023-06-04 22:04:32 6549 3

原创 TensorFlow2 数据管道Dataset

Dataset数据结构应用非常灵活,因为它本质上是一个Sequece序列,其每个元素可以是各种类型,例如可以是张量,列表,字典,也可以是Dataset。使用 tf.data API 可以构建数据输入管道,轻松处理大量的数据,不同的数据格式,以及不同的数据转换。但如果需要训练的数据很大,例如超过10G,无法一次载入内存,那么通常需要在训练的过程中分批逐渐读入。如果需要训练的数据大小不大,例如不到1G,那么可以直接全部读入内存中进行训练,这样一般效率最高。以下是一些构建高效数据管道的建议。

2023-02-20 14:32:54 156

原创 TensorFlow2 构造机器学习模型的步骤

TensorFlow2构造机器学习模型的步骤

2023-02-17 12:23:11 105

原创 异常处理_MacM1 python-akshare导入报错

就是少了文件,https//github.com/studyhub-co/PyMiniRacer,python3.8/site-packages/py_mini_racer/)

2022-07-21 17:30:44 2241 3

原创 地图自定义坐标点

分析周边地点距离和坐标

2022-07-13 12:06:47 183

原创 异常处理_docker服务启动异常-离线安装

docker服务启动异常-离线安装用 systemctl status docker.service 查看解决方法

2022-07-01 16:07:29 258

原创 异常处理_matplotlib数据分析包

matplotlib异常处理,中文乱码

2022-06-15 17:04:22 62

原创 python pdf 加密无法复制读取解决

加密分两种:1、打开文件需要密码的2、复制编辑需要权限密码的pdf哈希值获取(解决1)#!python3.8# coding=utf-8''' Author: Sanfor Chow Date: 2022-03-29 17:02:43 LastEditors: Sanfor Chow LastEditTime: 2022-03-29 17:02:43 FilePath: /knowledgeGraph/demo/pdf2john.py'''# Copyright (c) 2013

2022-03-30 10:57:57 1468

原创 量化交易-外资买入沪深300策略

import akshare as akimport plotlyimport plotly.offline as plyo # 保存图表,相当于plotly.plotly as py,同时增加了离线功能import plotly.graph_objects as go # 创建各类图表import plotly.figure_factory as ff # 创建tableak_stock_code = 'sh000300'ak_stock_na.

2022-01-24 17:28:49 942

原创 异常-keras_contrib安装

异常keras_contrib安装使用pipp安装后报错,keras_contrib未在pip库ModuleNotFoundError: No module named 'keras_contrib.layers'离线安装思路:使用github源码安装下载git clone https://github.com.cnpmjs.org/keras-team/keras-contrib.gitcd keras-contrib/python setup.py install验证使用成功

2021-09-18 09:32:53 355

原创 网络攻防-wifi密码忘记找回(一)

好字典能快很多,但也只是运气成分;推荐用Hashcat 提高速度。假如有Kali,可以发很多请求,让其它设备重连。6的参数可根据查找网络返回RSSI 设置;

2021-08-28 23:53:08 2773

Downie 4.7.10 可绕过验证 直接会员

Downie 4.7.10 可绕过验证 直接会员

2024-04-22

AccessClient_Win.msi

AccessClient远程桌面连接软件工具 局域网、远程办公。

2021-11-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除