自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

XD的博客

一直努力,千万别急

  • 博客(76)
  • 资源 (1)
  • 收藏
  • 关注

原创 大模型文本分类任务——提示词优化建议

在自然语言处理(NLP)领域,大型模型已展现出卓越的性能,涵盖了包括判别式任务和生成式任务在内的多种传统NLP任务。尽管基础NLP大模型的表现已相当出色,但在特定工业领域或场景中,对准确率的要求可能更为严苛。当然,如果上述建议仍未能满足要求,我们可以在后期对错误案例进行单独分析,或者切换至符合条件的其他大型模型。这两种方案适用于不同的场景:当场景对准确率的要求极高,且领域知识包含大量专业术语时,进行模型微调是必要的;二、明确指令要求,不仅要清晰地表述期望大模型执行的任务,还需指示其判断和思考的过程及依据。

2024-09-18 15:57:34 307

原创 windows上进行git初始化时报错:fatal: unknown write failure on standard output

命令时遇到 “unknown write failure on standard output” 错误,这通常指示在尝试创建新的 Git 仓库时,有一些底层的写入问题。这个工具的下载可能还有些不方便,可以到我的分享中下载,路径是:https://download.csdn.net/download/weixin_36893273/89381366。检查您的 Git 配置,特别是与编辑器或 diff 工具相关的配置。确保您的 Git 版本是最新的,或者至少是兼容的版本。如果是,您需要释放一些空间才能继续。

2024-05-31 15:47:56 2035 1

原创 python项目中的日志定义

以上方法,简单 的创建了一个获取logger的方法,更个性化或者更复杂的配置可以参考官方文档:https://docs.python.org/zh-cn/3/library/logging.html。python日志定义,包含配置文件,和日志实例创建方法。一、日志创建方法,创建一个loger实例。

2024-05-31 14:17:41 233 1

原创 python项目报错

原因,在调用logger.info()方法时,直接將非str类型的变量放入其中。直接將需要打印的变量强制转为str类型。

2024-05-30 09:57:39 358

原创 如何让大模型更聪明?

另一方面,这个架构对于硬件的依赖是很深的,可以看到,现在的大模型越来越依赖参数量的大小,从而对硬件的依赖也越来越深, 巨大的参数量代表着训练和推理对机器资源的要求更高,更大。比如 2010年以前大家更多的是使用机器学习算法, 它的优点是可解释性更强,但是机器学习算法对于CV和NLP的支持并不是很好,当时的NLP和CV领域大多数还是用的专家系统或者规则, 当时也有LSTM和CNN等深度学习模型,但是由于算力的局限性,造成了一直没有在工业界普遍的应用。那么,如何让大模型变得更聪明呢?

2024-05-27 19:48:31 319

原创 开源大模型与闭源大模型,你更看好哪一方?

开源:包括模型源码开源, 论文或者技术文章开源, 预训练的参数也开源,目前比较流行的大模型开源网站包括 huggingface,国内的魔搭社区等闭源:只提供api接口或者web访问服务,一般有公司运营优化。服务分为免费版和收费版。

2024-05-25 13:49:27 1356 1

原创 python项目中的配置文件定义

这种方法适用于小项目,方便高效,也是我常用的方式,使用方便,直接import就可以;但是缺点也很明显,不容易拓展。...

2024-05-22 19:52:23 503

原创 ElasticSearch的python api以及dev tool方式的基本操作

如果没有额外的安全验证,需要指定的内容包括:集群ip地址(list类型),端口号(每个节点的端口号可能不同,这里是字符串,代表所有节点的端口号是一样的),用户名,密码。如果你的Elasticsearch集群启用了安全性功能,你可能需要确保你的Kibana实例已经使用具有足够权限的用户进行了认证,以便能够执行删除索引的操作。es的查询方式很灵活,可以单独写一篇文章, 就先不列在这里面了,它可以模糊查询,可以计算文档距离,也可以精确查询,可以说非常丰富灵活。在你的Web浏览器中打开Kibana的Web界面。

2024-05-11 17:00:34 1079 5

原创 git更新代码的步骤

git push origin (远程分支名称):(本地分支名称)git branch #列出。另一种方法是指定一下。

2024-05-11 16:14:53 1340

原创 stable diffusion WebUi本地安装

Stable Diffusion是一种先进的文本到图像的生成模型,它可以根据给定的文本输入生成高度逼真的图像。Stable Diffusion模型因其高效性和灵活性,在AI图像生成领域引起了广泛关注,并在实际应用中展示了其强大的能力。随着技术的不断发展,Stable Diffusion预计将在更多领域发挥重要作用,推动机器学习和深度学习的进步。

2024-05-11 14:10:58 507 1

原创 windows11获取笔记本电脑电池健康报告

可以看到当前完全充电的容量是大于电池设计容量的,如果 完全充电的容量不足设计容量的30%的话,可能电池需要换了。测量误差:可能是由于测量设备或方法的不准确导致的误差。更新的设计容量:电池可能经过了技术更新,制造商提高了电池的设计容量,但用户所知的设计容量信息还未更新。电池老化补偿:一些智能设备或电池管理系统(BMS)可能会尝试通过算法补偿电池老化导致的容量损失,从而使得显示的完全充电容量看起来比实际设计容量要高。

2024-05-08 13:52:29 3841 2

原创 首发!Llama3纯本地部署攻略!中文方法!

完成了LLAMA3的模型部署,从测试的结果可以看到, llama3的基础模型对于中文的支持并不好,我们的问题是中文,它却返回了英文的结果,原因可能是因为它的训练集有15个T但是其中95%是英文,想要它支持中文更好,还需要使用中文的训练集进行微调,可喜的是,微调llma系列的中文训练集并不少(可能是因为llama系列都有这个问题),后续我会接着对llama3进行微调, 待续。。。

2024-04-22 14:07:30 14707 6

原创 安装CUDNN详细过程

cuDNN(CUDA Deep Neural Network library)是由NVIDIA开发的深度学习GPU加速库。cuDNN包含了许多针对神经网络操作进行高度优化的函数,旨在使深度学习框架能够在NVIDIA的GPU上实现最佳性能,这个库提供了高效计算和加速,支持包括卷积神经网络在内的多种深度学习网络,并兼容多种常见的深度学习软件,如CNTK、Caffe、Theano、Keras、TensorFlow等。

2024-04-15 17:24:46 9105

原创 triton入门实战

这篇文章主要讲的是基于官方镜像及, pytorch script 格式模型,构建tritonserver 服务。

2024-04-15 15:22:59 1744

原创 微信签名和微信名真的反应人的性格吗?

微信签名仿佛成了一种心理暗示,反映出人们对美好品质的向往和追求,同时也揭示了他们在现实生活中所缺乏的。经过我多年的观察和总结,发现微信签名或者微信名有个特点,好像生活中越缺少什么,签名就会越写什么。签名是财源广进,八方来踩的可能是缺钱。签名是心静如水的通常生活中容易着急。签名是海纳百川的通常生活中很狭隘。签名是自强不息的通常生活中很懒惰。有的人签名是一首诗,可能文化不高。签名是知足常乐的通常生活中很贪。签名是舍得,这个人生活中很抠门。

2024-04-04 18:35:25 180

原创 paddlepaddle模型转换onnx指导文档

因为安装 完成paddlepaddle后还需要安装其他依赖,所以我们加上 -i 指定国内的pip源。cuda驱动版本为516.94。报错内容: cudnn没有装!成功生成onnx文件。

2024-04-04 17:13:33 1069

原创 tensflow模型转onnx实践

TensorFlow™是一个基于数据流编程(dataflow programming)的符号数学系统,被广泛应用于各类机器学习(machine learning)算法的编程实现,其前身是谷歌的神经网络算法库DistBelief [1]。Tensorflow拥有多层级结构,可部署于各类服务器、PC终端和网页并支持GPU和TPU高性能数值计算,被广泛应用于谷歌内部的产品开发和各领域的科学研究 [1-2]。

2024-04-03 17:07:20 1585

原创 glm2大语言模型服务环境搭建

ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,ChatGLM2-6B 引入了如下新特性:更强大的性能:基于 ChatGLM 初代模型的开发经验,我们全面升级了 ChatGLM2-6B 的基座模型。

2024-04-03 16:22:22 1034

原创 GLM论文研读

目前已经发展出多种预训练模型,包括自编码模型(如BERT)、自回归模型(如GPT)和编码器-解码器模型(如T5)。然而,这些模型并未在自然语言理解(NLU)、无条件生成和条件生成这三类任务中都达到最佳表现。为此,我们提出了一个基于自回归式空格填充的通用模型(GLM)以应对这一挑战。GLM通过加入二维位置编码,并允许以任意顺序预测片段,优化了空格填充预训练,这使得其在NLU任务上的性能优于BERT和T5。同时,GLM可以通过调整空白数量和长度,针对不同类型的任务进行预训练。

2024-04-02 11:16:35 1938 3

原创 基于Pytorch+昇腾NPU部署baichuan2-7B大模型

Baichuan 2 是百川智能推出的新一代开源大语言模型,采用2.6 万亿Tokens 的高质量语料训练。Baichuan 2 在多个权威的中文、英文和多语言的通用、领域 benchmark 上取得同尺寸最佳的效果。它基于 Transformer 结构,在大约1.2万亿 tokens 上训练的70亿参数模型,支持中英双语,上下文窗口长度为4096。项目地址预训练模型modelscope硬件要求:NPU:8 x Ascend NPUsModelLink旨在为华为昇腾芯片。

2024-04-02 11:12:23 3207 11

原创 昇腾glm3大模型lora微调及推理

ChatGLM3 是智谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型。ChatGLM3-6B 是 ChatGLM3 系列中的开源模型,在保留了前两代模型对话流畅、部署门槛低等众多优秀特性的基础上,ChatGLM3-6B 引入了如下特性:更强大的基础模型,更完整的功能支持,更全面的开源序列。

2024-03-29 17:31:26 1519 1

原创 pytorch快速入门中文——07(TensorBoard)

在中,我们向您展示了如何加载数据,如何通过定义为nn.Module子类的模型提供数据,如何在训练数据上训练该模型以及在测试数据上对其进行测试。为了了解发生的情况,我们在模型训练期间打印一些统计数据,以了解训练是否在进行中。但是,我们可以做得更好:PyTorch 与 TensorBoard 集成在一起,TensorBoard 是一种工具,用于可视化神经网络训练运行的结果。本教程使用说明了其某些功能,可以使用将其读入 PyTorch。我们将从。

2023-06-29 09:58:39 1547

原创 pytorch快速入门中文——06(torch.nn)

现在,我们有了一个通用的数据管道和训练循环,您可以将其用于使用 Pytorch 训练许多类型的模型。要了解现在可以轻松进行模型训练,请查看示例笔记本。当然,您需要添加很多内容,例如数据扩充,超参数调整,监控训练,迁移学习等。这些功能可在 fastai 库中使用,该库是使用本教程中所示的相同设计方法开发的,为希望进一步推广其模型的从业人员提供了自然的下一步。我们承诺在本教程开始时将通过示例分别说明torch.nnDataset和DataLoader。

2023-06-29 09:40:19 840

原创 pytorch快速入门中文——05

在幕后,每个原始的 Autograd 运算符实际上都是在张量上运行的两个函数。正向函数从输入张量计算输出张量。反向函数接收相对于某个标量值的输出张量的梯度,并计算相对于相同标量值的输入张量的梯度。在 PyTorch 中,我们可以通过定义的子类并实现forward和backward函数来轻松定义自己的 Autograd 运算符。然后,我们可以通过构造实例并像调用函数一样调用新的 Autograd 运算符,并传递包含输入数据的张量。在此示例中,我们将模型定义为而不是,其中是三次的勒让德多项式。

2023-06-29 09:30:00 644

原创 pytorch快速入门中文——04(训练图片分类器)

之前从“神经网络”部分复制神经网络,然后对其进行修改以获取 3 通道图像(而不是定义的 1 通道图像)。让我们使用分类交叉熵损失和带有动量的 SGD。

2023-06-28 17:32:21 1582

原创 pytorch快速入门中文——03

您只需要定义forward函数,就可以使用autograd为您自动定义backward函数(计算梯度)。您可以在forward函数中使用任何张量操作。模型的可学习参数由返回让我们尝试一个32x32随机输入。注意:该网络的预期输入大小(LeNet)为32x32。要在 MNIST 数据集上使用此网络,请将图像从数据集中调整为32x32。注意torch.nn仅支持小批量。整个torch.nn包仅支持作为微型样本而不是单个样本的输入。例如,nn.Conv2d将采用的 4D 张量。如果您只有一个样本,只需使用。

2023-06-28 17:20:34 1010

原创 pytorch快速入门中文——02

是 PyTorch 的自动差分引擎,可为神经网络训练提供支持。在本节中,您将获得有关 Autograd 如何帮助神经网络训练的概念性理解。

2023-06-28 17:02:36 1143

原创 pytorch快速入门中文——01

无缝替换NumPy,并且通过利用GPU的算力来实现神经网络的加速。通过自动微分机制,来让神经网络的实现变得更加容易。

2023-06-28 16:56:08 1266

原创 python中的函数——笔记

不仅Python函数是真正的对象,任何Python对象都可以表现得像函数。为此,只需实现实例方法__call__。实现__call__方法的类是创建函数类对象的简便方式,此时必须在内部维护一个状态,让它在调用之间可用,例如BingoCage中的剩余元素。装饰器就是这样。装饰器必须是函数,而且有时要在多次调用之间“记住”某些事[例如备忘(memoization),即缓存消耗大的计算结果,供后面使用。创建保有内部状态的函数,还有一种截然不同的方式——使用闭包。

2023-03-07 09:58:06 468 1

原创 python的文本和字节序列

可以肯定的是,某些字节流不是ASCII,因为其中包含大于127的字节值,而且制定UTF-8和UTF-16的方式也限制了可用的字节序列。因此,从Python 3的str对象中获取的元素是Unicode字符,这相当于从Python 2的unicode对象中获取的元素,而不是从Python 2的str对象中获取的原始字节序列。:编码是在码位和字节序列之间转换时使用的算法。一种重要的编码,是其他编码的基础,例如cp1252和Unicode(注意,latin1与cp1252的字节值是一样的,甚至连码位也相同)。

2023-03-06 10:12:26 594

原创 python字典和集合——笔记

也就是说,如果有一个类继承了dict,然后这个继承类提供了__missing__方法,那么在__getitem__碰到找不到的键的时候,Python就会自动调用它,而不是抛出一个KeyError异常。如果给这个类一个映射,它会返回一个只读的映射视图。因为Python会设法保证大概还有三分之一的表元是空的,所以在快要达到这个阈值的时候,原有的散列表会被复制到一个更大的空间里面。1.1如果一个对象是可散列的,那么在这个对象的生命周期中,它的散列值是不变的,而且这个对象需要实现__hash__( )方法。

2023-03-05 12:49:31 626

原创 python中的序列——笔记

ABC语言时一个致力于为初学者设计编程环境的长达十年的研究项目。Python也从ABC那里继承了用统一的风格去处理序列数据这一特点。不管是哪种数据结构,字符串、列表、字节序列、数组、XML元素,抑或是数据库查询结果,它们都共用一套丰富的操作:迭代、切片、排序,还有拼接。在切片和区间操作里不包含区间范围的最后一个元素是Python的风格,这个习惯符合Python、C和其他语言里以0作为起始下标的传统。这样做带来的好处如下。

2023-02-28 21:03:59 1197

原创 【论文学习】RNN Encoder–Decoder机器翻译

在本文中,作者提出了一种称为RNN编码器-解码器的新型神经网络模型-由两个循环解码器组成神经网络。一个RNN作为编码器将一系列符号编码为固定长度的向量表示,另一个RNN作为解码器将固定长度的向量表示形式解码为另一个符号序列。所提出模型的编码器和解码器是联合训练的,最大化在给定源序列的情况下得出目标序列的条件概率。通过使用RNN编码器- 解码器计算的短语对的条件概率作为现有对数线性中的附加功能模型。

2022-10-11 14:56:36 1453

原创 torch.nn中GRU使用

【代码】torch.nn中GRU使用。

2022-10-10 13:56:26 3336

原创 torch.nn中LSTM使用

【代码】torch.nn中LSTM使用。

2022-10-09 18:27:58 3359 4

原创 随笔记录——gensim word2vector使用

实现例子:这里是处理文本翻译数据集,这里使用word2vec进行词嵌入。

2022-10-09 16:09:24 435

原创 机器学习——朴素贝叶斯

朴素贝叶斯

2022-08-19 15:16:57 350

原创 torch.nn.utils.rnn下面pack_padded_sequence和pad_packed_sequence方法

这个函数主要做了两件事: pad 和封装,因为在rnn模型中,一般先将batch中的数据按照一个时间步一个时间步喂入模型的,这个包的主要作用就是将按照样本堆叠的数据,抽取出时间步这个维度重新堆叠。batch_first: batch 是否在第一位,默认值是False,上面的例子指定为了True,因为是二维,方便观察理解,一般放入lstm或者gru是需要时间步放在第一位的。需要注意的是,默认条件下,我们必须把输入数据按照序列长度从大到小排列后才能送入 pack_padded_sequence ,否则会报错。.

2022-08-11 11:14:06 1161

原创 随笔记录——pytorch词嵌入方法

一般先将原始的文本数据进行初步的词嵌入,再进行模型训练, pytorch也提供了基本的词嵌入方法。

2022-08-03 15:30:09 527

原创 随笔记录——pandas 中 Dataframe.to_dict()

在工作中,使用pandas时,常常需要将dataframe中的数据按照指定的格式输出给下游使用,很多时候,下游指定的格式并不是很特别,而是比较常见的,这时,我们就不需要自己专门定义方法去处理了,可以先看一下有没有现成的方法可以调用,会节省我们很多时间,提高我们程序的效率。下面我介绍一下dataframe的一个格式化输出的方法,to_dict()1、 使用默认的to_dict()格式化输出df = pd.DataFrame({'col1': [1, 2], 'col

2022-03-30 14:21:30 2820

BGE系列模型原论文,rag中的rerank模型

BGE模型,全称为BAAI General Embedding模型,是由北京智源研究院研发的一系列通用语义向量模型。自2023年8月发布以来,BGE模型家族已经推出了多个版本,包括BGE v1.0、v1.5和多语言模型BGE-M3。这些模型在语义理解和跨语言映射方面取得了显著进展,为自然语言处理领域带来了新的突破 。 BGE模型的特点包括: 多语言性(Multi-Linguality):BGE模型支持超过100种语言,能够处理不同语言之间的语义匹配任务,建立有效的跨语言语义联系 。 多功能性(Multi-Functionality):BGE模型集成了稠密检索、稀疏检索、多向量检索等检索功能,可以一站式服务不同的语义检索场景 。 多粒度性(Multi-Granularity):BGE模型可以处理不同粒度的输入文本,包括句子、段落、篇章和文档,最大输入长度可达8192 。

2024-07-11

高效进行数据科学工作的python库和一些trick

Python在数据处理方面有许多技巧(tricks),可以帮助提高效率和简化任务。以下是一些常用的Python数据处理技巧: 使用Pandas的read_*函数:Pandas库提供了多种读取数据的功能,如read_csv(), read_excel(), read_sql()等,可以快速加载不同格式的数据。 数据清洗:使用Pandas的dropna(), fillna(), replace()等函数来处理缺失值和异常值。 数据类型转换:使用Pandas的astype()函数来转换数据列的数据类型。 条件筛选:使用布尔索引进行条件筛选,例如:df[df['column_name'] > value]。 数据分组:使用groupby()函数对数据进行分组,并使用聚合函数如sum(), mean(), count()等进行分析。 数据合并:使用merge()或concat()函数来合并多个数据集。 数据重塑:使用pivot_table(), melt(), stack(), unstack()等函数来重塑数据。 时间序列处理:使用Pandas的to_datetime()函数

2024-06-25

知识图谱发展史及关键技术

知识图谱是一种结构化的语义知识库,它通过将复杂的知识进行可视化和结构化的方式组织,使得计算机能够更好地理解和处理人类知识。知识图谱通常包含实体(Entity)、关系(Relationship)和属性(Attribute)三个基本组成部分,它们共同构成了知识图谱的核心。 以下是知识图谱的一些关键特点: 实体:知识图谱中的实体通常代表现实世界中的一个具体对象或概念,如人、地点、组织、事件等。 关系:关系定义了实体之间的语义联系,例如“属于”、“位于”、“创立者是”等。 属性:属性是对实体特征的描述,如人的年龄、地点的经纬度、组织的成立时间等。 图结构:知识图谱采用图的形式组织数据,其中节点代表实体,边代表关系。 多源融合:知识图谱的数据可以来自多个不同的信息源,包括结构化数据、半结构化数据和非结构化数据。 语义丰富:知识图谱通过丰富的实体和关系类型,提供比传统数据库更丰富的语义信息。 动态更新:知识图谱可以根据新的数据和信息不断更新和扩展,保持知识的最新状态。 智能应用:知识图谱可以支持多种智能应用,如搜索引擎、推荐系统、问答系统、自然语言处理等。 知识推理

2024-06-13

c++ primer 第六版pdf+代码实现

C++是一种通用的、静态类型的、多范式的编程语言,最初由Bjarne Stroustrup在20世纪80年代初期作为C语言的扩展开发。C++被设计为提供对系统硬件的低级访问,同时提供高级的抽象特性,使其成为一种高效且功能强大的编程语言。 以下是C++的一些关键特性: 面向对象:C++是一种面向对象的语言,这意味着它支持类和对象的概念,允许程序员通过封装、继承和多态来构建复杂的软件系统。 泛型编程:C++支持泛型编程,允许程序员编写独立于特定数据类型的算法和数据结构。 静态类型:C++是一种静态类型语言,这意味着类型必须在编译时已知,这有助于捕捉类型错误并优化性能。 内存管理:C++提供了手动内存管理的能力,包括构造函数、析构函数、以及new和delete操作符,允许程序员精确控制内存的使用。 异常处理:C++具有异常处理机制,允许程序在发生错误时以受控的方式响应。 模板:C++的模板提供了一种创建泛型数据结构和函数的方法,支持类型参数和模板特化。 标准库:C++有一个丰富的标准库(STL),包括容器、迭代器、算法和函数对象。

2024-06-03

远程ssh连接工具MobaXterm,完全免费,可以拖动传输文件,及教程汇总

MobaXterm是一款功能强大的远程会话管理工具,它集成了SSH、X11、RDP、VNC、FTP、MOSH等多种远程网络工具,以及bash、ls、cat、sed、grep、awk、rsync等Unix命令集。用户可以通过MobaXterm在Windows操作系统下连接并操作Linux服务器。 MobaXterm的主要特点包括: 界面友好,使用方便,支持更换皮肤。 支持多种连接方式,如SSH、X11、RDP、VNC、FTP等。 内置SFTP文件传输功能,方便文件管理。 支持宏功能,可以录制操作并重复执行。 自带文本编辑器,方便编辑服务器中的文本文件。 支持VNC、RDP、Xdmcp等远程桌面连接。 自带Linux环境,方便学习和使用Linux命令。 支持搭建FTP服务器,上传文件供他人下载。 支持X server,可远程运行X窗口程序。 MobaXterm分为免费开源版和收费专业版。免费版提供了基本的功能,但有一些限制,如会话数、SSH隧道数等。专业版则提供了更多高级功能和定制化选项。 总之,MobaXterm是一款非常实用的远程终端软件。

2024-05-31

Visual Basic 语言学习资料

vbscript Visual Basic(VB)是一种由微软开发的事件驱动编程语言,它最初发布于1991年。VB以其易于使用的图形用户界面(GUI)和快速应用程序开发(RAD)能力而闻名。以下是Visual Basic的一些关键特点和用途: 1. **易用性**:VB提供了一种相对简单的方式来创建应用程序,特别是对于初学者和那些没有深入编程背景的用户。 2. **集成开发环境(IDE)**:VB通常与Microsoft Visual Studio集成,提供了一个强大的开发环境,包括调试工具、代码编辑器和项目管理工具。 3. **面向对象**:虽然VB是一种过程式语言,但它也支持面向对象的编程范式,允许开发者创建可重用的对象和组件。 4. **组件对象模型(COM)**:VB支持COM,这是一种允许软件组件进行交互的模型,VB应用程序可以创建、使用和与这些组件集成。 随着时间的推移,VB经历了多次迭代,包括Visual Basic 6.0和后来的VB.NET,后者是.NET框架的一部分,支持更现代的编程范式和功能。VB.NET与原始的VB有很大的不同,提供了对.NET框架的全面访问.

2024-05-29

利用python进行科学计算工具指南

利用Python进行科学计算的工具包主要包括以下几个: 1. **NumPy**:提供多维数组对象ndarray,支持大规模数值计算,是许多其他科学计算库的基础。 2. **SciPy**:基于NumPy,提供科学和工程领域中常用的算法和数学工具,如插值、优化、统计和信号处理。 3. **Pandas**:提供高性能、易用的数据结构和数据分析工具,主要用于数据清洗、处理和分析。 4. **Matplotlib**:生成各种格式的高质量图表和可视化,支持静态、动态和交互式可视化。 5. **SymPy**:用于符号数学计算,包括代数、微积分、方程式求解和离散数学。 6. **Scikit-learn**:基于NumPy和SciPy,提供简单高效的机器学习库,用于数据挖掘和数据分析。

2024-05-27

numpy-pandas-matplotlib使用指南,都是一些实例,且全部是jupyter文件,方便运行查看效果

Pandas、NumPy和Matplotlib是Python中用于数据处理和可视化的三个重要库: Pandas: 数据分析:提供DataFrame和Series数据结构,用于灵活高效的数据操作和分析。 数据清洗:支持处理缺失数据、数据过滤和转换。 数据合并:能够合并、连接和重塑数据集。 时间序列:具有强大的时间序列分析功能。 数据可视化:与Matplotlib集成,提供绘图功能。 NumPy: 多维数组:核心是ndarray对象,用于高效的数值计算。 数学函数:提供大量的数学函数,支持数组的向量化操作。 线性代数:包括矩阵运算和分解等。 随机数:用于生成随机数和模拟概率分布。 Matplotlib: 图表绘制:生成各种格式的高质量图表,如线图、柱状图、散点图等。 自定义:提供丰富的自定义选项,调整图表样式。 交互性:与IPython和Jupyter Notebook集成,支持交互式绘图。 动画:支持创建动画和视频。 这三个库共同构成了Python数据分析的基础,使得数据科学家和分析师能够从数据导入、处理、分析到可视化的整个流程都使用Python完成。

2024-05-27

这个文档介绍了,如何在arm架构的系统机器上面安装python环境, 我们首先安装miniconda,方便管理python的多版

anaconda安装python Anaconda是一个流行的Python和R语言的发行版,它旨在简化包管理和部署。Anaconda由Anaconda, Inc.(原 Continuum Analytics)开发,它提供了一个集中的环境管理器、包管理系统和Python/R的发行版。 以下是Anaconda的一些主要特点: 1. **环境管理**:Anaconda允许用户创建隔离的环境,每个环境可以有不同的库和Python版本,这有助于避免不同项目之间的依赖冲突。 2. **包管理**:Anaconda使用Conda作为其包管理器,它不仅可以安装Python包,还可以安装R语言的包以及其它语言的软件和库。 3. **跨平台**:Anaconda支持Windows、macOS和Linux操作系统。 4. **易于安装**:Anaconda提供了一个图形用户界面(Anaconda Navigator)和命令行工具,使得安装和管理包变得简单。 5. **社区支持**:Anaconda拥有一个庞大的社区,用户可以轻松找到所需的包和解决方案。 6. **科学计算和数据分析**:Ana

2024-05-25

fastgestures安装包,模拟mac的触控板收拾,两指代表右击, 三指拖拽

安装包 FastGestures 是一款功能丰富的全局手势软件,它支持鼠标、触控板以及触摸屏。用户可以通过定义一组助记符来映射自定义的操作,如在不同软件之间切换、打开系统便签、记事本、执行复制粘贴等操作[^3^][^10^]。FastGestures 提供了多种手势模式,包括手指滑动、手掌平移、手势组合等,旨在提高用户的工作效率和便捷性[^8^]。 FastGestures 的一些主要功能包括: 1. **鼠标手势**:用户可以自定义鼠标手势来执行特定的命令或快捷操作。 2. **手势快捷键**:允许用户自定义不限数量的字母数字符号,形成手势快捷键。 3. **激活/启动应用**:用户可以将常用的应用添加到手势中,快速启动或激活应用窗口。 4. **三指拖拽**:在触控板上实现三指拖动功能,提高浏览网页等操作的便捷性。 5. **连续触发**:可以定义连续操作,如连续关闭标签、调节系统声音、亮度等。 6. **资源管理器导航**:一键排列所有资源管理器文件夹,并在已打开的文件夹窗口之间有序切换。 7. **手势提示**:帮助用户记忆复杂的手势操作。 8. **执行命令行脚本**:用

2024-05-21

chatgpt4的免费api,还支持以下模型:gpt-4-all,gpt-3.5-turbo,gpt-3.5-turbo-16k

chatgpt4 我建议你首先复制这个项目。一些网站可能随时会下线。 仍在努力保持更新。 在这里已经实现了模型:如果你不希望你的网站出现在这里,请提出一个问题,我将立即将其移除。不幸的是,这里的大多数网站现在已经不再可用。 ChatGPT 4是OpenAI开发的最新一代语言模型,它代表了人工智能在自然语言处理领域的一个重要进步。尽管目前没有具体的公开信息表明存在一个命名为"ChatGPT 4"的模型,但是可以基于OpenAI之前发布的模型,如GPT-3(生成式预训练转换器的第三版),来推测ChatGPT 4可能具备的一些特性和改进: 更强大的语言理解能力:ChatGPT 4可能会在理解自然语言方面有显著提升,能够更准确地解析复杂的语句和上下文。 更准确的响应生成:新一代模型可能会生成更准确、更连贯、更自然的文本响应。 增强的上下文记忆:ChatGPT 4可能会有改进的记忆机制,使其能够更好地记住对话中早先提及的信息。

2024-05-15

python少儿编程课程代码实现-地址:https://kidscancode.org/lessons/

## 一、信奥和CSP的好处 ### 信奥的好处 ——参加国际赛,并获奖,可以直接报送985. —— 参加国赛获奖,获奖有机会直接报送 —— 国赛二等奖以上, 只要分数线国本一线,可以直接上985等名校 ### CSP的好处 小升初, 部分省市有政策,需要具体看官网或者咨询教育机构 ## 二、学习路径(个人总结): 3年级之前,scratch语言,主要锻炼孩子的逻辑思维 3年级之后:C++或者python,主要服务于考级考证(CSP), 通过市赛或者省赛有加分 初二之后(有天赋的):C++(NOI),国赛或者国际赛, 保送或者 985降分录取 大学(软件或者计算机,算法相关专业): ACM 大学计算机专业可以参加ACM ACM程序设计大赛是大学级别最高的脑力竞赛,素来被冠以"程序设计的奥林匹克"的尊称。大赛至今已有近40年的历史,是世界范围内历史最悠久、规模最大的程序设计竞赛。比赛形式是:从各大洲区域预赛出线的参赛队伍,于指定的时间、地点参加世界级的决赛,由1个教练、3个成员组成的小组应用一台计算机解决7到13个生活中的实际问题。

2024-05-15

近期的一些agent大模型产品,包括官方服务的页面

AI Agent大模型是基于大型语言模型(LLMs)构建的智能体,它们能够执行复杂的任务,包括与环境的交互、决策制定和执行操作。这些智能体通过自然语言处理技术与人类或其他智能体进行交流,具备理解和生成语言的能力。 AI Agent的核心组成部分包括任务规划、记忆系统、工具使用以及与外部世界交互的能力。任务规划涉及将复杂任务拆解为更小的子任务,并通过自我反思来优化结果。记忆系统则包括短期记忆和长期记忆,短期记忆处理聊天上下文和任务规划内容,而长期记忆则通过外部数据库实现。工具使用能力让Agent能够调用外部API或其他专业工具来解决问题。此外,AI Agent还具备社会能力,可以通过社会交互进行协作和竞争。 AI Agent在多个领域都有应用,包括客户服务、教育、医疗、游戏、软件开发和科学研究等。它们在执行任务和提高工作效率方面展现出强大的能力,尤其在需要创造力和适应性的领域。然而,AI Agent的发展仍面临一些挑战,包括对大模型核心能力的依赖、效率和成本问题、执行链路的复杂性等。 尽管存在局限性,AI Agent作为通往通用人工智能(AGI)的重要探索方向,其发展预示着未来人工智能技

2024-05-11

总结了一系列的agent大模型论文

AI Agent大模型是基于大型语言模型(Large Language Models,LLMs)构建的智能体,它们能够执行复杂的任务,并且具备与环境交互、主动决策和执行任务的能力。以下是一些值得关注的AI Agent大模型及其特点: 1. **AutoGPT**:一个开源项目,能够通过API创建完整的项目,自主完成任务。 2. **AgentGPT**:允许用户配置和部署自主AI智能体,为自定义AI命名并设定目标以实现。 3. **Baby AGI**:一个人工智能驱动的任务管理系统,使用OpenAI和Pinecone API来创建、确定优先级和执行任务。 4. **Jarvis (HuggingGPT)**:由Microsoft开发,使用多个AI模型来完成给定任务,以ChatGPT作为任务控制者。 5. **Aiagent.app**:一个Web应用,允许用户创建自定义AI智能体以执行特定任务并实现目标。

2024-05-11

使用python语言编程, 使用matplotlib做可视化,將排序算法用图像的方式展现出来排序过程

Matplotlib 是一个 Python 的绘图库,它提供了一个类似于 MATLAB 的绘图框架,并且对用户非常友好。它能够生成多种格式的图形,包括交互式的图形和动画,以及用于打印的高质量图形。Matplotlib 广泛应用于数据可视化领域,是 Python 数据分析和科学计算中不可或缺的一部分。 以下是 Matplotlib 的一些主要特点: 多格式输出:支持多种输出格式,包括 PNG、JPEG、SVG、PDF、EPS 等。 多种图形类型:可以生成线图、散点图、柱状图、3D 图形、直方图、功率谱图、错误条形图、散点图矩阵、等高线图等多种图形。 自定义性强:提供了丰富的 API,允许用户对图形的各个方面进行自定义,如颜色、线型、标记样式、坐标轴刻度、图例、标题等。 交互式功能:通过集成如 PyQt 或者 IPython 等工具,Matplotlib 可以生成交互式的图形。 动画支持:Matplotlib 的动画模块允许用户创建帧动画,显示数据随时间的变化。 跨平台:可在多种操作系统上运行,包括 Windows、macOS 和 Linux。

2024-05-08

适合初学者学习的优秀项目:c/c++/python/java等等

入门编程语言的学习项目对于初学者来说非常重要,它们可以为学习者提供必要的基础和实践机会,帮助他们更好地理解编程概念和提高编程技能。以下是一些入门学习项目对于编程学习的重要性: 1. **理论与实践相结合**:学习项目可以帮助初学者将理论知识应用到实际问题中,加深对编程概念的理解。 2. **培养解决问题的能力**:通过解决实际问题,学习者可以培养分析问题和解决问题的能力,这是编程中的核心技能。 3. **提高编程技能**:完成项目需要编写、测试和调试代码,这些过程可以提高学习者的编程技能和代码质量。 4. **增强学习动力**:完成一个项目可以给学习者带来成就感,从而增强他们继续学习的动力。 5. **理解编程语言的特性**:通过项目实践,学习者可以更深入地了解所学编程语言的特性和最佳实践。

2024-04-30

python语言学习-python编程100练,在代码中实际进行练习

Python 是一种高级的、解释型的编程语言,它以其简洁明了的语法和强大的标准库而闻名。Python 由 Guido van Rossum 创建,并在 1991 年首次发布。以下是 Python 语言的一些主要特点: 1. **易于学习和使用**:Python 的设计哲学强调代码的可读性和简洁性。它支持多种编程范式,包括面向对象、命令式、函数式和过程式编程。 2. **可移植性**:Python 是一种跨平台的语言,可以在许多操作系统上运行,包括但不限于 Windows、macOS、Linux 等。 3. **强大的标准库**:Python 的标准库非常广泛,提供了许多用于处理文件、系统调用、网络通信、文本处理等的模块。 4. **开源**:Python 是一个开源项目,拥有活跃的社区,这意味着它不断地得到改进,并且有许多第三方库可供使用。 5. **自动内存管理**:Python 有自动内存管理和垃圾回收功能,这使得内存管理更加方便。 6. **多用途**:Python 可用于各种应用开发,从简单的脚本到复杂的应用程序,如网站、游戏、桌面应用、科学计算和数据分析等。

2024-04-30

elasticsearch查询模版-模糊查询,多字段查询,相似度计算等

Elasticsearch(简称ES)是一个基于Apache Lucene构建的开源、分布式、RESTful风格的搜索和数据分析引擎。它允许你以前所未有的速度和规模,即时地存储、搜索和分析大量数据。Elasticsearch通常用于全文搜索、结构化搜索、分析以及将这三者结合起来的复杂搜索需求。 以下是关于Elasticsearch的一些关键特点和概念: 1. **分布式和高可用性**:Elasticsearch自动将数据分片并在集群中的多个节点之间分布这些分片。它可以在节点失败时自动复制和重新分配数据,以保持服务的可用性。 2. **实时搜索**:Elasticsearch能够在文档被索引后几秒内提供近乎实时的搜索。 3. **多样的搜索能力**:Elasticsearch支持多种类型的搜索,包括结构化、非结构化、地理位置、指标聚合等。 4. **水平可扩展性**:随着数据量的增加,您可以简单地增加更多的节点,Elasticsearch会自动平衡集群的负载。 5. **易于集成**:Elasticsearch提供了丰富的RESTful API,可以轻松地与各种编程语言进行集

2024-04-29

神经网络与深度学习课件和pdf文件

神经网络(Neural Networks)和深度学习(Deep Learning)是机器学习领域中的重要概念,它们之间存在密切的联系。下面是对这两个概念的基本介绍: ### 神经网络 1. **定义**:神经网络是受人脑结构启发的计算模型,它通过模仿人脑神经元的连接和交互来处理信息。 2. **组成**:一个神经网络由多个层组成,包括输入层、隐藏层和输出层。每一层由多个神经元组成,神经元之间通过权重连接。 3. **工作原理**:数据在网络中前向传播,通过每一层的加权和、激活函数转换,最终在输出层产生预测结果。 4. **学习过程**:通过反向传播算法(Backpropagation)调整权重,以最小化预测误差,这个过程通常需要大量的数据和计算资源。 ### 深度学习 1. **定义**:深度学习是机器学习的一个子领域,特指使用深层神经网络(具有多个隐藏层的神经网络)的算法。 2. **特点**:深度学习模型能够学习数据中的复杂模式,并且通常在图像和语音识别、自然语言处理等任务中表现出色。 3. **关键技术**:包括非线性激活函数、梯度下降优化算法、正则化技术等。

2024-04-29

python世界银行公开数据下载爬虫

世界银行(The World Bank)是世界银行集团的简称,也常被称为国际复兴开发银行(International Bank for Reconstruction and Development, IBRD),是联合国系统下的多边开发机构之一。世界银行的主要目标是为发展中国家提供长期贷款和技术支持,以促进它们的经济发展和社会进步。 世界银行集团包括五个机构:国际复兴开发银行(IBRD)、国际开发协会(International Development Association, IDA)、国际金融公司(International Finance Corporation, IFC)、多边投资担保机构(Multilateral Investment Guarantee Agency, MIGA)和国际投资争端解决中心(International Centre for Settlement of Investment Disputes, ICSID)。

2024-04-29

设计模式python模版

设计模式是在软件工程中解决常见问题的通用、可重用的解决方案。它们是在多年的软件开发实践中逐渐被发现、抽象化和总结出来的。设计模式可以帮助程序员以优雅、高效的方式解决软件开发中的问题,提高代码的可读性、可维护性和可扩展性。 设计模式主要分为三大类: 创建型模式(Creational Patterns):这类模式关注对象的创建过程,主要有以下几种: 单例模式(Singleton):确保一个类只有一个实例,并提供一个全局访问点。 工厂方法模式(Factory Method):定义一个接口用于创建对象,但让子类决定实例化哪个类。 抽象工厂模式(Abstract Factory):创建一系列相关或相互依赖对象的接口,而无需指定它们的具体类。 建造者模式(Builder):将一个复杂对象的构建与其表示分离,使得同样的构建过程可以创建不同的表示。 原型模式(Prototype):通过复制现有的实例来创建新的实例,而不是通过构造函数。 结构型模式(Structural Patterns):这类模式关注类和对象的结构,主要有以下几种: 适配器模式(Adapter):允许将一个类的接口转换成客户期望

2024-04-29

斯坦福cs223-数据结构课件

数据结构是计算机科学中的一个重要概念,它指的是计算机中存储、组织数据的方式。良好的数据结构可以有效地支持数据的插入、删除、搜索和排序等操作。数据结构通常与算法一起讨论,因为它们紧密相关——算法可以看作是对数据结构进行操作的方法。 常见的数据结构包括: 1. **数组(Array)**:一种基础的数据结构,用于存储一系列有序的元素。数组的特点是元素可以通过索引快速访问。 2. **链表(Linked List)**:由一系列节点组成,每个节点包含数据和一个或多个指向其他节点的引用(链接)。 3. **栈(Stack)**:遵循后进先出(LIFO)原则的数据结构。栈支持两种主要操作:push(压栈)和pop(出栈)。 4. **队列(Queue)**:遵循先进先出(FIFO)原则的数据结构。队列支持两种主要操作:enqueue(入队)和dequeue(出队)。 5. **树(Tree)**:一种分层数据结构,用于模拟具有层次关系的数据。常见的树结构包括二叉树、平衡树(如AVL树)、红黑树等。 6. **图(Graph)**:用于表示物件之间的多对多关系。图由节点(或顶点)和边组成,边可以是

2024-04-28

强化学习经典课程-斯坦福大学cs234课件

CS234是斯坦福大学开设的一门关于强化学习的课程,全称为“Reinforcement Learning”。这门课程由著名学者Emma Brunskill和Chelsea Finn共同授课,旨在为学生提供强化学习的基础知识、核心算法以及最新进展。 CS234课程涵盖了强化学习的基础理论,包括马尔可夫决策过程(MDP)、动态规划、蒙特卡洛方法、时序差分学习、同轨策略和离轨策略等。此外,课程还会介绍一些高级主题,如函数近似、梯度策略方法、探索与利用的平衡、稳定性和收敛性等。 课程结构通常包括讲座、作业、项目等部分。作业和项目旨在让学生通过实践来加深对强化学习理论和方法的理解。CS234课程适合对强化学习感兴趣的研究生和高级本科生,要求学生具备一定的机器学习基础和编程能力。 CS234课程在强化学习领域享有很高的声誉,它的教学大纲、讲义、作业和项目等资源通常会在课程网站上公开,供全球的学习者免费学习。通过这门课程,学生能够掌握强化学习的基本原理,学会如何设计、分析和实现强化学习算法,并为进一步的研究或应用强化学习打下坚实的基础。

2024-04-28

学生成绩管理系统-C++版本

学生成绩管理系统是一种用于管理和跟踪学生学术成绩的软件系统。它通常被教育机构,如学校、大学和培训机构所使用,以简化成绩的记录、存储、分析和报告过程。一个典型的学生成绩管理系统可能包含以下功能: 学生信息管理:录入和编辑学生的基本信息,如姓名、性别、年龄、班级等。 课程管理:设置和管理课程信息,包括课程名称、学分、授课教师等。 成绩录入与修改:录入学生的考试成绩、平时成绩等,并提供修改功能。 成绩查询:学生和教师可以查询特定课程或全部课程的成绩。 统计分析:对成绩进行统计分析,如计算平均分、最高分、最低分等。 报表生成:生成成绩单、班级排名、学期总结等报表。 用户权限管理:设置不同用户的操作权限,如学生、教师、管理员等。 数据备份与恢复:定期备份数据,以防数据丢失,并提供数据恢复功能。 安全性与隐私保护:确保数据的安全性,防止未授权访问,并保护学生的隐私。 学生成绩管理系统可以是基于桌面应用的、网络应用的,也可以是移动应用。在开发这样的系统时,需要考虑到用户界面的友好性、系统的稳定性、数据的准确性和安全性等因素。此外,随着技术的发展,一些系统还可能集成数据分析、人工智能等功能,以提供更

2024-04-28

llama3优秀的prompt-优秀的prompt堪比微调效果

大语言模型通常指的是使用深度学习技术训练的、能够生成和理解自然语言文本的模型。这些模型可以应用于各种任务,如文本生成、机器翻译、文本摘要、情感分析等。在处理这些任务时,通常会使用一个“提示”(prompt)来指导模型生成响应。 提示(prompt)是一个给模型输入的文本,用于引导模型生成相关的输出。在大语言模型中,提示的设计非常重要,因为它直接影响到模型的输出质量和相关性。一个好的提示应该清晰、具体,并且与模型的训练数据和任务目标相匹配。 例如,如果你想让一个大语言模型写一个故事,你可以提供一个包含故事背景和主要角色的提示,如:“在一个遥远的星球上,住着一个喜欢冒险的小猫,它的名字叫…”。模型会根据这个提示生成一个故事。 在设计提示时,还应该考虑到模型的上下文理解能力。大语言模型通常能够理解一定长度的上下文,因此,你可以提供一些上下文信息,帮助模型更好地理解提示和生成输出。 总之,提示是大语言模型生成和理解自然语言文本的重要输入,设计一个好的提示可以帮助模型生成更高质量和更相关的输出。

2024-04-28

正则表达式学习-正则语法

正则表达式(Regular Expression,简称:Regex)是一种文本模式的表示方法,它使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。正则表达式常用于字符串的搜索、替换、分割和校验等操作。 正则表达式由普通字符(例如,字母和数字)和特殊字符(称为“元字符”)组成。以下是一些常用的正则表达式元字符和它们的作用: .:匹配除换行符以外的任意字符。 []:匹配括号内的任意一个字符(字符集)。 [^]:匹配不在括号内的任意一个字符(否定字符集)。 *:匹配前面的子表达式零次或多次。 +:匹配前面的子表达式一次或多次。 ?:匹配前面的子表达式零次或一次。 {m,n}:匹配前面的子表达式至少m次,至多n次。 ^:匹配输入字符串的开始位置。 $:匹配输入字符串的结束位置。 \:转义字符,用于匹配一些特殊字符。 |:选择,匹配符号左边的子表达式或右边的子表达式。 ():标记一个子表达式的开始和结束位置,可以捕获匹配的文本。 正则表达式在不同的编程语言和工具中都有广泛的应用,例如Python、JavaScript、Perl、grep、sed等。

2024-04-28

总结的学习资料nlp算法原理-word2vector-bert等

word2vec是一种计算模型,它将词汇表中的每个词映射到一个固定大小的向量。这个模型由托马斯·米科洛夫(Tomas Mikolov)等人在谷歌开发,用于捕捉词汇的语义和语法特征。word2vec模型有两种架构:连续词袋(CBOW)和Skip-Gram。 连续词袋(CBOW):CBOW模型通过一个词的上下文(即周围的词)来预测这个词。它考虑了一个词的上下文窗口内的所有词,然后尝试预测这个中心词。 Skip-Gram:与CBOW相反,Skip-Gram模型是通过一个词来预测其上下文。它试图使用一个词作为输入,预测在它的上下文窗口中可能出现的词。 word2vec的主要优点是它能够捕捉到词之间的语义关系。例如,如果有一个向量表示“国王”,另一个表示“男人”,那么“国王”向量与“男人”向量减去“女人”向量的结果应该接近“皇后”向量。这种关系可以用于各种自然语言处理任务,如文本分类、情感分析、机器翻译等。 word2vec的另一个重要特性是它能够将词嵌入到一个连续的向量空间中,这样就可以使用数学方法来比较和处理词。这些向量可以用于计算词之间的相似度,或者作为机器学习模型的输入特征。 wo

2024-04-28

jena语义网络开发框架

Jena是一个免费的、开源的Java平台上语义网开发框架。最初是由惠普实验室(HPL)的BrianMcBride开发,后来Jena称为Apache开源项目之一。 jena 结合整体架构图和Jena的官方文档,可以看到Jena框架共分为几大模块: RDF API(RDF模型操作相关) Ontology API(OWL本体模型操作相关) ARQ(SPARQL标准的实现) Inference API(本体推理的实现) TDB(RDF数据的存储数据库) 此外Jena还提供了非常实用的命令行工具(例如SPARQL查询、批量导入RDF数据等)和一个基于Jena框架构建的Web应用程序Fuseki。 学习Jena框架,一定要结合对于的语义技术的知识,这样才能更加快速地上手。

2024-04-27

经典书籍-强化学习源码实现

《强化学习》是一本全面系统地介绍强化学习理论的书籍。这本书内容丰富,不仅包括理论阐述和公式推导,还涵盖了丰富的典型案例,将理论与实践紧密结合。书中详细描述了强化学习的起源、背景和分类,讲解了各类强化学习算法的原理和实现方式,以及这些算法之间的关系,为读者构建了一个完整的强化学习知识体系。 本书的案例包括各类迷宫寻宝、飞翔小鸟、扑克牌、小车爬山、倒立摆、钟摆、多臂赌博机、五子棋、AlphaGo、AlphaGo Zero、AlphaZero等,通过详细的案例说明和代码描述,帮助读者深入理解各类强化学习算法的精髓。书中的代码简洁易懂,注释详细,便于读者学习和应用。 《强化学习》适用于高等院校计算机、自动化及相关专业的本科生和研究生作为教材,同时也适合对强化学习感兴趣的研究人员和工程技术人员阅读参考。这本书由邹伟、鬲玲和刘昱杓合著,他们在机器学习、数据挖掘、计算几何、知识工程、语义检索、自然语言处理等领域具有丰富的研究和实际应用经验 3 。 另一本值得推荐的强化学习书籍是《强化学习(第2版)》,由Richard Sutton和Andrew Barto合著。这本书被业内公认为强化学习基础理

2024-04-27

python3经典代码模版-cookbook源码

《Python Cookbook》第三版是由David Beazley编写的,这本书在Python社区中非常受欢迎。它主要聚焦于Python编程的方法和技巧,帮助读者深入理解Python语言,并将这些技巧应用于实际项目中。书中的内容从基础如字符串、列表、字典、文件IO和排序,到进阶主题如函数、面向对象编程、数据库和数据持久化、XML处理和Web编程,再到更高级的内容如描述符、装饰器、元类、迭代器和生成器等都有涵盖。 每个知识点都配有案例和解决方案,书中的代码和方法具有很高的实用性,可以方便地应用到实际项目中。这本书不仅提供了问题的解决方案,还展示了专家的思维方式和良好的编程习惯。它适合那些想深入理解Python语言机制和现代编程风格的Python程序员,也适合有一定基础并想深入学习Python的爱好者。

2024-04-27

机器学习经典-统计学习方法主要章节ppt

统计学习方法》是李航所著的一本关于统计学习的专业书籍,第二版于2019年5月由清华大学出版社出版。这本书全面系统地介绍了统计学习的主要方法,内容分为监督学习和无监督学习两篇。 在监督学习部分,书中介绍了决策树、感知机、支持向量机、最大熵模型与逻辑斯谛回归、推进法、多类分类法、EM算法、隐马尔科夫模型和条件随机场等多种方法。无监督学习部分则包括了聚类、奇异值分解、主成分分析、潜在语义分析等内容。每一章节都详细介绍了一到两种方法,便于读者深入理解。 这本书不仅是统计机器学习及相关课程的教学参考书,也适用于高等院校文本数据挖掘、信息检索及自然语言处理等专业的大学生、研究生,同时也适合计算机应用等专业的研发人员参考。

2024-04-27

整理的关于少儿编程的学习路径,以及如何在小升初,初升高和大学充分的利用起来编程经验的优势

信奥的好处: ——参加国际赛,并获奖,可以直接保送985. —— 参加国赛获奖,获奖有机会直接报送 —— 国赛二等奖以上, 只要分数线国本一线,可以直接上985等名校 ### CSP的好处 小升初, 部分省市有政策,需要具体看官网或者咨询教育机构 信息奥林匹克,通常指的是国际信息学奥林匹克竞赛(International Olympiad in Informatics,简称IOI)。这是一项面向全世界中学生的计算机科学竞赛,旨在通过竞赛活动培养青少年对信息科学的兴趣和解决问题能力,推动信息科学教育在青少年中的普及。 IOI的主要竞赛内容包括算法、数据结构、编程和数学问题解决等。竞赛通常分为两天的比赛,每天参赛者需要解决三到四个问题。这些题目往往需要参赛者运用高效的算法和编程技巧,在有限的时间内完成。 竞赛使用的编程语言通常包括但不限于C、C++、Pascal和Python。参赛者需要在规定的时间内编写程序,通过给定的数据测试,并且尽可能优化算法的时间和空间复杂度。 IOI自1989年起开始举办,每年举办一次,每次大约有80个国家的代表队参加。

2024-04-26

meta(原facebook)开源无限token大模型-MEGALODON

Transformers 的二次复杂度和弱长度外推限制了它们扩展到长序列的能力,虽然存在线性注意力和状态空间模型等次二次解决方案,但从以往的经验来看,它们在预训练效率和下游任务准确性方面表现不佳。 长文本是大语言模型一直在努力的方向。近日,谷歌提出的 Infini-Transformer 引入有效方法,可以将基于 Transformer 的大型语言模型 (LLM) 扩展到无限长输入,而不增加内存和计算需求,吸引了人们的关注。 几乎就在同时,Meta 也提出了一种无限长文本技术。 在 4 月 12 日提交的一篇论文中,来自 Meta、南加州大学、CMU、UCSD 等公司、机构引入了 MEGALODON,一种用于高效序列建模的神经架构,上下文长度不受限制。 MEGALODON 继承了 MEGA(带有门控注意力的指数移动平均)的架构,并进一步引入了多种技术组件来提高其能力和稳定性,包括复数指数移动平均(CEMA)、时间步归一化层、归一化注意力机制和具有两个特征的预归一化(pre-norm)残差配置。

2024-04-24

由meta开源llama模型 ,系列论文,包括llama1, llama2, tinyllama

llama系列模型由meta(原Facebook)的AI Research团队在2023年开发。Llama模型的特点是具有较低的延迟和较高的吞吐量,这使得它在实时应用场景中具有很大的潜力。 Llama模型采用了稀疏注意力机制和旋转位置编码技术,这使得它能够有效地处理长文本序列。与传统的Transformer模型相比,Llama模型在计算复杂度、内存占用和能耗方面都有显著的优势。 Llama模型已经在多个自然语言处理任务中取得了很好的效果,包括文本分类、机器翻译、问答等。它的出现为自然语言处理领域提供了一种新的选择,有望推动该领域的发展。

2024-04-24

llama3-中文微调训练集,让llama3更懂中文

Llama-3是由Meta(Facebook)AI发布的最新一代大型语言模型。它具有两种参数规模:80亿(8B)和700亿(70B),并且还有一个超过4000亿参数的版本正在训练中。Llama-3在多个行业标准测试中展现了卓越的性能,特别是在对话类应用中,其表现超过了许多现有的开源聊天模型。 在技术方面,Llama-3采用了优化的自回归Transformer架构,这种架构专为处理复杂的文本生成任务设计,能够有效提升生成文本的连贯性和相关性。它还结合了监督式微调(SFT)和带人类反馈的强化学习(RLHF),这种混合方法不仅增强了模型的帮助性,也提高了安全性,使得模型在实际应用中更加可靠和符合用户预期。 Llama-3使用了超过15万亿令牌的公开在线数据进行预训练,这些数据是前代Llama-2的七倍。此外,Llama-3支持8K长文本,具有128K token的词汇量,这有助于实现更好的性能。其主要亮点还包括增强的推理和代码能力,以及训练效率比Llama-2高3倍。 Meta表示,Llama-3在多个关键的基准测试中性能优于业界先进同类模型,能够进行复杂的推理,更遵循指令,并能够可视化想法

2024-04-22

BEG模型原始论文:C-Pack: Packaged Resources To Advance General Chinese

BGE(北京智源人工智能研究院提出的embedding模型)可能是指北京智源人工智能研究院开发的一种新型的嵌入(embedding)技术或模型。在自然语言处理(NLP)中,嵌入技术是用来将词汇、句子或文档转换为高维空间中的向量表示,这些向量能够捕捉到词汇之间的语义关系。 由于您提供的信息有限,我将基于常见的嵌入模型的一般性质来续写: 北京智源人工智能研究院提出的BGE模型可能具有以下特点: 1. **高维表示**:BGE模型可能使用了一种先进的算法来将词汇映射到高维空间中,使得语义上相似的词汇在向量空间中距离较近。 2. **上下文感知**:该模型可能能够根据词汇的上下文环境动态调整其嵌入表示,以更好地捕捉词汇的多义性和上下文依赖性。 3. **预训练能力**:BGE可能在大规模语料库上进行了预训练,以学习语言的通用特征和模式。 4. **可扩展性**:模型设计可能考虑了可扩展性,允许在不同的语言或领域中进行定制和微调。 5. **计算效率**:为了适应不同的应用场景,BGE可能在设计时考虑了计算效率,以便于在资源受限的设备上运行。 6. **多语言支持**:该模型可能

2024-04-18

EetroMAE原论文

EetroMAE(Efficient Transformer-based Multi-Modal AutoEncoder)是一种基于Transformer的多模态自编码器模型,旨在有效地处理和融合来自不同模态的数据,例如文本、图像和音频。该模型采用了自编码器的架构,其中编码器和解码器都是基于Transformer的模型,可以同时处理多种类型的数据。 EetroMAE模型的主要特点包括: 多模态数据处理:EetroMAE可以同时处理来自不同模态的数据,例如文本、图像和音频。这使得它非常适合于需要同时分析多种类型数据的应用场景,例如多媒体内容理解、语音识别和图像描述生成等。 高效性:EetroMAE采用了高效的Transformer架构,可以快速地处理大量数据。同时,该模型还可以通过模型剪枝和量化等技术进一步减小模型大小和计算复杂度,使其适用于资源受限的环境。 自编码器架构:EetroMAE采用了自编码器的架构,其中编码器用于将输入数据编码为低维表示,解码器则用于将低维表示解码回原始数据。这种架构可以帮助模型学习到数据的有用特征,并减少噪声和冗余信息的影响。

2024-04-18

国内可以用的chatgpt网站汇总以及各个网站的优劣对比,速度对比,性能对比

ChatGPT 是一个人工智能聊天机器人程序,由 OpenAI 于 2022 年 11 月推出。该程序基于大型语言模型 GPT-3.5,使用指令微调(Instruction Tuning)和基于人类反馈的强化学习技术(RLHF)训练而成。 ChatGPT 的使用场景包括: 1. 文案写作:可以帮助写文章、邮件、简历等各种类型的文本。 2. 代码调试:可以帮助理解代码,找出错误并提供解决方案。 3. 机器翻译:可以将一种语言翻译成另一种语言。 4. 角色扮演:可以模拟任何角色,与用户进行对话。 5. 知识查询:可以回答大多数关于科学、技术、历史、文化等方面的问题。 ChatGPT 的优点包括: 1. 流畅性:可以生成流畅、自然的对话。 2. 知识面广:由于使用了大量的数据训练,因此具有广泛的知识面。 3. 可定制性:可以通过指令调整其行为。 ChatGPT 的局限性包括: 1. 时效性:由于训练数据只到 2023,因此对于此之后发生的事件可能不太了解。 2. 知识准确性:由于其生成内容基于统计概率,因此无法保证所有内容都是准确无误的。 3. 道德和伦理:可能会生成不道德或不符合伦理的内容

2024-04-17

sql server2008安装教程-带详细图片和每一步讲解

SQL Server 2008 是微软公司推出的一款关系型数据库管理系统,它是 SQL Server 数据库管理系统家族中的一个重要版本,于2008年发布。它提供了广泛的企业级数据管理功能,包括数据库引擎、分析服务、报表服务以及集成服务等。 以下是 SQL Server 2008 的一些关键特性: 1. **安全性**:SQL Server 2008 提供了高级的安全特性,如透明数据加密(TDE)、加密的备份、SQL Server Audit等,帮助用户保护他们的数据不受未授权访问和篡改。 2. **性能和可伸缩性**:它包含了许多性能增强特性,比如资源监控器、备份压缩、分区表和索引等,帮助用户优化性能并支持大规模的数据处理。 3. **高可用性**:通过数据库镜像、故障转移群集等功能,SQL Server 2008 可以提供高可用性的解决方案,减少系统故障时的停机时间。 4. **商业智能**:SQL Server 2008 集成了强大的商业智能工具,如 Analysis Services、Reporting Services 和 Integration Services,支持数据挖

2024-04-17

MySQL安装配置教程-带详细配置图片版本

【我真的不允许】还有人不懂MySQL!速看这篇教程! 啊啊啊啊啊啊啊!!你们知道吗?最近我在学习MySQL,简直打开了新世界的大门! 以前我对数据库一窍不通,但现在,我可以说:“MySQL,我来了!” 这篇教程超级详细,从安装到配置,每一步都有图解,简直小白友好到哭! 我跟着教程一步步操作,居然一次成功了!这不科学啊! 家人们,你们还在等什么?赶紧学起来,让我们一起成为MySQL大师吧! 这篇教程真的是宝藏,我压箱底推荐给你们! 记住,停止摆烂,从今天开始学习MySQL! #MySQL #数据库 #编程小白 #学习心得

2024-04-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除