自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(319)
  • 资源 (16)
  • 收藏
  • 关注

原创 AIGC下程序员如何自洽?

在AIGC(如ChatGPT、Midjourney、Claude等)迅速发展的背景下,程序员的工作方式正在经历深刻的变革。

2024-08-18 19:36:06 559

原创 如何看待低代码平台

近年来,低代码开发平台的快速崛起引发了广泛的关注和讨论。下面从几个维度基本概念、主要特点、市场现状、影响编程门槛、开发者工作方式变化,以及机遇和挑战这几个维度探讨低代码开发。

2024-08-18 19:35:37 610

原创 deepspeed

实现了中描述的所有内容。。而NVMe支持在论文中进行了描述。DeepSpeed ZeRO-2主要用于训练,因为它的特性对推理没有用处。DeepSpeed ZeRO-3也可以用于推理,因为它允许将单个GPU无法加载的大模型加载到多个GPU上。🤗 Transformers通过以下两种方式集成了TrainerTrainerzero.Init。

2024-08-18 19:35:05 988

原创 搜索面试题

如果您将第5个点作为正样本,意味着它是您希望被推荐或关注的对象。而它之前的4个对象被点的次数较多或更受关注,可能泛指为较少关心或者不符合用户偏好的对象,因此视为负样本。

2024-08-18 19:34:26 681

原创 大模型面试问题记录

层归一化(Layer Normalization)和批归一化(Batch Normalization)是两种常用的归一化技术,主要用于加速神经网络的训练并提高模型的表现。通过引入相对位置编码,使得模型能更好地理解位置关系。通过以上技术,DeepSpeed 可以显著加快模型训练的速度,支持更大的模型和更复杂的任务,使得研究人员和工程师能够更高效地进行深度学习研究和应用。:LoRA 通过引入低秩矩阵来表示权重的微调,只需要增加很少的参数,这使得微调过程更为高效,尤其是在大模型上,能显著降低计算和存储的开销。

2024-08-18 19:33:04 1410

原创 编程小白到大神之路

编程是一项有挑战性但充满乐趣的技能。在选择编程语言和资源时,根据自己的兴趣和目标合理制定学习计划,持之以恒、不断实践,相信你能在编程的道路上走得更远,为自己的大学生活和未来职业发展打下坚实基础。

2024-08-12 22:10:05 1623

原创 面试“八股文”有用吗?

八股文”在程序员招聘中的作用是一个复杂且具有争议的话题。

2024-08-12 22:08:57 742

原创 json.dumps()包含的参数

作用:控制项目分隔符和键-值分隔符。默认值会在键和值之间添加一个空格,使 JSON 更具可读性。为整数时表示每层的空格数;为字符串时表示每层的这个字符串。遇到无法序列化的对象时,会调用此函数。此函数应返回一个可序列化的对象。作用:指定一个自定义的 JSONEncoder 子类来进行序列化。,则不检查循环引用(不推荐关闭此选项,以避免无限递归)。,则按字母顺序对字典的键进行排序。作用:设置缩进的字符数或字符。,则按字母顺序对字典的键进行排序。,则将非ASCII字符转义为。为对应的 JSON 值。

2024-08-04 20:35:24 810

原创 pandas按某2列进行分层随机抽样

在某些情况下,你可能需要按多列组合后的分组进行分层随机抽样。pandas 提供了灵活的数据操作方法,你可以使用groupby和apply方法结合sample来实现这种需求。具体来说,你可以先按多列分组,然后对每个分组进行随机抽样。

2024-08-04 20:28:20 377

原创 pandas采样

pandas 提供了丰富的参数和功能,让sample方法能够满足各种随机抽样的需求,包括指定抽样数量、按比例抽样、设置随机种子、有无放回抽样以及按列和分层抽样。这些功能在数据分析和处理过程中非常有用,有助于快速获取具有代表性的小样本进行分析。

2024-08-04 20:27:41 839

原创 json.dumps和json.dump区别

是将 Python 对象序列化为 JSON 格式的字符串。如果你想将 JSON 数据写入文件,可以将生成的字符串写入文件,或者更直接地使用函数,它会直接将 Python 对象序列化写入文件。下面是两个方法,一是使用然后写入文件,二是使用直接写入文件。

2024-08-04 20:26:32 1299

原创 json.loads时限定为utf-8

json.loads本身支持 UTF-8 编码,直接解析即可。如果原始数据不是 UTF-8 编码,先转为 UTF-8 再解析。读取 JSON 文件时,指定以确保正确处理非 ASCII 字符。使用编码读取以去除 BOM。通过这些方法,你可以确保在使用json.loads时正确处理 UTF-8 编码的 JSON 数据。

2024-08-04 20:25:53 1028

原创 混合了 UTF-8 字符串和 Unicode 转义序列的字符串统一转化为 UTF-8 编码的字符串

如果你有一个包含混合了 UTF-8 字符串和 Unicode 转义序列的字符串,并希望将它们统一转化为 UTF-8 编码的字符串,你可以按以下步骤进行操作。此过程涉及区分正常的 UTF-8 字符串和那些需要解码的 Unicode 转义序列。

2024-08-04 20:19:46 586

原创 pandas 分层按列随机抽样

实现一个多步骤的过程以达到根据类别分层随机抽样,然后从特定的 ID 中选取相关的样本。下面的代码展示了如何用 pandas 来实现这些步骤。

2024-08-04 20:18:00 546

原创 大模型获取embdding

以qwen为例:本文将使用 Hugging Face 的库来完成这些步骤。这是一个非常流行且功能强大的库,用于处理各种预训练语言模型。

2024-07-28 09:04:30 4607 1

原创 查看空闲gpu

这个命令将输出你的 NVIDIA GPU 的当前状态,包括每个 GPU 的使用率、总内存、正在使用的内存、GPU 温度等信息。如果你希望检查 Unix 或 Linux 系统上的 GPU 使用情况(特别是查找空闲的 NVIDIA GPU),可以使用 NVIDIA 提供的命令行工具。另外,如果你在使用像 Kubernetes 这类容器编排系统,你可能需要查看集群的 GPU 使用情况,这通常需要集群级的监视和管理工具来获得概览。对于其他类型的 GPU,你可能需要查找特定于供应商的工具或命令来获取使用情况信息。

2024-07-28 09:01:14 807

原创 linux查看磁盘剩余内存

会以 MB、GB 等为单位显示总内存、已使用内存、空闲内存以及交换空间的使用情况。这个命令能让你快速了解系统物理内存的当前状态。显示的是文件系统的空间使用情况,而不是物理内存(RAM)的空间使用情况。如果你想要查看系统的内存使用情况,应该使用。代表“磁盘文件系统”(disk filesystem),它可以显示有关文件系统磁盘空间使用情况的信息。通常,您可能希望以易于阅读的方式显示大小,可以使用。在 Linux 系统中,通常用。命令来查看磁盘的剩余空间。是文件系统挂载点的路径,是一个设备的文件名。

2024-07-28 09:00:25 1288

原创 查看文件目录大小

选项允许您限制递归的深度。在这个例子中,它将只输出目录及其直接子目录的大小。(磁盘使用情况)命令来查看目录的大小。在 Unix 和 Linux 系统上,可以使用。下的每个子目录进行递归,并显示它们各自的大小。这将显示指定目录下每个子目录的大小。

2024-07-28 08:59:42 448

原创 conda虚拟环境升级python

提示:升级 Python 版本时可能会影响你的项目依赖库。在执行以上操作时,确保已经备份你的环境和项目数据,以免意外发生。如果发现新版本与现有代码不兼容,你可能需要回退到旧版 Python,或更新你的代码以匹配新版 Python 的要求。如果默认的 channels 还没有 3.11 版本,你可能需要添加其他的 channels,例如。中的版本号为你希望安装的确切版本(如 3.11.0),如果它在该 channels 中存在的话。首先,打开终端,在命令行中激活你想升级 Python 版本的虚拟环境。

2024-07-28 08:56:35 3795 1

原创 查看gpu内存nvidia-smi

要在Linux系统上查看NVIDIA GPU的使用情况,您可以使用nvidia-smi命令。这是一个NVIDIA提供的命令行工具,能够显示GPU的各种状态信息,包括但不限于使用率、内存使用情况、温度、时钟速度以及运行在GPU上的进程。nvidia-smi此输出提供了每块GPU的详细状态,包括GPU编号、名称、当前功耗、温度、利用率、已分配的显存和总显存等。同时,底部的“Processes”部分还会列出占用GPU资源的各个进程及其显存使用情况。如果您想更频繁地查看GPU状态,比如每秒查看一次,可以结合。

2024-07-28 08:55:03 2379

原创 LLM训练框架LLaMA-Factory

(LLaMA-Factory实践知乎较好案例)使用llamafactory-cli help查看。各种模型文件,可以在这个里面下载。数据、评估、训练、生成、模型超参在此目录。

2024-07-28 08:51:27 749

原创 2024年,计算机相关专业还值得选择吗?。

计算机科学和信息技术领域一直是创新的前沿,随着科技的发展和对数据的依赖不断增加,这些专业的毕业生通常能发现具有竞争力的就业机会。:技术领域是一个不断扩展的行业。:随着云计算、大数据、物联网(IoT)、人工智能(AI)、机器学习和自动化等技术的发展,对于拥有相关专业背景的工作人员的需求也在不断上升。:此专业的个人需不断学习和提升技能以跟上技术进步的步伐,这为热衷于持续自我发展和终身学习的人提供了充分的空间。:很多计算机专业的工作提供了较为灵活的工作环境和时间安排,远程工作和自由职业的选项也日益增多。

2024-07-28 08:45:25 715

原创 RAG检索与生成的融合

检索增强生成 (RAG) 模型代表了检索系统和生成模型两大不同但互补组件完美结合的杰作。通过无缝整合相关信息检索和生成与背景相关的响应,RAG模型在人工智能领域达到了前所未有的复杂程度。

2024-06-10 21:30:57 867

原创 tf处理序列常用函数

是 TensorFlow 中的一个函数,用于找出一个张量中所有的唯一元素,并且返回它们的索引。该函数会返回两个张量:第一个包含了输入张量中的唯一元素,第二个包含了原始输入张量中每个元素在唯一元素张量中的索引。输出张量的长度是输入张量的最大值加1。是 TensorFlow 中的一个函数,用于逐元素比较两个张量,并返回一个布尔张量,该张量的每个元素表示第一个输入张量中的元素是否大于第二个输入张量中对应的元素。返回的是一个一维张量,因为它从输入张量中抽取了所有被选中的元素,并将它们平铺在了一个新的一维张量中。

2024-06-10 21:22:43 1192

原创 Permissions 0644 for ‘/home/jsy/.ssh/id_rsa‘ are too open

执行git pull --rebase 报错。

2024-06-10 21:20:55 391

原创 ssh密钥配置

把其中的内容贴入http://gitlab.xx.com/profile/keys。# 一路回车,如果需要输入,请看提示输入y。# 然后执行下面命令测试是否 ok。

2024-06-10 21:20:26 179

原创 __vsc_prompt_cmd_original: command not found

vi ~/.bashrc # 使用Vim打开并编辑此文件。1.打开.bashrc文件。

2024-06-10 21:19:18 502

原创 python clear和clear()

不带括号的情况,它没有执行任何操作,只是引用了方法对象。这在实际代码中通常不会直接使用,除非你有特殊的理由将方法作为一个第一级对象传递给其他函数或保存为变量。是一个方法属性,代表着一个清除容器内容的方法对象,但它没有被调用执行。调用clear,什么了一个方法,原来的值并没有改变。调用clear对象,引用对象也会被删除。另外赋值,将代码地址空间引入到其他地方。方法,作用是实际清除容器中的内容。是一个调用操作,表示执行。

2024-05-18 21:28:19 828

原创 tf输出tf.variable_scope作用域的变量名

对于TensorFlow 1.x和2.x,总体上的使用逻辑类似,但语法和API有所差异。,这是用来标示这是变量的第一个引用。在TensorFlow中,你可以有同名的多个变量引用,编号标示它们的不同。内创建变量时,所有变量的名称都会带有这个作用域的前缀。如果你需要获取特定作用域下所有变量的名称,你可以使用。已经不再使用,所以对于变量和模型组件的命名和组织,应优先使用。在TensorFlow 1.x中,当你在一个特定的。函数,并且筛选出名称以这个特定作用域为前缀的变量。在TensorFlow 2.x中,由于。

2024-05-18 21:27:47 224

原创 LLM-KERec

LLM-KERec系统包括传统推荐模块和基于LLM的互补知识增强模块。传统推荐模块负责召回候选商品、粗排过滤、精排和重排。LLM互补知识增强模块则包括实体提取器、互补图构造、E-E-I权重决策模型等,以整合互补知识,增强推荐效果。

2024-05-12 19:35:17 478

原创 GENRE

摘要改写:把新闻的title, abstract 还有category 当作输入,然后要求大语言模型来生成一个摘要,把这个摘要当作这个新闻的 new feature输入下游。用户画像:根据用户过去观看过的新闻的标题,尝试去问大语言模型是否知道这个用户的一些感兴趣的topic,也就是用户的喜好和他所在的位置。样本扩充:有一些用户看过的新闻非常少,所以用大语言模型来做一些样本的扩充。

2024-05-12 19:34:12 584

原创 王者荣耀铭文说明

铭文,是指在进入游戏之前你可以为你的英雄额外增加的一些属性。一套好的铭文可以说是召唤师的第七件装备。铭文,卡攻速阈值;卡暴击效果阈值等。

2024-05-12 19:31:54 4964

原创 饮湖上初晴后雨二首·其二

水光潋滟晴方好,山色空蒙雨亦奇。(蒙 通:濛)欲把西湖比西子,淡妆浓抹总相宜。

2024-04-29 09:46:33 426

原创 前赤壁赋 《苏轼》

壬戌之秋,七月既望,苏子与客泛舟游于赤壁之下。清风徐来,水波不兴。举酒属客,诵明月之诗,歌窈窕之章。少焉,月出于东山之上,徘徊于斗牛之间。白露横江,水光接天。纵一苇之所如,凌万顷之茫然。浩浩乎如冯虚御风,而不知其所止;飘飘乎如遗世独立,羽化而登仙。于是饮酒乐甚,扣舷而歌之。歌曰:“桂棹兮兰桨,击空明兮溯流光。渺渺兮予怀,望美人兮天一方。”客有吹洞箫者,倚歌而和之。其声呜呜然,如怨如慕,如泣如诉;余音袅袅,不绝如缕。舞幽壑之潜蛟,泣孤舟之嫠妇。苏子愀然,正襟危坐,而问客曰:“何为其然也?

2024-04-24 14:40:22 365

原创 王者荣耀快速提升等级

等级越高,解锁的玩法越多;等级越高,解锁的铭文数量越多,铭文能提升英雄的技能属性。

2024-04-21 09:37:50 416

原创 白居易《中隐》

古代的理想生活啊,白居易不愧为诗王、诗魔,乐天居士。留司官这种闲官冷官既能保障衣食无忧,又能躲避朝堂纷争。总而言之,这首诗表达的就是钱多事少离家近,登山、游园,喝酒、吹牛、睡懒觉等等不在话下。大隐住朝市,小隐入丘樊。丘樊太冷落,朝市太嚣喧。不如作中隐,隐在留司官。不劳心与力,又免饥与寒。终岁无公事,随月有俸钱。君若好登临,城南有秋山。君若爱游荡,城东有春园。君若欲一醉,时出赴宾筵。洛中多君子,可以恣欢言。君若欲高卧,但自深掩关。亦无车马客,造次到门前。贱即苦冻馁,贵则多忧患。穷通与丰约,正在四者间。

2024-04-20 22:53:32 416

原创 python文件无法作为模块被导入

在项目tt下新建了文件夹tt包含模块文件a.py,里面包含t函数,在同路径下的1.py引入模块进行t函数的调用,具体如下目录结构tt/tt/a.pytt/tt/1.py执行报错ModuleNotFoundError。

2024-04-20 22:52:58 800

原创 苏轼的《六月二十七日望湖楼醉书五首》

黑云翻墨未遮山,白雨跳珠乱入船。卷地风来忽吹散,望湖楼下水如天。译文乌云上涌,就如墨汁泼下,却又在天边露出一段山峦,明丽清新,大雨激起的水花如白珠碎石,飞溅入船。忽然间狂风卷地而来,吹散了满天的乌云,而那西湖的湖水碧波如镜,明媚温柔。情感这首诗写作者坐船时所见,描绘了西湖的美丽雨景;

2024-04-20 22:51:59 347

原创 Chat-REC: Towards Interactive and Explainable LLMs-Augmented Recommender System

推荐系统被应用于推荐服务,提高人们的生活质量,但仍存在一些问题。Chat-Rec,有效地学习用户的偏好,,有效推理出用户和产品之间之间的联系。产品之间用户偏好相关联,允许更好的跨域产品推荐。

2024-04-04 22:52:16 793

原创 大模型llm综述

LLM 是指包含数千亿(或更多)参数的 Transformer 语言模型 ,这些模型是在大规模文本数据上进行训练的 , 例如 GPT-3 ,PaLM,Galactica 和 LLaMA。LLM 展现了理解自然语言和解决复杂任务(通过文本生成) 的强大能力。

2024-03-17 20:27:38 1792

PowerDesigner教程

PowerDesigner画E-R图详细教程最完整

2014-10-08

EDA课后习题答案

EDA技术实用教程课后答案 潘松版 第三版 1 pdf

2014-11-14

计算机操作系统课后答案.doc

计算机操作系统课后答案.doc 详细,经典

2014-11-14

谢希仁计算机网络第五版课后习题答案 1 6章 doc

谢希仁计算机网络第五版课后习题答案 1 6章 doc

2014-11-14

JAVA课后习题答案.doc

JAVA课后习题答案.doc第一章 Java语言概述2.“java编译器将源文件编译为的字节码文件是机器码”这句话正确吗? 答:不正确 3.java应用程序的主类必须含有怎样的方法? 答:含有main方法

2014-11-14

JDBC访问数据库

JDBC访问数据库 实验 1 通过 JDBC 数据库访问数据库

2014-11-14

基于Java和SQL的酒店管理系统

基于Java和SQL2000的酒店管理系统,功能强大,界面漂亮,代码完善,要做课设的可以参考,参考。

2014-09-22

linux c_c++ GDB教程详解 - shuzhifeng.html

c++ gdb调试相关,gdb启动,设置断点,查看信息等实例详解

2021-06-14

Java酒店管理系统

Java酒店管理系统附设计文档.rar。

2014-10-08

数据挖掘概念与技术

数据挖掘概念与技术第二版和第三版(包含课后答案).rar )

2014-10-08

KTV歌曲管理系统报告.rar

KTV歌曲管理系统,软件工程课程设计可用,还比较详细

2015-05-12

OSChina 娱乐弹弹弹

用Java实现的宾馆客房管理系统(包含课程设计报告).rar )

2014-10-08

项目综合开发

项目综合开发,Java sql sever酒店管理系统项目开发,附有介绍文档。

2014-10-08

sql-server-jar

Eclipse或者MyEclipse连接sql server2000或者sql sever2005的三个jar包。

2014-10-08

Web开发人员看的HTML5教程 PDF

HTML5教程,web开发人员很好的选择

2014-10-08

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除