自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 pycharm在创建项目中,package和directory有什么区别,在一个项目中应该怎么创建?

打开你的pycharm,当你要创建一个比较大的project时,难免会碰到需要创建多个文件夹的情况,但是pycharm似乎提供了两种文件夹的图标,那么这两种图标有什么区别呢?如果需要存放非 Python 文件,如配置文件、数据文件等,可以创建普通的 Directory 来组织这些文件。首先创建一个 Package 作为项目的顶级包。这个顶级包应该与项目的名称相对应。将相关的 Python 模块文件放在对应的 Package 目录下。在这个顶级包下,根据功能或模块划分,创建更多的子 Package。

2024-07-23 10:15:29 199

原创 在一个项目中有多个package,如何在一个package下的脚本中调用另一个package下的方法?

【代码】在一个项目中有多个package,如何在一个package下的脚本中调用另一个package下的方法?

2024-07-22 16:00:05 101

原创 如何在pycharm中导出项目专门的requirements.py ?

(其他方法:如果遇到编码错误UnicodeDecodeError,则将指定编码为utf8:pipreqs ./ --encoding=utf8或者pipreqs ./ --encoding='iso-8859-1' )在当前虚拟环境下的当前项目路径下。

2024-07-17 17:39:34 127

原创 图论:BFS与DFS,拓扑排序,前缀树Trie

1、定义:这是一种用于遍历或搜索树/图的算法。简单来说就是,从起始节点开始,沿着路径尽可能深/远地搜索,知道到达叶子节点,然后回溯到上一个节点,继续探索未访问的路径。1、定义:从起始节点开始,首先访问所有与起始节点【相邻】的节点,然后【逐层】向外扩展搜索,直到找到目标节点或者遍历完整个图。bfs解决图的最短路径问题、状态转移图的搜索问题(迷宫问题、八数码问题等)。dfs适合解决图的遍历问题,比如判断图是否连通、解决路径规划等问题;3、举例:腐烂的橘子(题目描述如下)bfs可以保证找到的路径是最短路径。

2024-03-31 17:16:55 348 1

原创 一些编程题集合

包括但不限于动态规划、约瑟夫问题、贪心算法。。。

2024-03-25 13:24:06 172 1

原创 把Excel变成格式规范的json/jsonl文件

【代码】把Excel变成格式规范的json/jsonl文件。

2024-03-20 14:00:50 443 1

原创 从csv中提取出有效内容,并保存为json

【代码】从csv中提取出有效内容,并保存为json。

2024-03-20 11:31:23 143 1

原创 Flask基础脚本练习

【代码】Flask基础脚本练习。

2024-03-20 11:28:21 109 1

原创 把json数据进行修剪,只取你想要的内容

【代码】把json数据进行修剪,只取你想要的内容。

2024-03-20 11:21:13 107 1

原创 python找出连续字符串

尽量用低复杂度的方法编程,因为有些库可能需要导入才能使用,比如collections的Counter。还有就是注意题目给出的输入输出的格式,有一道题是‘合并数组’,但是输入的格式实际上是字符串,所以要先想办法把这个字符串变成好处理的数组,然后再输出。赛美特编程题之一:输入是全部由小写字母组成的字符串,帮我列出每一个元素出现的次数,例如输入是‘aannnhhbdus’,输出‘2a3n2h1b1d1u1s’。

2024-03-18 16:07:43 166

原创 关键词匹配

我这次没有用深度学习的方式,直接手撕的,所以会有通用性差的弊端。如果有复现的好的模型,未来可以用来优化下。

2024-03-13 17:59:23 393

原创 nlp大模型--实习笔记6

需求:根据文本内容‘content’在新列‘model’中匹配商品型号‘model_list’。

2024-02-26 14:11:21 198 1

原创 成绩计算脚本(简单版)

学第三方库的时候遇到版本兼容问题懒得处理了,无聊,针对学校给我们的excel成绩单写了一个简单的脚本,之后要扩展功能的话,可以根据计算成绩的公式不同增加,还有就是如何处理更复杂的表格格式等等。

2024-01-24 16:49:46 477 1

原创 nlp大模型-实习笔记5

为了防止报错,用这些函数之前必须确保文本是标准的json格式,如果不是,用切片、replace等方法调整一下。这之后,简单讲就是(在花括号内)“json.loads双(引号)变单,json.dumps单变双。我的理解是,如果你需要将内容从文件中取出或存入文件,用不带s的两个函数;2、json.loads\ json.dumps\ json.load\ json.dump如何区分使用?json.dump把json数据存入文件,json.load把json数据从文件中取出。读取的是文件对象,而。

2023-11-14 16:29:54 114 1

原创 Mac的app store打开白屏+命令行开发工具因为网络问题无法安装的解决方法

把这两个问题放一起,是因为我感觉这两个来自同一个原因。果然,apple store能正常显示的时候,Xcode也可以下载了。现在在vs code下载一些库就可以直接用开发者工具下载了。所以说有时候遇到一个问题没解决,以后终究要解决的,早解决晚解决,还不如有空就解决。注意,改代理的时候一定要记住原先的URL是什么,不然改不回来。

2023-10-31 17:58:49 252 1

原创 python二级真题

62、栈的存储空间为s(1:m),初始状态为top=m+1,即栈的初始状态为空,当地一个元素进栈后,top=m,第二个元素进栈后,top=m-1,以此类推,当第m个元素进栈后,top=1,此时栈满,再进行入栈操作将发生溢出。47、【循环链表】采用【链式】存储结构,线性表链式存储结构的特点:用一组不连续的存储单元存储线性表中的各个元素,线性链表的存储单元是任意的,即存储空间可以是不连续的。29、【进程】是可以【并发执行】的程序的执行过程,具有动态性、共享性、独立性、制约性和并发性。

2023-10-30 14:13:35 54 1

原创 论文解读 Retrieve Anything To Augment Large Language Models

实验表明,为一种场景优化的特定任务检索器在其他场景中的性能有限,说明不同检索任务之间的训练影响并不总是可传递的。可以观察到,尽管特定任务的训练可以为其相应的场景(例如,知识增强和上下文学习)提供有竞争力的性能,但当应用于其他用途时,它们的影响会严重削弱。这部分代表了模型对候选的相似度评分,其中𝒆𝑞是查询的嵌入向量,𝒆𝑝𝑖是候选𝑝𝑖的嵌入向量。优化后的公式通过引入稳定化处理(通过重新排序候选列表中的候选样本并引入一种新的权重机制)和多样性采样策略(通过重新排序候选列表中的候选样本并引入一种新的权重机制)。

2023-10-30 10:24:55 1480 1

原创 nlp大模型-实习笔记4

改变其他参数即可调整直方图的样貌,可以自行学习相关内容。如何将计算出来的余弦相似度转换成直方图?

2023-10-23 11:30:01 54

原创 nlp大模型-实习笔记3

导入Excel再调用大模型,并且将响应输出的束搜索文本保存在原来的Excel当中(另起一列)。注:代码在定义的变量部分有删减。

2023-10-18 17:47:53 32

原创 nlp大模型-实习笔记2

特别需要注意的是这个函数输入的参数类型必须是vector(向量是一个数学概念,用于表示一维有序数据集),维度也需要相同才可以计算。反正输入参数的类型、维度等等都挺严格的,运行的时候可以注意下。

2023-10-18 17:39:16 58

原创 nlp大模型-实习笔记1

【代码】nlp大模型-实习笔记。

2023-10-18 17:29:06 39

原创 爬虫时报错 yield self.engine.open_spider(self.spider, start_requests)pika.exceptions.AMQPConnectionError

一般报错多在配置文件的,解决起来很复杂,优先考虑代码是否有问题。然后,telnet 报错信息提到的端口,试过之后端口打不开,可能四官网有限制,所以我在pipelines.py文件里注释掉报错信息提到的connection属性的相关代码。然后发现,代码在用到selenium的wait_time时class必须填写页面存在的,所以返回要爬取的页面检查,换了已存在的class。一开始我以为是pika版本问题,所以从1.3系列降到1.1系列,但还是一样的报错。爬虫可以正常运行了,接下来就是完善和修改具体的需求。

2023-08-15 16:29:53 1027 1

原创 python图像处理基础代码(分辨率、格式、删除指定文件)

【代码】python图像处理基础代码(分辨率、格式、删除指定文件)

2023-03-30 15:39:14 108

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除