- 博客(313)
- 收藏
- 关注
原创 使用LLaMA-Factory快速训练自己的专用大模型
本文聊聊 LLama-Factory,它是一个开源框架,这里头可以找到一系列预制的组件和模板,让你不用从零开始,就能训练出自己的语言模型(微调)。不管是聊天机器人,还是文章生成器,甚至是问答系统,都能搞定。而且,LLama-Factory 还支持多种框架和数据集,这意味着你可以根据项目需求灵活选择,把精力集中在真正重要的事情上——创造价值。使用LLama-Factory,常见的就是训练LoRA模型,增强模型在某方面的生成能力。
2024-09-03 15:51:35 796 1
原创 爆赞!清华大牛整理的基于PyTorch从零开始大模型开发与微调
他们的主要工作就是利用获得的数据集设计不同的人工神经模型,利用人工神经网络强大的学习能力提取和挖掘数据集中包含的潜在信息,编写相应的 PyTorch 程序对数据进行处理,对其价值进行进一步开发,为商业机会的获取、管理模式的创新、决策的制定提供相应的支持。今天给小伙伴们分享的这份手册使用 PyTorch 2.0 作为学习大模型的基本框架,以 Chat GLM 为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。
2024-09-03 15:14:06 443
原创 复旦NLP团队新作:大规模语言模型从理论到实践PDF版
2022 年 11 月,Chat GPT 的问世展示了大语言模型的强大潜能,并迅速引起了广泛关注。Chat GPT 能够有效理解用户需求,并根据上下文提供恰当的回答。它不仅可以进行日常对话,还能够完成复杂任务,如撰写文章、回答问题等。令人惊讶的是,所有这些任务都由一个模型完成。在许多任务上,ChatGPT 的性能甚至超过了针对单一任务进行训练的有监督算法。这对于人工智能领域具有重大意义,并对自然语言处理研究产生了深远影响。
2024-08-31 16:20:41 1386
原创 用「图灵测试」检验AI尤其是大语言模型,真的科学吗?
在他看来,智力是一种有效获得新技能的能力,而这些技能是训练过程中没有准备好的,目的是完成与系统之前所见过的任务差异足够大的任务。」她认为,图灵提出的「模仿游戏」是一种思考机器智能可能是什么样子的方法,而不是一种定义明确的测试。他认为,真正的智能并不在于掌握某项技能,而在于把学到的知识运用到新的、不同的情境中。「如果你想谈论完全的、人类水平的智能,我会说我们还有些遥远,因为人类水平的智能有许多方面是我们看不到的。例如,任务中存在足够多的冗余,在举出足够多的例子后,测试对象可能会对答案做出有根据的猜测。
2024-08-31 16:16:32 808
原创 Python关于迭代器的使用
迭代是一种重复获取数据集合中元素的过程,一次只获取一个元素,直到遍历完所有元素。在Python中,迭代通常用于遍历序列(如列表、元组)或任何可迭代对象。1.2 Python中的迭代机制Python的迭代机制依赖于两个特殊方法:__iter__和__next__。__iter__方法返回一个迭代器对象,而__next__方法则负责返回迭代器的下一个值。当没有更多的值可返回时,__next__会抛出StopIteration异常。这使得Python中的所有可迭代对象都可以被自然地用于for循环。
2024-08-28 16:03:26 1042
原创 豆瓣评分9.4!最适合Python入门后进阶的Python食谱!
Python是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。Python的设计具有很强的可读性,相比其他语言经常使用英文关键字,其他语言的一些标点符号,它具有比其他语言更有特色语法结构。今天给小伙伴们分享的这份手册,介绍了Python应用在各个领域中的一些使用技巧和方法,其主题涵盖了数据结构和算法,字符串和文本,数字、日期和时间,迭代器和生成器,文件和I/O,数据编码与处理,函数,类与对象,元编程,模块和包,网络和Web编程,并发,实用脚本和系统管理,测试、调试以及异常,C语言扩展等。
2024-08-27 15:09:19 939
原创 Python并发编程:多线程(threading模块)
多线程是一种并发编程方式,它允许在一个进程内同时运行多个线程,从而提高程序的运行效率。线程是轻量级的进程,拥有自己的栈空间,但共享同一个进程的内存空间。本文详细介绍了Python的threading模块,包括线程的创建、线程同步、线程池的使用,并通过多个示例展示了如何在实际项目中应用这些技术。通过学习这些内容,您应该能够熟练掌握Python中的多线程编程,提高编写并发程序的能力。多线程编程可以显著提高程序的并发性能,但也带来了新的挑战和问题。
2024-08-27 14:10:52 808
原创 豆瓣评分7.9!世界级讲师耗时5年整理出的Python学习手册!
Python是一门流行的开源编程语言,广泛用于各个领域的独立程序与脚本化应用中。它不仅免费、可移植、功能强大,同时相对简单,而且使用起来充满乐趣。从软件业界的任意一角到来的程序员,都会发现Python着眼于开发者的生产效率以及软件质量,因此无论你的项目是大还是小,选择Python都将带来战略性的优势。今天给小伙伴们分享的这份手册讲述了完整的Python语言,力争满足“语言”和“原理”两个方面的需求,并拥有足够的深度以便实用。
2024-08-26 16:08:42 742
原创 PyCharm连接远程服务器配置的全过程
相信很多人都遇见过这种情况:实验室成员使用同一台服务器,每个人拥有自己的独立账号,我们可以使用服务器更好的配置完成实验,毕竟自己哪有money拥有自己的3090呢。
2024-08-26 16:01:15 962
原创 Python进行Socket接口测试的实现
在计算机网络编程中,socket(套接字)是一个抽象层,用于描述网络上的两个应用程序之间的通信链路。它允许程序员通过网络发送和接收数据,就像两个程序之间通过文件系统进行数据交换一样。socket 提供了一种统一的接口,使得不同操作系统上的应用程序可以进行网络通信,而无需关心底层网络细节。Python 提供了一个内置的socket模块,使得开发者可以轻松地进行网络通信。这个模块实现了许多与网络相关的函数和类,使得创建客户端和服务器应用程序变得简单和直观。
2024-08-24 19:58:07 865
原创 Python元组之不可变序列的奥秘与应用方式
Python 中的元组(Tuple)是一种有序的、不可变的数据结构,它是序列的一种特殊形式,就像一个固定大小的盒子,一旦放入物品就无法更换或移除。元组可以包含任何类型的数据,如数字、字符串甚至是其他元组。相比列表,元组在很多场景下提供了更高效、安全的选择。
2024-08-24 18:51:57 758
原创 探究Python中的函数与模块
随着程序的复杂度增加,代码的组织与重用性就显得尤为重要。为了编写更加结构化、易于维护的代码,函数和模块的使用是必不可少的。函数是Python中最基本的代码组织形式,通过将代码封装成函数,我们可以实现代码的重用、提高代码的可读性以及简化调试过程。而模块则是Python代码的另一种组织形式,通过将相关函数、类和变量组织在一个模块中,可以方便地进行代码的共享和维护。
2024-08-24 14:55:24 748
原创 Python中的random模块及相关模块详解
random模块是Python标准库中用于生成伪随机数的模块。伪随机数是通过算法生成的数列,在一定范围内表现出随机性。虽然这些数列在一定程度上是可预测的,但对于大多数应用来说已经足够。随机函数是计算机科学中一个基础而又重要的概念,random模块为我们提供了丰富的功能来处理随机性。通过深入学习和应用random模块以及numpy、secrets和matplotlib等相关模块,我们可以更好地处理各种随机性相关的问题。
2024-08-24 13:39:05 296
原创 GitHub星标破万!Python学习教程(超详细),真的太强了!
Python 是一门初学者友好的编程语言,想要完全掌握它,你不必花上太多的时间和精力。今天给小伙伴们分享一份GitHub上超详细的Python学习教程,废话不多说,学会一门语言的捷径只有一个:
2024-08-23 15:12:35 813
原创 python多进程日志以及分布式日志的实现方式
本篇所提供的多进程日志解决方法的目的是尽可能少做配置和修改,保留原有编程习惯的同时兼顾了代码的易用性。
2024-08-23 14:55:38 1005
原创 豆瓣评分9.0!Python3网络爬虫开发实战,堪称教学典范!
今天我们所处的时代是信息化时代,是数据驱动的人工智能时代。在人工智能、物联网时代,万物互联和物理世界的全面数字化使得人工智能可以基于这些数据产生优质的决策,从而对人类的生产生活产生巨大价值。在这个以数据驱动为特征的时代,数据是最基础的。数据既可以通过研发产品获得,也可以通过爬虫采集公开数据获得,因此爬虫技术在这个快速发展的时代就显得尤为重要,高端爬虫人才的收人也在逐年提高。
2024-08-22 15:32:58 1127
原创 Python Tuples(元组)详解
本文,我们对 Python Tuples进行了详细的分析,元组是一种不可变、有序的集合,可以包含任意类型的元素。元组通过逗号分隔的值创建,通常使用括号括起来。由于其不可变性,元组更安全且更高效,适用于需要固定数据集的场景。元组支持索引访问、切片、连接和解包操作,但不支持修改。常用内置函数包括len(), max(), min(), sum()等。元组也可以作为字典的键或集合的元素,适用于需要数据完整性和高性能的场景。
2024-08-22 14:22:17 739
原创 豆瓣评分8.7!Python pandas创始人亲码的数据分析入门手册!
在众多解释型语言中,Python最大的特点是拥有一个巨大而活跃的科学计算社区。进入21世纪以来,在行业应用和学术研究中采用python进行科学计算的势头越来越猛。近年来,由于Python有不断改良的库(主要是pandas),使其成为数据处理任务的一大代替方案,结合其在通用编程方面的强大实力,完全可以只使用Python这一种语言去构建以数据为中心的应用程序。作为一个科学计算平台,Python的成功源于能够轻松的集成C、C++以及Fortran代码。大部分现代计算机环境都利用了一些Fortran和C库来
2024-08-21 13:58:56 592
原创 Python网络编程:Web框架基础(Flask/Django)
通过本文的介绍,我们了解了Flask和Django两个流行的Python Web框架的基础知识。Flask作为一个轻量级框架,适合中小型项目,具有较高的灵活性。Django作为一个功能全面的框架,适合大型复杂项目,内置了丰富的功能。通过综合示例,我们展示了如何使用这两个框架构建Web应用,希望读者能够根据自己的需求选择合适的框架,并在实际项目中加以应用。
2024-08-21 13:51:09 1789
原创 豆瓣评分8.6!Python社区出版的Python故事教程,太强了!
Python 是活力四射的语言,是不断发展中的语言。就连使用 Python 多年的行者也不敢说对 Python 的方方面面都了解并可以自由运用,想必读者可能更加无法快速掌握所有重点技巧了。今天给小伙伴们分享的这份手册是,是一本Python语言详解书籍,由Python的行者根据自身经验组织而成,是为从来没有听说过Python的准备的一份实用的导学性质的书,笔者试图将优化后的学习体验,通过故事的方式传达给读者。对于零基础的小白来说更建议入门后再来品读。
2024-08-20 15:31:51 532
原创 Python网络编程:HTTP请求(requests模块)
requests模块是一个用于发送HTTP请求的第三方库,其设计初衷是简化HTTP请求的发送和处理。与Python标准库中的urllib相比,requests提供了更直观和便捷的API,使开发者能够快速编写功能强大的HTTP客户端。1.1 安装requests模块在使用requests模块之前,需要先安装它。1.2 导入requests模块。
2024-08-20 14:38:00 785
原创 10余位大佬+10余年经验的结晶:Python数据分析与挖掘实战
LinkedIn 对全球超过3.3亿用户的工作经历和技能进行分析后得出,目前最炙手可热的25 项技能中,数据挖掘排名第一。数据挖掘是从大量数据(包括文本)中挖掘出隐含的、先前未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程。数据挖掘有助于企业发现业务的趋势,揭示已知的事实,预测未知的结果,因此“数据挖掘”已成为企业保持竞争力的必要方法。
2024-08-17 14:45:23 619
原创 Python网络编程:socket编程
本文详细介绍了 Python 的 socket 编程,包括基础概念、核心组件、常用功能等,并通过一个综合的聊天程序示例展示了如何在实际项目中应用这些技术。通过学习这些内容,您应该能够熟练掌握 Python 中的 socket 编程,提高编写网络通信程序的能力。Socket 编程是网络编程的重要组成部分,但在实际项目中,还需要考虑安全性、性能、错误处理等诸多问题。希望本文能帮助您更好地理解和掌握 Python 中的 socket 编程。
2024-08-17 14:01:33 616
原创 豆瓣评分9.4!Python程序员必读的《流畅的Python》,放这里了!
Python 官方教程的开头是这样写的:“Python 是一门既容易上手又强大的编程语言。””这句话本身并无大碍,但需要注意的是,正因为它既好学又好用,所以很多Python程序员只用到了其强大功能的一小部分,只需要几个小时,经验丰富的程序员就能学会用 Python 写出实用的程序。然而随着这最初高产的几个小时变成数周甚至数月,在那些先入为主的编程语言的影响下,开发者们会慢慢地写出带着“口音”的 Python 代码。即便 Python 是你的初恋,也难逃此命运。
2024-08-16 14:39:02 592
原创 Python数据分析:数据可视化(Matplotlib、Seaborn)
本文详细介绍了Python中两个主要的数据可视化库——Matplotlib和Seaborn的使用方法,并通过一个综合实例展示了如何使用这两个库进行数据可视化。Matplotlib提供了强大的绘图功能和高度的定制性,而Seaborn则提供了更简洁的接口和更美观的默认样式。根据不同的需求,我们可以选择合适的库进行数据可视化,从而更好地理解和解释数据。
2024-08-16 14:25:17 1178
原创 GitHub星标68K!Python数据分析入门手册带你从数据获取到可视化
Python作为一门优秀的编程语言,近年来受到很多编程爱好者的青睐。一是因为Python本身具有简捷优美、易学易用的特点;二是由于互联网的飞速发展,我们正迎来大数据的时代,而Python 无论是在数据的采集与处理方面,还是在数据分析与可视化方面都有独特的优势。我们可以利用 Python 便捷地开展与数据相关的项目,以很低的学习成本快速完成项目的研究。今天给小伙伴们分享的这份本着实用性的目的,着眼于整个数据分析的流程,介绍了从数据采集到可视化的大致流程。内容涵盖以及。
2024-08-15 14:45:24 801
原创 Python数据分析:Numpy、Pandas高级
通过上述综合示例,我们展示了如何使用NumPy和Pandas的高级功能进行数据生成、读取、处理和分析。这些高级功能使得数据分析更加高效和灵活,帮助我们更好地理解和利用数据。
2024-08-15 14:43:16 339
原创 百万级Python讲师又一力作!Python编程轻松进阶,豆瓣评分8.1
在学习Python的旅程中你是否正在“绝望的沙漠”里徘徊?学完基础教程的你,是否还在为选择什么学习资料犹豫不决,不知从何入手,提高自己?
2024-08-14 18:25:50 980
原创 Python数据分析:Numpy、Pandas基础
本文详细介绍了 Python 中两个重要的数据分析库 NumPy 和 Pandas 的基础知识,并通过一个综合的示例展示了如何使用这些库进行数据处理和分析。希望通过本篇博文,能更好地理解和掌握 NumPy 和 Pandas 的基本用法,为后续的数据分析工作打下坚实的基础。
2024-08-14 14:02:18 353
原创 Python使用asyncio包实现异步编程方式
在Python中实现异步函数的定义需要两个关键字(async和awaitasyncasync关键字声明一个异步函数。它可以在执行过程中暂停并允许其他代码执行。当你调用一个异步函数时,它会立即返回一个协程对象而不是实际的结果。异步函数适用于执行耗时的I/O操作,例如网络请求、文件读写、数据库查询等。这些操作通常涉及到等待外部资源的响应或者数据的传输,而在等待的过程中,CPU可以执行其他任务,从而提高程序的效率。awaitawait关键字在Python中用于等待一个异步操作完成。当调用异步函数时,使用。
2024-08-13 22:25:47 989
原创 python实现ModBusRTU客户端方式
Modbus RTU(Remote Terminal Unit)是一种串行通信协议,用于在工业自动化系统中传输数据。它是Modbus协议的一种变体,采用二进制编码,并通常在RS-485串行通信物理层上运行。Modbus RTU协议允许设备(例如传感器、执行器、控制器等)通过串口(通常是RS-485)与计算机、PLC(Programmable Logic Controller,可编程逻辑控制器)等主设备进行通信。通信的内容可以包括传感器的测量数据、控制命令等。
2024-08-13 22:16:53 727
原创 python多继承的3C算法是什么?怎么用?
有很多地方都说python多继承的继承顺序,是按照深度遍历的方式,其实python多继承顺序的算法,不是严格意义上的深度遍历,而是基于深度遍历基础上优化出一种叫3C算法。
2024-08-13 14:48:38 416
原创 Python爬虫开发:BeautifulSoup、Scrapy入门
BeautifulSoup是一个Python库,用于从HTML或XML文档中提取数据。它能够通过标签和属性来定位和提取数据,非常适合进行小规模的网页抓取任务。Scrapy是一个用于爬取网站并提取结构化数据的应用框架。它提供了强大的功能,如处理请求、解析HTML、管理爬取的数据等,适合进行大规模的爬虫开发。通过本文,我们详细介绍了Python中的两个流行的爬虫开发库:BeautifulSoup和Scrapy。我们不仅介绍了它们的基本用法,还深入探讨了它们的高级功能和应用场景。
2024-08-12 21:59:50 1715
原创 网安必会!网易大牛纯手码的网络协议教程,超有趣!
为什么网安人要学网络协议?网络协议是人类和计算机沟通的协议,只有通过这种协议,计算机才知道我们想让它做什么。因此学习计算机网络协议就变得非常必要。网络协议知识点太多,学完记不住。大部分读者应该都学过计算机网络课程,学的时候感觉并不难,尤其这门课没有公式,更像是文科的东西。学了一大堆东西,也背了一大堆东西但是最终应付完考试之后,都“还给了老师”
2024-08-10 14:55:45 273
原创 降级攻击可“复活”数以千计的Windows漏洞
在本周举行的黑帽大会(Black Hat 2024)上,安全研究员Alon Leviev曝光了一个微软Windows操作系统的“超级漏洞”,该漏洞使得攻击者可以利用微软更新进程实施降级攻击,“复活”数以千计的微软Windows漏洞,即便是打满补丁的Windows11设备也将变得千疮百孔,脆弱不堪。此次漏洞的发现引发了广泛关注。“我能够让一台完全修补过的Windows机器受到过去存在的数千个漏洞的攻击,将已修复的漏洞变成零日漏洞,并让世界上任何一台Windows机器上的‘完全修补’一词都变得毫无意义。
2024-08-10 14:25:52 242
原创 网安大佬满眼不舍!黑客新手入门特训手册被我分享出来了
随着网络技术的飞速发展,互联网的世界可谓是越来越精彩,同时也越来越危险。黑客们就像网络世界里的“幽灵”,无处不在,无孔不入。只要你上网,就有可能被黑客盯上,遭受他们的侵扰。不过,黑客的存在也不全是坏事。他们就像是一群在网络世界里行侠仗义的“大侠”,追求自由、平等、共享、免费。他们的出现,推动了计算机和网络技术的发展和完善。可以说,正是因为计算机技术的不健全,才需要更多的黑客来维护网络安全。正如黑客英雄网站长 myhk 所说:“黑客存在的意义就是使网络变得日益安全完善。
2024-08-09 15:47:01 411
原创 英国内政部网络遭俄黑客攻击,数据和电子邮件被盗
沙利文说,这一事件凸显了对向政府销售服务的私营部门组织的问责制的紧迫问题:“与Crowdstrike类似,这次影响微软的事件表明,我们对少数提供关键服务的供应商的使用使我们在出现违规或中断时面临单一故障点。当时,CISA表示,微软已承诺通过提供“所有被转移的联邦机构通信的元数据”,协助美国政府对事件进行调查,并警告说这些被盗通信“对机构构成了严重且不可接受的风险”。根据信息自由法获得的这份报告的描述,该事件是“对[部门]企业系统的供应商的国家级攻击”,并将黑客攻击与微软1月份的公告联系起来。
2024-08-09 15:43:09 667
原创 最佳实践!豆瓣评分9.2的Web渗透攻防技术实战手册!
攻击与防护是辩证统一的关系,只有掌握了攻击技术,才能更好地防范攻击。Web 渗透是网络安全攻防的热门技术之一,攻击者可以通过渗透 Web 服务器,利用已有信息,逐渐深入公司或大型网络,最终完成渗透。今天给小伙伴们分享的这份手册主要讨论 Web 渗透攻防技术。它会从最基础的知识开始,逐渐深入,全面而深入地介绍和分析当前的渗透技术和手段,包括一些实际操作、经验和技巧,还有一些独门绝技。
2024-08-08 16:12:47 306
原创 六个策略,打造网络安全宣传周峰值体验
每年 9 月份的网络安全宣传周可是一项很重要的年度提议,也是一次能掀起网络安全文化热潮的好机会。不同的组织可以按照现有的组织文化、安全预算、受众的特点之类的这些因素,专门为自己定制安全周活动,并且借着安全周的这股劲头,鼓励员工把好的安全思维和行为方式带到第四季度或者下一年去。
2024-08-08 15:12:39 1047
原创 GitHub点赞飙升!电信大牛的Python渗透测试实战指南
在网络安全领域,会不会编程,是区分“脚本小子”和真正黑客的关键。实际的渗透测试中会遇到各种复杂的网络环境,常用工具不一定能满足需求,这时就需要对现有工具进行扩展,或者编写符合要求的工具、自动化脚本,这都需要一定的编程能力。在分秒必争的 CTF 竞赛中,想要高效地使用自制脚本工具来达成各种目的,更是需要有编程能力。Python 这两年越来越火!除了语法简单、开发效率高以外,Python 最大的优势就是拥有超多第三方库。很多有名的网络安全工具和安全系统框架都是用 Python 开发的!所以,掌握 Pytho
2024-08-07 16:19:38 434
Python实战案例合集·
2024-05-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人