自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(167)
  • 资源 (2)
  • 收藏
  • 关注

原创 建筑业AI的崛起The Rise of AI and Machine Learning in Construction

NSDT工具推荐建筑领域完全可以从机器学习和人工智能(AI)的出现中受益。作为 Autodesk BIM 360 Project IQ 团队的一员,我有幸参与 Autodesk 进军建筑机器学习领域。本文总结了这一领域的发展,并介绍了人们可以准备从这项技术中实现价值最大化的一些方法,包括对人工智能和机器学习在建筑中的一些应用及其潜在影响的广泛调查。这些流程正在各个领域发生变化,包括风险管理、进度管理、分包商管理、施工现场环境监控和安全等。

2024-08-25 08:10:39 443

原创 Langchain编程中常见Python库讲解【3】

原文链接:https://blog.csdn.net/Climbman/article/details/141512948。:用于将复杂的对象类型转换为简单的 Python 数据类型,以及进行反序列化。:用于读写 Excel 文件的 Python 库。:提供高效的内存数据结构和大数据处理工具。:不太清楚具体功能,无法给出示例。:用于数据验证和解析的核心库,是。:用于处理 JSON 补丁的库。:快速数值表达式评估库。:简单易用的日志记录库。:用于计算机视觉的库。:用于 OCR 的库。

2024-08-25 07:55:24 405

原创 Langchain编程中常见Python库讲解【2】

自定义库,无法给出具体示例代码。:自定义库,无法给出具体示例代码。:自定义库,无法给出具体示例代码。:自定义库,无法给出具体示例代码。:自定义库,无法给出具体示例代码。:自定义库,无法给出具体示例代码。:自定义库,无法给出具体示例代码。:自定义库,无法给出具体示例代码。:自定义库,无法给出具体示例代码。:自定义库,无法给出具体示例代码。:自定义库,无法给出具体示例代码。:自定义库,无法给出具体示例代码。:自定义库,无法给出具体示例代码。:自定义库,无法给出具体示例代码。:自定义库,无法给出具体示例代码。

2024-08-25 07:46:13 266

原创 Langchain编程中常见Python库讲解【1】

假设你有一个定义好的 FlatBuffers schema 文件。本文罗列部分依赖的python库代码举例。假设你有一个配置文件。

2024-08-25 07:36:16 438

原创 Langchain编程中常见Python库以及用途

一个快速的现代 Web 框架,基于 Python 的类型提示和异步编程,适用于构建高效的 RESTful APIs。:可能是用于语言相关任务的工具库,具体用途取决于其特定的功能设计,可能涉及语言模型的训练、评估或其他语言处理任务。:一个用于构建语言处理应用的工具集,可能包括与语言模型的交互、知识图谱构建、文本生成等功能。:可能是一个语言处理的核心库,可能包含语言模型的交互、知识图谱构建、文本生成等功能。:可能是用于与 OpenAI 的语言模型进行交互的特定实现,提供方便的接口和工具。

2024-08-25 07:06:51 435

原创 CentOS7安装EPEL

yum 安装CentOS7/RHEL7安装EPEL扩展仓库步骤详解。

2024-08-24 07:52:18 97

原创 MosaicML-面向生成式AI的机器学习平台

前段时间,大数据巨头 Databricks 宣布已签署最终协议,将以13亿美元的价格,收购位于旧金山的人工智能初创公司MosaicML。这篇文章来自 MosaicML官方的技术博客,是对 MosaicML 大模型训练平台的一个简单介绍。AIGC领域最大收购:Databricks 13亿美元买下MosaicML,成立仅2年员工60人-36氪MosaicML 平台旨在应对训练 ChatGPT、LaMDA 和 Stable Diffusion 等大模型的挑战。

2024-08-22 23:54:43 782

原创 22个最佳AI营销工具

你可以使用和保存不同的提示,因此它生成的所有图像都符合你的品牌指导方针。基本上,你可以用简单的英语询问有关 Notion 工作区中的任何内容的问题——无论是你的笔记、项目、文档还是 wiki——Notion AI 都会自动提取答案。在标记文章中的 H2 和 H3 标题方面,它不像 Surfer 那样灵活,但它生成的实际内容比 Surfer 甚至 Jasper 的质量要高一些。在这篇关于一些最佳人工智能驱动的应用程序和平台的概述中,我们将准确解释每个应用程序和平台的功能、其优势以及可能存在的局限性。

2024-08-22 15:11:32 397

原创 检索增强生成架构剖析

对于我的项目,我发现用 Markdown 编写的文档即使使用 LangChain 的 Markdown 拆分器也会丢失太多上下文,因此我编写了自己的拆分器,根据 Markdown 的标题和代码块标记对内容进行分块。不同的嵌入模型有不同的编码和比较数据向量的方式。如果喜欢冒险,你还可以微调自己的嵌入模型,以便你的 LLM 更加了解特定于领域的术语,从而为你提供更好的查询结果。如果你要求LLM写一些关于最近趋势或事件的文章,LLM不会知道你在说什么,而且回答最好是混合的,坏的情况下往往还是有问题的。

2024-08-22 15:02:01 1017

原创 流行的AI智能体开发框架

ChatDev 被称为“虚拟软件公司”,它使用的智能体不止一个,而是多个,在传统的开发组织中扮演不同的角色。智能体领域可能仍然看起来像是一种“疯狂科学家”式的实验,但已经有一些非常强大的模型可以尝试,本文介绍其中最流行的11个开源AI Agent框架。到目前为止,MetaGPT 只能处理中等难度的任务——比如编写贪吃蛇游戏或构建简单的实用程序应用程序——但它是一个很有前途的工具,未来可能会迅速发展。简而言之,Camel 是早期的多智能体框架之一,它使用独特的角色扮演设计,使多个智能体能够相互通信和协作。

2024-08-22 14:40:50 797

原创 CentOS7下搭建并体验HFish开源蜜罐系统

蜜罐:技术本质上是一种对攻击方进行欺骗的技术,通过布置一些作为诱饵的主机、网络服务或者信息,诱使攻击方对它们实施攻击,从而可以对攻击行为进行捕获和分析,了解攻击方所使用的工具与方法,推测攻击意图和动机,能够让防御方清晰地了解他们所面对的安全威胁,并通过技术和管理手段来增强实际系统的安全防护能力。蜜罐 好比是情报收集系统。蜜罐好像是故意让人攻击的目标,引诱黑客前来攻击。所以攻击者入侵后,你就可以知道他是如何得逞的,随时了解针对服务器发动的最新的攻击和漏洞。

2024-08-21 16:52:56 807

原创 Kimi在阿里云上凭借长文本出人意料地进入了各方视野

业内人士称,企业拥抱AI的路上,从底到上挖算力、调模型、做工具框架、做模型服务、开发应用,需要的人力、时间成本投入非常大。云是平台经济,生态是平台增长的飞轮,这是国际云厂商的成功经验IDC2022年数据显示,微软Azure每赚1美元,服务伙伴能赚7.6美元,软件伙伴能赚10.1美元。显然,在AI即将改变全行业生产逻辑、成为下一阶段如同电力一般,润物细无声却又不可或缺的基础设施的路上,阿里云似乎已经做足准备,成为那个核心角色。企业在云上的消费量会随着业务发展、用云加深不断变大,这是个滚雪球的过程。

2024-08-21 15:51:54 340

原创 蜜罐技术是一种什么防御技术?实现原理是什么?

分布式蜜罐/蜜网能够通过支持在互联网不同位置上进行蜜罐系统的多点部署,有效地提升安全威胁监测的覆盖面,克服了传统蜜罐监测范围窄的缺陷,因而成为目前安全业界采用蜜罐技术构建互联网安全威胁监测体系的普遍部署模式,具有较大影响力的包括The Honeynet Project的Kanga及其后继GDH系统、巴西分布式蜜罐系统、欧洲电信的Leurre、Com与SGNET系统、中国Matrix分布式蜜罐系统等。蜜罐的交互程度是指攻击者与蜜罐相互作用的程度,高交互蜜罐提供给入侵者一个真实的可进行交互的系统。

2024-08-21 15:47:52 568

原创 计算机相关法律法规及违规案例

根据《中华人民共和国刑法》第二百八十六条规定,对计算机信息系统功能进行删除、修改、增加、干扰,造成计算机信息系统不能正常运行,后果严重的,处五年以下有期徒刑或者拘役;后果特别严重的,处五年以上有期徒刑。违反国家规定,对计算机信息系统中存储、处理或者传输的数据和应用程序进行删除、修改、增加的操作,后果严重的,依照前款的规定处罚。故意制作、传播计算机病毒等破坏性程序,影响计算机系统正常运行,后果严重的,依照第一款的规定处罚。单位犯前三款罪的,对单位判处罚金,

2024-08-21 15:39:49 822

原创 案·理探析 | 网络爬虫技术滥用的刑事责任

案·理探析 | 网络爬虫技术滥用的刑事责任刘荣 王爱强 中国检察官 2021年10月31日 19:32 北京摘 要:网络爬虫是高效收集、分类、整理海量网络信息的程序或者脚本,具有很高的实用价值。但当网络爬虫使用者为了获取经济利益,将其作为犯罪工具,严重扰乱计算机信息系统的运行秩序,会构成计算机相关犯罪,同时网络爬虫具有收集信息的功能,可能会侵害到公民个人信息等多种法益。网络爬虫技术滥用的行为一旦已经达到相关司法解释立案追诉的标准,就应当依照相关规定追究行为主体的刑事责任。应将违法所得和经济损失作为“情节严

2024-08-21 15:35:17 801

原创 数据之争:网络爬虫涉及的法律问题

(4)在使用、传播抓取到的信息时,应审查所抓取的内容,如发现属于用户的个人信息、隐私或者他人的商业秘密的,应及时停止并删除。另一方面,虽然网站上的信息是公开的,但在没有爬虫的情况下,一般经营者较难批量复制网站上的信息,例如抓取竞争对手的价格以进行比价,或者实时调整自己的价格。因此,如果爬虫控制者绕开上述限制,而抓取用户的该等隐私,又或者在抓取后公开传播该等信息,造成对用户的损害后果的,则有可能侵犯了相关用户的隐私权。尽管,程序和机器的行为目前仍然是人类行为的结果、受人类意志的控制、并服从于人类的目的。

2024-08-21 15:34:32 804

原创 利用网络爬虫获取数据的刑事责任分析

(2017)京0108刑初2384号上海晟品网络科技有限公司、侯明强等非法获取计算机信息系统数据罪一案[1]中,行为人在没有获得授权的情况下,通过破解App的加密算法或API交互规则,使用伪造的设备ID绕过服务器的身份校验,使用伪造的UA、IP绕过服务器的访问频率设置等规避或突破系统技术保护措施的手段,突破权限许可获取数据,因而构成非法获取计算机信息系统数据罪。此外,还需强调的是,获取数据的结果同样影响罪与非罪,利用网络爬虫频繁访问目标数据服务器,导致服务器不能正常运行的,或还会涉及破坏计算机信息系统罪。

2024-08-21 15:31:17 898

原创 网络爬虫可能面临的法律责任

目前,我国并未出台专门针对网络爬虫技术的法律规范,但在司法实践中,相关判决已屡见不鲜。以“爬虫”为关键字在中国裁判文书网进行检索,其中四分之三的案件集中在民事领域,刑事案件和行政案件占比四分之一。民事案由主要为“知识产权与竞争纠纷”,而刑事案由主要为刑法第二百五十三条之一规定的“侵犯公民个人信息罪”和第二百八十五条、二百八十六条规定的计算机网络犯罪。从技术中立的角度来看,爬虫技术本身并无违法违规之处,使用爬虫技术是否触犯法律底线,取决于主体如何使用、为何使用。因此本文将从以下几个方面对有关法律规范和司法案例

2024-08-21 15:28:57 878

原创 和我一起构建搜索引擎(四)检索模型

第一个部分是词项t在查询Q中的得分,比如查询“中国人说中国话”中“中国”出现了两次,此时qtf=2,说明这个查询希望找到的文档和“中国”更相关,“中国”的权重应该更大,但是通常情况下,查询Q都很短,而且不太可能包含相同的词项,所以这个因子是一个常数,我们在实现的时候可以忽略。第一个公式是外部公式,一个查询Q可能包含多个词项,比如“苹果手机”就包含“苹果”和“手机”两个词项,我们需要分别计算“苹果”和“手机”对某个文档d的贡献分数w(t,d),然后将他们加起来就是整个文档d相对于查询Q的得分。

2024-08-21 09:43:47 423

原创 和我一起构建搜索引擎(三)构建索引

10^7个存储单元,但是图1往往是一个稀疏矩阵,因为一个文档中可能只出现了200个不同的词项,剩余的19800个词项都是空的。比如词项”苹果“出现在doc1和doc3文档中,如果我们要找同时出现”苹果“和”手机“的文档,只需把他们对应的向量取出来进行”与“操作,此为101&011=001,所以doc3同时出现了”苹果“和”手机“两个关键词,我们将其返回。有些词,如”的“、”地“、”得“、”如果“等,几乎每篇文档都会出现,他们起不到很好的区分文档的效果,这类词被称为”停用词“,我们需要把他们去掉。

2024-08-21 09:41:40 704

原创 swift微调款框架使用自定义数据集进行通义千问1.5的微调

通义千问(T2IQA)是一个基于Transformer架构的问答系统,本文将介绍如何使用自定义数据集对Swift语言版本的通义千问进行微调,以适应特定的问题和领域。答:选择合适的超参数是微调过程中的一个重要步骤,可以根据经验和实验结果来选择超参数,也可以使用网格搜索等方法进行超参数调优,以获得最佳的微调效果。2、准备自定义数据集:收集与所需领域相关的问题和对应的正确答案,并将其整理成适合训练的形式,确保数据集的质量和多样性,以提高微调的效果。swift微调款框架使用自定义数据集进行通义千问1.5的微调。

2024-08-20 22:14:51 334

原创 发布MHA主从备份配置方案

请注意,以上示例仅供参考,您需要根据实际的服务器环境和需求进行调整。在生产环境中部署前,务必进行充分的测试和备份。准备至少 3 台服务器:1 台主服务器(Master),2 台从服务器(Slave)。操作系统:CentOS 7 或类似的 Linux 发行版。安装 MySQL 5.7 或更高版本。MySQL 主从复制配置。

2024-08-12 11:15:23 159

原创 真正了解Cassandra数据库

作者介绍宇文湛泉,现任金融行业核心业务系统DBA,主要涉及Oracle、DB2、Cassandra等数据库开发工作。Cassandra数据库,值得介绍的技术细节其实挺多的。因为它很多实现思路和关系型数据库或者其他的NoSQL数据库,是有一些不同的。这种不同是在数据库设计实现思路上也是根源上的。所以衍生开来的诸多特点,在介绍起来就不太容易和其他数据库去类比。那么Cassandra有这么大量的内容,本文只能选讲其中的一部分,这部分内容是如何挑选的呢?在《Cassandra The Definitive Guid

2024-08-10 11:08:21 457

原创 大数据环境安装Elasticsearch Kibana可视化

1、用yum安装,配置仓库和镜像。2、用离线软件包,rpm安装。服务器环境CentOS7.9因为云安装,配置镜像版本一直没有成功,改为直接下载软件安装。官方网址:https://www.elastic.co/cn/downloads/elasticsearch因为要安装指定版本7.91,选择View past releases根据CPU架构和系统,选择对应软件。

2024-08-03 07:56:19 524

原创 Mysql在linux安装报错

当你尝试启动 mysqld.service 并收到 “Failed to start mysqld.service: Unit not found.” 错误时,这通常意味着 systemd 系统中没有名为 mysqld.service 的服务单元文件。这可能是因为MySQL没有正确安装,或者服务单元文件的名称与你尝试启动的名称不匹配。以下是一些步骤,你可以按照这些步骤来解决问题:检查MySQL是否已安装:使用 yum 或 dnf 检查MySQL是否已经安装:bash。

2024-07-20 16:07:21 517

原创 大数据实践

镜像目录:https://mirrors.bfsu.edu.cn/apache/kafka/3.5.2/安装流式队列Kafka。

2024-07-20 15:29:35 322

原创 Spark 和 Kafka 处理 API 请求与返回数据DEMO

以下是一个更详细的使用 Spark 和 Kafka 处理 API 请求与返回数据,并保障其正常性的示例代码。请注意,您需要根据实际的 API 接口和数据要求来进一步完善数据校验、错误处理和响应处理的逻辑。替换为实际的 API 端点,并根据 API 的要求设置正确的请求方法和数据格式。

2024-07-15 19:16:39 545

原创 基于LLaMA-Factory的微调记录

由于不需要考虑多轮对话,所以history可以不要,这里采用了两种数据集的组织方式,一种是只有instruction和output,把问题作为instruction,另外一种是把问题作为input,把回答问题这一要求作为instruction。微调时一般需要准备三个数据集:一个是自我认知数据集(让大模型知道自己是谁),一个是特定任务数据集(微调时需要完成的目标任务),一个是通用任务数据集(保持大模型的通用能力,防止变傻)。测试的大模型可以使用这些,注意要下载最新版,老版的模型结构不太匹配。

2024-07-09 17:01:24 634

原创 JAVA反射代码

java在运行过程中,构建类,并获取方法集和属性集,构建实例并调用方法。

2024-06-14 10:43:59 197

原创 四个Python常用OCR库的用法详解

在这个例子中,我们首先使用PIL库打开图像文件,然后使用python-tesseract库的image_to_string方法将图像中的文字识别为文本。最后,我们逐行打印识别结果。在这个示例中,首先使用PIL库打开图像文件,然后使用python-tesseract库的image_to_string方法将图像中的文字识别为文本,最后打印识别结果。在这个示例中,首先使用PIL库打开图像文件,然后使用pytesseract库的image_to_string方法将图像中的文字识别为文本,最后打印识别结果。

2024-05-12 23:51:06 5196

原创 Apache Seata(incubating)

Apache Seata(incubating) 是一款开源的分布式事务解决方案,致力于在微服务架构下提供高性能和简单易用的分布式事务服务。

2024-05-10 11:45:34 122

原创 JAVA面向接口编程课堂练习(马戏团)

【代码】JAVA面向接口编程课堂练习(马戏团)

2024-04-26 11:33:12 431 2

原创 Ocr识别

https://blog.csdn.net/qq_47571357/article/details/132017514

2024-04-20 23:02:53 397

原创 面向对象练习坦克大兵游戏

游戏玩家(名称,生命值,等级),坦克,大兵类,玩家之间可以相互攻击,大兵拥有武器,用枪弹和反坦克炮弹,造成攻击不同,坦克攻击值固定,请设计玩家互相攻击的过程,实现坦克A大兵,大兵打坦克,大兵用枪打坦克,大兵用反坦克导弹打坦克。

2024-04-20 11:56:22 363

原创 C++面向对象编程学生类案例

C++面向对象编程,学生类案例。

2024-04-15 00:16:23 192

原创 C/C++信奥基础

int a[5] ,下标从0,第一个空间访问a[0]最后一个元素是a[4]在C语言中,数组是一个存储相同类型元素的固定大小的顺序集合。数组是一个相同类型的连续变量集合。定义数字的类型,长度。

2024-04-14 11:43:36 205

原创 如何才能快速高效的阅读技术文档与书籍

什么样的阅读方法才能快速吸取技术文档中的所有知识以及精髓呢?如何避免低效的看文档呢?看到后面的内容,就忘了前面的内容应该怎么办?并且最重要的就是看完文档之后能够快速的应用到项目当中去呢?这些都是我们看文档的时候需要去考虑的问题!

2024-04-06 08:40:30 548

原创 Conda 常用命令及Pycharm项目应用

conda常用命令,希望可以帮助大家更好的管理自己的conda环境。

2024-03-31 13:42:52 713

原创 国内大模型

https://xihe.mindspore.cn/

2024-03-28 11:36:56 140

原创 检测出照片中人脸图片给出python的代码DEMO

上传一个照片,检测出照片中人脸图片,并切割头像成小照片,给出python的代码DEMO上传照片并进行人脸检测与切割需要使用图像处理库,其中一个流行的选择是OpenCV。以下是使用Python和OpenCV库来实现所需功能的一个基本示例。首先,确保你安装了必要的库。请确保你有图片文件和Haar级联文件的正确路径。此外,请确保你的输出目录存在,否则可能会失败。这个代码演示的功能是非常基础的,但它能够检测到图片中的人脸,并且将每个检测到的人脸以单独的文件保存。在实际应用中可能还需要进行更多的错误处理和优化。

2024-03-27 10:24:03 298

ASP单步调试工具,ASP调试工具,内置IIS环境,直接运行

ASP单步调试工具,ASP调试工具,内置IIS环境,直接运行,winxp32位操作系统。

2012-03-11

联想手机,联想A730,T卡备份,XML文件转换,成TXT文本文件

转换工具 手机数据 手机转换工具 XML交换 XML 数据备份技术 联系人不再丢失 恢复电话薄数据方法 格式转换 电话薄管理 手机电话薄备份软件 手机电话薄备份 如何导出手机电话薄 联想a730T卡备份 金立手机 简述 刚换了个新手机,联想A730功能方面基本上还满意,可是过端午节,我想把手机里的联系人导出来,群发一些祝福信息(一来可以备份,二来可以用电脑操作),可不能看到联系人的姓名,格式是<N>=E6=A5=9A=E6=80=9D=E4=BD=B3</N>,对此还特意咨询的联想的售后工程师,但他们提供的回答是没办法,要自己行解决。 为此而设计,此工具功能为:XML数据格式的手机电话本,转换为TXT文本文件,适应机型限于xml数 据备份标标准的手机,联想A730已经通过测试,愿这个简单的工具,能带给你一些方便。 软件功能 1、电话本导出 2、电话本联系人格式转换

2012-03-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除