自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 资源 (1)
  • 收藏
  • 关注

原创 万字攻略全面了解selenium_selenium教程

一起学习下python爬虫4小分队(scrapy、beautifulsoup、selenium以及pyppeteer)之一的Selenium库,主要用于模拟浏览器运行,是一个用于web应用测试的工具。Selenium直接运行在浏览器中,看起来就像人在操作一样(也可无窗口模式运行)。支持的浏览器包括IE、Firefox、Safari、Chrome、Opera和Edge等。............

2022-07-22 15:15:00 25049 8

原创 深度解析 Goose3:Python 网页内容提取的终极利器 | Python第三方库 goose3

Goose3 是一个基于 Java 版本 Goose 开发的 Python 库,旨在为 Python 开发者提供强大的网页内容提取功能。内容提取:自动识别并提取网页中的主要内容。多媒体支持:能够提取与文章相关的图片、视频等多媒体元素。多语言支持:支持多种语言的文章提取,适应国际化的应用需求。自定义配置:允许用户通过配置文件或代码来调整提取行为。强大的解析能力:使用先进的 HTML 解析技术,可以处理复杂的网页结构。对于一些特殊结构的网页,Goose3的默认解析规则可能无法满足需求。

2024-11-19 17:14:45 724

原创 Python第三方库 | newspaper教程 | newspaper3k实战教程 | 使用Python newspaper库进行新闻文章抓取和处理,一文通!

newspaper是一个用Python编写的流行开源库,用于从网站上抓取新闻文章。它提供了一种简单而有效的方法来提取新闻内容、图片、作者信息等,并且支持多语言。

2024-11-19 15:49:39 740

原创 AI编辑器CURSOR_CURSOR安装教程_使用AI进行编码的最佳方式。

作为一个在代码海洋里遨游多年的老程序员,我得说,遇到CURSOR这位AI编辑器,就像是编程路上偶遇了一位智慧而又贴心的老友。想象一下,夜深人静,你正埋头于那些错综复杂的逻辑和无尽的bug之中,眼神开始迷离,手指在键盘上机械地跳跃,仿佛是在与无尽的代码深渊进行着一场无声的对话。就在这时,CURSOR悄无声息地走到你的身旁,它那双闪烁着智慧光芒的眼睛,仿佛能洞察你心中所想,手中还拿着一本无形的“编程秘籍”。“嘿,老朋友,又在为这段代码发愁吗?”CURSOR用它那温和而富有磁性的声音问道。

2024-09-24 11:19:54 1041

原创 Python PIP成功安装scrapy后报错 | 无法在cmd中使用scrapy命令的问题

如果是上面这种情况,其实就很好解决了,只要把提示的地址加入到系统的环境变量中即可。④在系统变量中找到“Path”,双击打开,然后点击“新建”,把上面的地址加进去保存即可。①打开windows的环境变量,鼠标右键“我的电脑”,点击属性。这时就能看到成功的输出了,看到scrapy的版本号。提示这不是可执行的命令。②点击“高级系统设置”到此问题就能解决了。

2024-06-04 11:32:54 537

原创 Python构建高效Web应用:Flask、Django和FastAPI的全面对比

在当今这个数字化飞速发展的时代,Web开发无疑是推动技术革新的重要力量之一。随着技术的不断进步,开发者们需要更加高效、灵活的工具来构建功能丰富、性能卓越的Web应用。Python,作为一门历史悠久且功能强大的编程语言,凭借其简洁的语法、丰富的库支持和广泛的应用场景,成为了Web开发领域的佼佼者。而在Python的Web开发世界中,Flask、Django和FastAPI这三个框架更是凭借其独特的优势和广泛的应用,成为了开发者们争相追捧的对象。首先,Flask以其轻量级和灵活性闻名于世。

2024-05-22 11:53:46 1742 2

原创 人工智能LLM | 基础配置 | 通过环境变量配置API-KEY 一文通教程

在实战开发大语言模型的过程中,经常会遇到各种API-KEY的配置问题,例如GPT OpenAI KEY的配置,而且目前大部分都要求将其配置在环境变量中,下面将会讲解如何在Linux、macOS、Windows中配置,本文一文通教程。您可以使用配置环境变量的方法,避免在调用各种SDK时显式地配置API-KEY,从而降低泄漏风险。环境变量是操作系统中用于存储有关系统环境的信息的变量。您可以通过环境变量来配置API-KEY,这样即使您的代码库被公开,API-KEY也不会泄漏。

2024-05-20 15:02:41 2358

原创 LangChain教程 | Retrival之Retrievers详解 | 检索器教程

检索器是给定非结构化查询返回文档的接口。它比矢量存储器更通用。检索者不需要能够存储文档,只需要能够返回(或检索)它们。向量存储可以用作检索器的主干,但也有其他类型的检索器。检索器接受字符串查询作为输入,并返回Documents 作为输出。

2024-05-17 16:30:25 3615 2

原创 Prompt提示词教程 | 提示工程指南 | 提示词示例 入门篇

在本节中,我们会提供更多示例,介绍如何使用提示词来完成不同的任务,并介绍其中涉及的重要概念。通常,学习概念的最佳方法是通过示例进行学习。下面,我们将通过示例介绍说明如何使用精细的提示词来执行不同类型的任务。

2024-05-07 23:05:41 1700

原创 Prompt提示词教程 | 提示工程指南 | 提示工程简介

提示工程是一个较新的学科,应用于开发和优化提示词(Prompt),帮助用户有效地将语言模型用于各种应用场景和研究领域。掌握了提示工程相关技能将有助于用户更好地了解大型语言模型的能力和局限性。研究人员可利用提示工程来提高大语言模型处理复杂任务场景的能力,如问答和算术推理能力。开发人员可通过提示工程设计和研发出强大的技术,实现和大语言模型或其他生态工具的高效接轨。本指南介绍了提示词相关的基础知识,帮助用户了解如何通过提示词和大语言模型进行交互并提供指导建议。

2024-05-07 15:50:19 1365

原创 Python 第三方库 | pdfplumber

pdfplumber 是一个用于处理 PDF 文件的 Python 第三方库,它提供了一种方便的方式来提取 PDF 文件中的文本、表格和其他信息。

2024-05-06 16:10:44 619 1

原创 LangChain教程 | 实践过程报错集 | 持续更新

这是本人最近在做langchain教程过程中的遇到的报错,不分先后顺序。这个报错很常见,咱们要看原始报错的位置是哪里,下面是我的截图:找到源头之后,就在源头的位置打个断点:然后启用debug模式shift+F9,如果不懂断点模式,自行学习下先。这里就能看到提示代理错误。再回到上面源码的位置,这是由于咱们在使用LLMs工具时,没有正常访问到大语言模型平台,以下这几个LLM都有可能报错:请注意检查自己的openai-key代理商都支持那些models。

2024-04-09 10:51:16 1518

原创 Langchain教程 | langchain+OpenAI+PostgreSQL(PGVector) 实现全链路教程,简单易懂入门

在阅读本文前,建议要有一定的langchain基础,以及langchain中document loader和text spliter有相关的认知,不然会比较难理解文本内容。是一个开源向量相似性搜索Postgres它支持:- 精确和近似最近邻搜索- L2距离,内积和余弦距离。

2024-04-01 11:38:02 2639

原创 LangChain教程 | langchain 文本拆分器 | Text Splitters全集

一旦加载了文档,您通常会想要转换它们以更好地适应您的应用程序。最简单的例子是,您可能希望将一个长文档分割成更小的块,以便适合模型的上下文窗口。LangChain有许多内置的文档转换器,可以轻松地拆分、组合、过滤和操作文档。当你想处理很长的文本时,有必要将文本分割成块。虽然这听起来很简单,但这里有很多潜在的复杂性。理想情况下,您希望将语义相关的文本片段放在一起。“语义相关”的含义可能取决于文本的类型。示例展示了几个方法来做到这一点。将文本分成语义上有意义的小块(通常是句子)。

2024-03-28 14:32:48 10734

原创 LangChain教程 | langchain 文件加载器使用教程 | Document Loaders全集

使用文档加载器将数据从源加载为Document是一段文本和相关的元数据。例如,有一些文档加载器用于加载简单的.txt文件,用于加载任何网页的文本内容,甚至用于加载YouTube视频的副本。文档加载器提供了一种“加载”方法,用于从配置的源中将数据作为文档加载。它们还可选地实现“延迟加载”,用于将数据延迟加载到内存中。

2024-03-22 15:11:42 8529 11

原创 LangChain教程 | LCEL原理详解教程 一 | LangChain Expression Language (LCEL)

LangChain表达式语言(LCEL)是一种声明式方法,可以轻松地将组合在一起。LCEL从第一天起就被设计成,从最简单的到最复杂的链(我们已经看到人们在生产中成功运行了具有数百个步骤的LCEL链)。当您使用LCEL构建链时,您可以获得最佳的首次令牌时间(直到第一批输出出来所经过的时间)。对于某些链来说,这意味着我们将令牌直接从LLM流式传输到流式输出解析器,然后可以与LLM提供者输出原始令牌相同的速率获得解析的增量输出块。

2024-03-21 12:05:10 2817

原创 Python 第三方库 | python-dotenv

在一些项目中,处于安全性的要求,一般不将密码,key等放入到配置文件中。然而这些代码又是上传在 git等平台上。为了方便管理。一般采用系统变量的方式来实现。从而实现配置和代码分开。

2024-03-18 14:30:01 741

原创 EMO在哪体验?阿里对口型视频生成工具EMO下载地址?阿里巴巴新模型EMO的技术原理

随着技术的不断进步和应用场景的不断拓展,EMO有望在以下几个方面取得进一步突破:首先,随着硬件设备的不断升级和算法的不断优化,EMO的性能将得到进一步提升,生成的视频将更加细腻逼真。最后,未来的发展趋势是将音频、视频和文本等多模态数据进行融合,以进一步提升生成视频的质量和多样性。随着技术的不断进步,EMO有望实现更加智能化的交互,用户可以通过更自然的方式与系统进行交流和互动。通过这种方式,系统能够根据输入的音频内容,结合已有的面部特征,生成具有丰富表情和多变头部姿势的视频。

2024-03-01 09:11:57 2648

原创 码农保命秘诀之全身检查_专属全身体检项目大全

废话不多说,狗命要紧!下面直接上干货,健康活着才有输出。特别是28-35之间的不注重身体,往往打败你的不是敌人,而是你自己,还怎么冲刺35大关!

2023-06-27 13:49:15 975 3

原创 Python 爬虫 中文乱码一文通

还在找python中文乱码的解决方法?来跟我学习,一文直接PASS。

2022-07-27 01:14:05 4078 6

原创 Selenium控制已打开的chrome、IE浏览器

一文教你控制已打开的chrome、ie浏览器,无需重复打开浏览器,影响效率。

2022-07-26 10:50:20 9823 5

原创 Python同目录.py调用_不同目录调用_from_import

最近在学习python,顺便把一些基础记录下来,方便日后做查询字典用。在python中导入模块是我们最常用的功能,基本每个.py文件中都会有import或者是from * import语句。

2022-07-20 11:03:37 5824

原创 一文读懂XPath基本语法_XPath语法详解_XPath教程

XPath使用路径表达式来选取XML文档中的节点或节点集。节点是通过沿着路径(path)或者步(steps)来选取的。

2022-07-15 16:07:21 7475 1

原创 JWT实现接口双重认证,提供安全又不复杂的接口安全能力

一文通俗易懂并且全面讲解JWT生成、优点、以及jwt实际应用场景。让初学者或者进阶者有个全面的参考代码以及示例,帮助各位码友快速上手jwt的应用。

2022-03-23 11:27:05 6625

原创 windows redis 假死处理

问题:公司服务器主要使用windows,最近频繁遇到redis每隔一两天就会访问失败,经过初步排查应用层使用正常,所以记录下redis假死的处理过程尝试解决:1、把服务里面的redis配置优化:我的电脑-》属性-》服务-》redis服务右键-》属性-》服务将“第一次失败”、“第二次失败”、“后续失败”全部改成“重新启动服务”。2、修改redis.conf,然后重启redismaxmemory 3Gmaxmemory-policy allkeys-lru maxmemor.

2020-12-21 16:07:19 1082 1

转载 奇虎360PHP工程师2019年面试题和答案解析【转】

本文内容来源于网络,尊重他人劳动,如有侵权可联系作者删除。本文并非直接复制粘贴,对错漏内容进行了补全,方便读者更加清晰阅读。 如还有遗漏问题,欢迎在评论区留言。一、单选题(共29题,每题5分)1.以下代码 a.php 输出的结果是?a.php 的代码如下:<?phpfunction foo(){ echo "foo in a";}include b.php;foo(...

2020-02-19 00:42:20 1209

原创 PHP文件上传漏洞原理以及如何防御详解

PHP文件上传漏洞一、漏洞描述在本人开发过程中文件上传的功能是很常见的,比如一个游戏平台:①用户可以上传自己的头像图片,②用户论坛发表文章时又需要上传图片来丰富自己的文章,③更有甚者游戏开发用户需要上传APK文件等。文件上传功能是十分重要的,所以针对这个功能的漏洞就由下面来讨论研究,经过实战例子和跟大家探讨如何防护。​为了方便统一讨论,目前我们就以上传图片功能来做讲...

2020-02-19 00:15:24 1298

原创 php中exit()、die()、return()的区别详解

最近在收集有关PHP的面试题,其中有一道题是有关于exit()、die()函数的:关于exit( )与die( )的说法正确的是:A、当exit( )函数执行会停止执行下面的脚本,而die()无法做到B、当die()函数执行会停止执行下面的脚本,而exit( )无法做到C、使用die()函数的地方也可以使用exit()函数替换D、die()函数和exit()函数没有区别,做退出程序,都...

2020-02-17 00:05:42 1286

原创 php中$a++,$a--和++$a,--$a的区别详解

最近在收集PHP面试题的时候,遇到下面这道题:若x,y为整型数据,以下语句执行的$y结果为:$a = 1;++$a;$y = $a++;A:1B:2C:3D:4(答案在文末)这道题主要考查的是php中$a++和++¥a的运行机制先看一个例子:$a = 1;$i = ++$a;echo $i; // 运行结果为2echo $a; // 运行结果为2首先a的值+1...

2020-02-16 22:52:30 2606 2

原创 php单引号和双引号的区别详解

最近在收集有关于PHP的面试题,其中有一道题是:php中单引号和双引号包含字符串的区别正确的是:A:单引号速度快,双引号速度慢B:双引号速度快,单引号速度慢C:单引号里面可以解析转义字符D:双引号里面可以解析变量(答案在文末)在日常开发中,一些新手码农很容易就会忽视单引号和双引号之间的区别,以为一样的。其实是不同的首先第一点:双引号解释变量,单引号不解释变量;双引号里插入单引号...

2020-02-16 22:09:33 3642

原创 PHP中var关键字用法

今天在整理面试题的时候遇到一道题:PHP定义变量正确的是:A: var a = 5;B: $a = 10;C: int b = 6;D: var $a = 12;从上题中看出我们主要分析的是var的用法,很多朋友说在php中定义变量用不用var都没关系,其实不是的。(正确答案是B)看下下面的例子例子,再来详细说下var关键字的细节:1 var $a=123;2 echo $a...

2020-02-16 11:21:43 2756 2

原创 Composer基础教程 - windows、Linux系统安装Composer

Windows - 安装 方法1 - 使用安装程序(最简单)①设置好系统的环境变量,因此你可以在任何目录下直接使用 composer 命令。设置方法:鼠标右键【我的电脑】》》点击【属性】》》点击【高级系统设置】》》选择【环境变量】,在系统变量里面找到Path选项双击,增加你的php.exe目录路径【如果已经添加了请忽略这一步】需要注意的是你需要开启 openssl 配置,我们打...

2018-11-29 12:21:39 267

原创 Linux crontab命令 定时任务 用法详解以及no crontab for root解决办法

一、Linux系统安装crontab服务  1.确认crontab是否安装  # crontab -l  如果报 “command not found” ,就说明该crontab服务没有安装  如果报 “no crontab for root” ,就说明已经安装crontab服务了,请跳过步骤一,至于出现这个提示的解决办法请往下看。   2.安装crontab服务 ...

2018-07-19 17:14:06 8878

selenium stealth.min.js

可用作python的selenium反屏蔽,selenium的stealth.min.js文件,请合理使用。

2022-07-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除