自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Ven%的博客

简单点说不可以?

  • 博客(69)
  • 收藏
  • 关注

原创 idea中的bean自动注入提示错误解决

IDEA 2018版:可做如下配置IDEA 2017版:并没有这些选项,则直接修改代码:@Autowired(required = false)即可

2021-01-28 16:08:53 2351 1

原创 选中当前行快捷键

在SQL工具上频繁会使用到选择当前行,然后再运行,所以非常需要用到 选中当前行快捷键.当前行行首:Home当前行行尾:End选中当前行:先 按Home(将光标定位到行首,然后按Shift+End(行尾) {从行首连选到行尾}...

2021-01-11 13:24:46 3735 3

原创 IDEA怎么使用鼠标同时编辑多行(超级使用!!!)

领悟到同时编辑多处的诀窍,会让你的编程速度翻上十倍不止,赶超同行!!!(实用篇)接下来给大家介绍两个超级实用的技巧:1.按住Alt 然后按住鼠标左键拖动光标,就可以同时输入了(太爽了吧!!!)![在这里插入图片描述](https://img-blog.csdnimg.cn/20201207100355603.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4

2020-12-07 10:28:01 10988 4

原创 感受Python之禅及其意

在命令符提示窗口中输入 import this 就会显示 Tim Peters 的 The Zen of Python(Python之禅) 我们从中可以感受到Python它散发出的迷人魅力.

2020-11-29 20:25:01 509 3

原创 深度学习速通系列:强大的中文自然语言处理工具之Pyltp的使用

Pyltp 是哈工大语言技术平台(LTP)的 Python 接口,它提供了多种自然语言处理功能。

2024-09-26 16:56:57 320

原创 Python脚本连接并插入数据到mysql中

下面是一个示例脚本,它连接到MySQL数据库,创建一个新表(如果不存在),然后插入一些数据。的表,如果不存在则创建这个表。然后,脚本会向这个表中插入一行数据。最后,它会关闭数据库连接。确保你已经正确设置了数据库的连接参数(如主机、用户名、密码和数据库名)。请确保在运行脚本之前,你的MySQL服务器正在运行,并且你已经正确配置了数据库的访问权限。这个脚本首先尝试连接到MySQL数据库,如果连接成功,它会检查是否存在一个名为。连接MySQL数据库并插入数据是Python中常见的任务,通常可以通过。

2024-09-26 11:23:09 314

原创 深度学习速通系列:如何使用文本标注工具进行命名实体识别?

具体到每个工具的操作可能会有所不同,但大体流程是类似的。例如,Doccano是一个流行的开源文本标注工具,它支持文本分类、序列标注和序列到序列的标注功能,可以通过Docker进行安装和使用。Label Studio也是一个强大的标注工具,支持多种数据类型的标注,并提供实时协作和导出功能。YEDDA则是一款基于Python的文本标注工具,特别适合中文文本标注,支持快捷键标注和多用户协作。在实际操作中,可以参考各个工具的官方文档或社区提供的教程进行详细学习。

2024-09-23 09:03:21 318

原创 深度学习速通系列: FastAPI 快速入门

FastAPI 是一个现代、快速(高性能)的 Web 框架,用于构建 API,使用 Python 编写。它基于标准 Python 类型提示,并且自动提供了交互式 API 文档。

2024-09-23 09:02:18 356

原创 深度学习速通系列:在命名实体识别中有哪些标注方法?

除了上述方法,还有一些其他的NER方法,如基于词典的方法、基于规则的方法、基于机器学习的方法(如隐马尔可夫模型HMM、条件随机场CRF等),以及基于深度学习的方法(如RNN-CRF、CNN-CRF、BiLSTM-CRF等)。:这是最基本的序列标注方法,使用三个标签:B(Begin)表示实体的开始,I(Inside)表示实体内部的词,O(Outside)表示非实体部分。命名实体识别(NER)是自然语言处理(NLP)中的一项关键任务,它涉及到从文本中识别出具有特定意义的实体,如人名、地名、机构名等。

2024-09-22 22:57:09 361

原创 深度学习速通系列:什么是文本数据标注

标注过程中可能需要使用多种工具和方法,完成后还需进行质量检查和验收,最终将数据转换为适合模型使用的格式并进行交付。整个过程需要细致的态度和严谨的流程,以确保数据的质量和模型的性能。文本数据标注是机器学习和人工智能领域中的一个重要环节,它涉及将文本中的信息进行分类、识别和标记,以便机器学习模型能够更好地理解和处理这些数据。标注后的数据通常用于训练机器学习模型,如自然语言处理(NLP)模型,以提高模型在文本分类、情感分析、问答系统等任务上的性能。

2024-09-22 18:18:31 560

原创 深度学习速通系列:在进行大模型微调时,如何确定最佳的学习率和批次大小?

这是因为较大的批次大小提供了更稳定但可能较不精确的梯度估计,而较大的学习率可以帮助模型在优化过程中迈出更大的步伐。较大的数据集可能允许使用较大的批次大小,而较小的数据集可能需要较小的批次大小以确保模型能够从每个批次中学习到有效的信息。最终,确定最佳学习率和批次大小通常需要结合具体任务、数据集和模型的特点,并通过实验来不断调整和优化。:在训练过程中,可能需要使用学习率调度策略,如学习率衰减或warmup策略,以动态调整学习率,从而在训练的不同阶段优化性能。:模型的大小和复杂性也会影响批次大小的选择。

2024-09-20 00:00:40 488

原创 深度学习速通系列:TextCNN介绍

例如,使用PyTorch实现TextCNN进行中文文本分类的案例中,首先需要对中文文本进行分词和词向量转换,然后构建TextCNN模型,包括卷积层、池化层和分类层。它将卷积神经网络(CNN)应用于文本数据,通过使用不同大小的卷积核来提取文本中的局部特征,类似于捕捉不同长度的n-gram信息,从而有效地捕捉局部相关性。在实际案例中,可以通过配置文件设置训练参数,如批量大小、学习率、优化器类型等,然后使用训练脚本开始训练过程。TextCNN适用于各种文本分类任务,如情感分析、主题分类、垃圾邮件检测等。

2024-09-18 22:18:15 655

原创 深度学习速通系列:中文文本处理步骤

在实际应用中,可以根据具体任务的需求选择合适的文本处理和模型构建方法。此外,模型的性能也受到预处理步骤的影响,因此文本预处理也是非常重要的一环。:由于中文文本不像英文那样有明显的单词分隔符,因此需要通过分词工具(如jieba)将句子切分成单个词语。:为了提高模型的泛化能力,可以通过同义词替换、随机插入、随机删除等方法对文本进行增强。:使用测试集对模型的性能进行评估,常用的评估指标包括准确率、召回率和F1分数。:清理文本中的停用词(如“的”、“了”等)和特殊字符,以减少对模型的干扰。

2024-09-18 08:35:29 674

原创 深度学习速通系列:除了One-Hot编码,还有哪些其他处理分类数据的方法?

选择哪种编码方法取决于数据的特点、模型的类型以及特定的业务问题。在实际应用中,可能需要尝试多种方法,并通过模型性能来评估它们的有效性。

2024-09-14 09:12:41 669

原创 深度学习速通系列:one-hot编码

One-Hot编码是机器学习中处理分类特征的重要技术,它通过将分类变量转换为二进制向量,使得机器学习算法能够有效地处理这些变量。然而,使用时需要权衡其对特征维度、稀疏性、信息表示和模型选择的影响。在实际应用中,应根据数据的特点和模型的需求选择合适的编码策略。

2024-09-14 09:05:03 572

原创 深度学习速通系列:依存分析

依存分析(Dependency Parsing)是自然语言处理(NLP)中的一项任务,目的是确定句子中单词之间的依存关系,并将这些关系表示为一个有向图,通常称为依存树。在依存树中,每个节点代表一个单词,而有向边表示单词之间的语法关系,如主谓关系、动宾关系等。依存分析与短语结构分析(Phrase Structure Parsing)不同,它不关注短语的组合,而是直接关注单词之间的直接关系。依存分析的结果有助于理解句子的结构和意义,是许多NLP任务(如信息抽取、问答系统、语义角色标注等)的基础。

2024-09-13 23:59:17 575

原创 深度学习速通系列:命名实体识别

为了解决这些问题,研究者们提出了多种方法,包括基于词典的方法、利用字符级信息的方法,以及结合上下文信息的方法。在技术实现上,可以使用现有的NLP库和工具,如spaCy、Stanford NLP、NLTK等,这些工具提供了预训练的模型和简单的API,使得NER任务的实现变得更加容易。此外,还有一些开源项目和研究工作,如美团搜索中NER技术的探索与实践,提出了“实体词典匹配+模型预测”的框架,以及华为提出的中文NER领域最新SOTA方法RICON,这些研究为NER技术的发展提供了新的方向和实践案例。

2024-09-13 23:53:00 406

原创 深度学习速通系列:动态规划算法

动态规划(Dynamic Programming,简称DP)是一种在数学、管理科学、计算机科学和经济学中使用的,通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。

2024-09-12 22:31:10 957

原创 mysql实用系列:日期格式化

如果你有一个非日期时间类型的字段,但你知道它包含的是日期或时间信息,你可能需要先将其转换为 DATETIME 类型,然后再使用 DATE_FORMAT() 函数。如果你尝试对一个非日期时间类型的字段使用 DATE_FORMAT(),比如 INT 或 VARCHAR,MySQL 会返回一个错误,因为它无法将这些类型的数据解释为日期或时间。这里,STR_TO_DATE() 函数将字符串转换为 DATETIME 类型,然后 DATE_FORMAT() 函数将其格式化为所需的格式。函数的一些基本用法。

2024-09-12 17:24:37 770

原创 深度学习速通系列:混淆矩阵是什么

混淆矩阵(Confusion Matrix)是一种评估分类模型性能的工具,尤其在监督学习中用于分析分类结果。它通过一个矩阵的形式,将模型的预测结果与实际标签进行比较,从而可以清晰地看到模型在各个类别上的表现。

2024-09-11 08:45:54 790

原创 深度学习速通系列:F1和F2分数

在深度学习和其他机器学习任务中,F1分数和F2分数是评估分类模型性能的指标,特别是在二分类问题中。它们都是基于精确率(Precision)和召回率(Recall)的,但权重不同。

2024-09-11 08:38:02 1062

原创 mysql实用系列:mysql如何拼接字符串?

请根据你的具体需求选择合适的方法来拼接字符串。在MySQL中,拼接字符串可以使用。

2024-09-10 22:19:20 285

原创 深度学习速通系列:LoRA微调是什么

LoRA微调(Low-Rank Adaptation)是一种用于大型预训练语言模型(LLM)的高效微调技术。它的核心思想是在不改变预训练模型权重的前提下,通过在模型的Transformer层中引入可训练的低秩矩阵来实现模型的微调。这种方法可以显著减少训练参数的数量,从而降低对计算资源的需求。

2024-09-10 08:36:09 594

原创 深度学习速通系列:在模型训练过程中,如何确定模型的复杂度是否过高?

通过上述方法,你可以评估模型的复杂度是否过高,并据此调整模型结构或训练策略,以避免过拟合并提高模型的泛化能力。

2024-09-09 09:10:49 434

原创 深度学习速通系列:什么是sigmoid函数的饱和区

在这种情况下,函数的输出对输入的进一步增加反应迟钝,因为输出已经非常接近其最大值,很难再有显著的变化。同样,函数的输出对输入的进一步减小反应迟钝,因为输出已经非常接近其最小值。:在深度神经网络中,如果激活函数的梯度非常小,那么在反向传播过程中,权重的更新将会非常微小,这会显著减慢学习过程。:在饱和区,神经元的输出变化很小,这可能导致网络中的某些神经元在训练过程中变得不活跃,即它们对输入的变化不再敏感。Sigmoid 函数的饱和区指的是函数输出接近其最大值或最小值的区域,即输出接近 1 或 0 的区域。

2024-09-09 08:38:38 318

原创 【机器学习算法】LR算法

LR通常指的是逻辑回归(Logistic Regression),这是一种广泛使用的统计模型,属于机器学习中的监督学习算法。逻辑回归主要用于二分类问题,也可以通过一些技巧扩展到多分类问题。逻辑回归模型的核心思想是使用逻辑函数(Logistic Function)来预测一个事件发生的概率。逻辑函数是一个S形的曲线,可以将任意值映射到(0, 1)区间内,这使得它非常适合用来表示概率。

2024-09-08 12:03:05 629

原创 深度学习速通系列:深度学习算法讲解

深度学习算法是一系列基于人工神经网络的算法,它们通过模拟人脑处理信息的方式来学习和解决复杂问题。这些算法在图像识别、语音识别、自然语言处理、游戏等领域取得了显著的成就。

2024-09-08 12:01:17 620

原创 深度学习速通系列:如何生成句向量?

生成句向量时,通常需要考虑句子的语义信息和上下文信息。预训练模型如BERT和其变体因其强大的上下文捕捉能力而广泛用于生成高质量的句向量。在实际应用中,可能需要根据具体任务和资源限制选择合适的方法。生成句向量(Sentence Embedding)是自然语言处理(NLP)中的一项重要技术,它将文本句子转换为固定长度的数值向量,这些向量能够捕捉句子的语义信息。

2024-09-07 11:01:21 454

原创 深度学习速通系列:如何计算文本相似度

选择哪种方法取决于具体的应用场景、可用资源(如计算资源和数据集)以及所需的精度。在实际应用中,可能需要结合多种方法来获得最佳结果。计算文本相似度是自然语言处理(NLP)中的一个常见任务,用于衡量两个文本片段在语义上的相似性或相关性。

2024-09-07 10:54:29 547

原创 Window查看端口占用并杀死进程(实用篇,推荐收藏)

其中使用find后面跟的数字需要带双引号,同理第二个命令也一样。上述命令第一个也可以使用这个。根据pid找对应的进程。

2024-09-06 07:57:12 218

原创 linux启动python文件并打印到log文件中

在Linux系统中,你可以通过多种方式启动Python脚本并将输出重定向到日志文件。你可以在命令行中使用Python命令来运行脚本,并将标准输出和标准错误重定向到一个日志文件中。如果你希望在后台运行Python脚本,并且即使关闭终端也会继续运行,可以使用。选择适合你需求的方法来运行你的Python脚本并记录日志。如果你需要一个更复杂的会话管理,可以使用。服务单元文件来管理你的Python脚本。对于需要持续运行的脚本,你可以创建一个。是重定向标准输出到文件的操作符,将命令放到后台执行。命令会忽略挂起信号,

2024-09-06 07:56:41 462

原创 理解Softmax函数的原理和实现

Softmax函数是机器学习和深度学习中非常基础且重要的一个概念,特别是在处理分类问题时。它的作用是将一个向量中的元素值转换成概率分布,使得每个元素的值都在0到1之间,并且所有元素值的总和为1。

2024-09-05 08:00:04 861

原创 深度学习速通系列:归一化和批量归一化

在深度学习中,归一化和批量归一化是两种常用的技术,它们有助于提高模型的训练效率和性能。

2024-09-05 07:59:39 917

原创 mysql实用系列:字段类型转换该怎么去转

这些函数可以根据需要进行组合和嵌套,以实现更复杂的类型转换。例如,你可以先将一个字段转换为字符串,然后再转换为日期类型。在MySQL中,可以使用内置的函数来转换字段类型。

2024-09-04 13:25:57 420

原创 理解Sigmoid激活函数原理和实现

σx11e−xσ(x)=σx1e−x1​其中 ( e ) 是自然对数的底数,约等于 2.71828。

2024-09-04 13:23:54 993

原创 深度学习速通系列:鲁棒性和稳定性

鲁棒性指的是模型对于输入数据的扰动、噪声、异常值或对抗性攻击的抵抗能力。一个鲁棒的模型能够在面对这些不利因素时保持其性能。

2024-09-03 11:17:02 732

原创 深度学习速通系列:推荐五个提高机器学习模型鲁棒性和稳定性的开源工具或框架

Foolbox可以帮助研究人员和工程师进行深度神经网络的安全性评估,并在构建新的防御机制时验证新方案的有效性。Robusta的核心技术包括批量归一化适应和自学习,这些技术在理论上有坚实的支持,并在实际应用中展现出显著的效果。:虽然不是一个工具或框架,但这篇文章提供了一些通用的方法来增强机器学习模型的稳健性,例如加入噪声数据、使用统计特征、对幅度过大的变量进行分箱处理以及降低基于树模型的过拟合问题。这些工具和框架可以帮助你在机器学习项目中提高模型的鲁棒性和稳定性,从而构建更加可靠和有效的智能系统。

2024-09-03 11:10:48 773

原创 Springboot实用系列:useGeneratedKeys用法

是 MyBatis 框架中的一个参数,用于指定是否允许 JDBC 支持自动生成主键。这个参数可以在三个不同的位置设置:全局配置文件、XML 映射器和接口映射器。后,插入操作没有返回预期的主键值,可能是因为数据库驱动不支持自动生成主键,或者配置有误。指定了数据库中的列名,这样在插入操作后,MyBatis 会将生成的主键值回填到对应的 Java 对象属性中。这样设置后,所有接口映射器中的插入操作都会尝试获取自动生成的主键,但对 XML 映射器不起作用。参数,那么这个设置会覆盖全局配置文件中相同的设置。

2024-09-02 12:10:27 432

原创 springboot实用系列:@value的使用

Value注解在 Spring 框架中用于将外部配置注入到 Spring 管理的 Bean 的字段中。这使得你可以将配置信息(如数据库连接字符串、API 密钥等)与代码分离,从而提高代码的可维护性和灵活性。以下是@Value。

2024-09-02 11:59:19 425

原创 深度学习速通系列:贝叶思和SVM

贝叶斯方法和SVM都是强大的机器学习算法,它们在不同的应用场景中有着各自的优势。贝叶斯方法在处理不确定性和概率推断方面表现出色,而SVM在处理高维数据和非线性问题方面具有优势。在实际应用中,选择哪种算法取决于具体问题的需求、数据的特性以及预期的性能。有时候,结合使用多种算法(如集成学习)可能会获得更好的效果。

2024-09-01 23:36:37 1072

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除