自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(64)
  • 资源 (1)
  • 收藏
  • 关注

原创 leetcode-31-下一个排列

如果不存在下一个更大的排列,那么这个数组必须重排为字典序最小的排列(即,其元素按升序排列)。例如,arr = [1,2,3] ,以下这些都可以视作 arr 的排列:[1,2,3]、[1,3,2]、[3,1,2]、[2,3,1]。而 arr = [3,2,1] 的下一个排列是 [1,2,3] ,因为 [3,2,1] 不存在一个字典序更大的排列。类似地,arr = [2,3,1] 的下一个排列是 [3,1,2]。例如,arr = [1,2,3] 的下一个排列是 [1,3,2]。

2023-05-15 09:50:20 290 1

原创 代码随想录刷题笔记3

1-解空间树节点组合、分割、排列问题,求叶子节点——路径。子集问题,求所有节点。2-同一层遍历的起点组合、分割、子集,属于无序,for从beginIdx开始。组合问题中,若是2个集合内的组合,不需要beginIdx。排列,属于有序,for从0开始。3-去重类型树枝去重树层去重同一父节点的同一层子节点之间去重方法排序used数组在该层使用哈希集,生命周期只在该层即本次递归中存在,哈希集中只有同层的子节点。(同父节点的同层去重)、4-时空复杂度。

2023-05-05 10:34:48 359

原创 代码随想录刷题笔记2

结合代码随想录和leetcode的刷题笔记

2023-04-22 10:33:25 647

原创 python中bug记录1

python编程中的bug记录,本篇是import相关问题。

2022-10-09 23:25:23 218

原创 leetcode-674-最长连续递增序列

求数组最长连续递增子数组的长度。主要维护了一个动态滑动窗口,且该窗口其变化是非递减。

2022-09-22 22:07:10 666

原创 西瓜书-2习题

ch2模型评估与选择-习题部分,对所学进行融汇,尤其2.3节性能度量部分涉及较多,对于其他一些知识仍存疑。

2022-08-30 16:15:56 839 1

原创 西瓜书-2.4模型评估与选择

学习器需要用某种实验评估方法来测得学习器的某个性能度量结果,并借此进行性能比较,然后用统计假设检验提供的依据,以错误率为性能度量,以此进行性能比较。

2022-08-29 14:50:17 410

原创 西瓜书-2.5偏差与方差

利用“偏差-方差分解”工具解释泛化性能,并拆解出影响期望泛化错误率的因素。

2022-08-29 14:41:08 365

原创 西瓜书-2.3性能度量

学习器的优劣需要依据一定性能度量。

2022-08-24 21:37:58 457

原创 西瓜书-2.2评估方法

为对模型泛化性能增强,对数据集D进行合理划分,并且进行调参。

2022-08-15 21:52:39 402

原创 leetcode-495-提莫攻击

leetcode刷题笔记,数组系列-495。

2022-08-14 10:38:26 198

原创 leetcode-455-分发饼干

leetcode刷题笔记,数组系列-455。

2022-08-09 15:29:30 131

原创 leetcode-448-找到所有数组中消失的数字

leetcode刷题笔记,数组系列-448。

2022-08-09 15:16:44 139

原创 leetcode-414-第三大的数

leetcode刷题笔记,数组系列-414。

2022-08-06 17:59:32 128

原创 leetcode-350-两个数组的交集 II

leetcode刷题笔记,数组系列-350。

2022-08-06 17:26:21 76

原创 leetcode-303-区域和检索 - 数组不可变

leetcode刷题笔记,数组系列-303.

2022-08-02 10:24:48 105

原创 leetcode-205-同构字符串

leetcode刷题

2022-06-07 14:59:24 1091

原创 leetcode-145-二叉树的后序遍历

目录题目描述提示思路解决后序遍历-递归形式后序遍历-非递归形式结果题目描述给你二叉树的根节点 root ,返回它节点值的 后序 遍历。实例1:输入:root = [1,null,2,3]输出:[3,2,1]提示树中节点数目在范围 [0, 100] 内-100 <= Node.val <= 100思路前序遍历的步骤是:访问根节点。根节点入栈。访问左子树。回到根节点。根节点出栈。访问右子树。接下来采用递归形式和非递归形式进行实现。非递归形式比较麻烦。在非递归

2022-05-18 16:19:47 878

原创 leetcode-144-二叉树的前序遍历

目录题目描述提示思路解决前序遍历-递归形式前序遍历-非递归形式结果题目描述给你二叉树的根节点 root ,返回它节点值的 前序 遍历。实例1:输入:root = [1,null,2,3]输出:[1,2,3]提示树中节点数目在范围 [0, 100] 内-100 <= Node.val <= 100思路基础题,前序遍历的步骤是:访问根节点。根节点入栈。访问左子树。回到根节点。根节点出栈。访问右子树。接下来采用递归形式和非递归形式进行实现。在非递归中有一点值得注

2022-05-18 11:40:25 995 1

原创 西瓜书-2.1经验误差与过拟合

文章目录经验误差与过拟合术语问题解决经验误差与过拟合术语错误率分类错误的样本数占总样本的比例。精度=1 - 错误率。误差:指误差期望。学习器的实际预测输出与样本的真实输出之间的差异。在不同数据集上的误差也有区别,如下:训练误差 或 经验误差:训练集。泛化误差:新样本。P问题(P:polynomial)存在多项式时间算法的问题。(多项式时间即算法中O(n^2))NP问题(N:non-deterministic非确定性)不确定1个问题是否存在多项式时间内的算

2022-05-17 20:21:01 286

原创 leetcode-112-路径总和

目录题目描述提示思路解决结果题目描述给你二叉树的根节点 root 和一个表示目标和的整数 targetSum 。判断该树中是否存在 根节点到叶子节点 的路径,这条路径上所有节点值相加等于目标和 targetSum 。如果存在,返回 true ;否则,返回 false 。叶子节点 是指没有子节点的节点。实例1:输入:root = [5,4,8,11,null,13,4,7,2,null,null,null,1], targetSum = 22输出:true解释:等于目标和的根节点到叶节点路径如上

2022-05-16 10:28:27 95

原创 西瓜书-1.4归纳偏好

文章目录归纳偏好描述问题解决归纳偏好作用偏好的建立奥卡姆剃刀(`Occam's razor`)NFL定理(No Free Lunch Theorem)归纳偏好核心:学习算法自身的归纳偏好与问题是否匹配,往往会起到决定性作用。描述基于学习得到相关模型,对应了假设空间中的一个假设。但是在版本空间(假设集合)中,有多个假设,会导致对应的模型在面临新样本的时候,产生不同的输出。问题在诸多假设中,若想要得到理想输出,应该采用哪一种模型(或假设)?解决对于一个具体的学习算法,必须要产生一个模型,而其自

2022-04-25 20:43:55 465

原创 西瓜书-1.3假设空间

文章目录假设空间假设空间演绎(一般到特殊的特化)归纳(特殊到一般的泛化)归纳学习:从样例中学习。广义:从样例中学习。狭义:从训练数据中学得概念,——亦称概念学习、概念形成。概念学习,最基本:布尔概念学习,即对‘是’、‘不是’这样的可表示为0/1布尔值的目标概念的学习。案例——西瓜布尔表达式:好瓜↔(色泽=?)∧(根蒂=?)∧(敲声=?)<?表示未确定值>好瓜 \leftrightarrow (色泽=?)\wedge(根蒂=?)\wedge(敲

2022-04-24 20:08:13 406

原创 西瓜书-1.2术语

文章目录ch1-绪论1.2 基本术语数据术语1类术语2类ch1-绪论1.2 基本术语数据(色泽=青绿;根蒂=蜷缩;敲声=浊响),(色泽=乌黑;根蒂=稍蜷;敲声=沉闷),(色泽=浅自;根蒂=硬挺;敲声=清脆) ,…术语1类示例:一条数据。数据集:一组记录的集合。样本:一条记录or 一个数据集,取决于上下文。属性attribute 或 特征feature、属性值attribute value如:色泽(特征)–青绿(属性值)。PS:下属统称:特征feature

2022-04-19 22:41:12 142

原创 3.3.2-中文分词

目录中文分词基于字典的匹配算法基于统计的算法中文分词基于字典的匹配算法人工建立的大规模字典若一个字符串和字典中的某一个词条匹配成功,认为该字符串表示一个中文词。匹配的策略包括正向最大匹配,系统会从左往右扫描字符串,发现能和字典词条匹配的最长字符串,作为1个中文词,匹配不到,右端减少1个词,剩下部分重复上述步骤。基于统计的算法...

2022-03-03 09:57:46 68

原创 3.3.1-取词干和词形还原

目录取词干和词形还原取词干实例词形还原取词干和词形还原是词形归并。目的:减少词的变化形式,将派生词转化为基本形式。优点1:字典中词条的数量就会降低,用于表示文档的向量维度更低,模型的数据量会缩小。优点2:通过词干和词形的关联,还能发掘不同形式的单词间存在的语义上的关联。取词干通过一定的语言学规则去除或者变换单词的后缀,让其变短,处理后的词干往往不是一个正确的英文单词。可以借助 PorterStemming算法实例 from nltk import PorterStemmer

2022-03-02 22:48:20 194

原创 3.2.8-语法分析和语义分析

目录语法分析实例语法分析主要包括形式化语法、语法树和语法解析器。一种常见的形式化语法框架=”生成文法“实例import nltk from nltk import CFG simple_grammar = CFG.fromstring(""" S -> NP VP PP -> P NP NP -> Det N | Det N PP | 'Bob' VP -> V NP | VP PP

2022-03-02 16:12:18 357

原创 3.2.7-实体识别

目录实体识别实例实体识别专门识别文本中具有特定意义的实体。类似于词性标注。借助Stanford named entity recognizer。实例 import nltk from nltk.tag import StanfordNERTagger as snt from pathlib import Path # 初始化斯坦福大学 提供的 StanfordNERTagger # 第一个参数 表示 通过英语语料训练得到的 模型数据 # 第二个

2022-03-02 15:40:01 404

原创 3.2.6-词性标注

目录词性标注基于人工规则的方法CRF模型词性标注闭合类词性这类词只包含固定的一些词,不会随着新的语料或者词汇的出现而增加。开放类词性会随着新的语料或者词汇的出现而增加,比如名称、动词等。计算机需要根据具体上下文环境,尽量消除可能的歧义,并判断单词的词性。基于人工规则的方法,进行歧义消除,确定每个词的最终的词性。如隐马尔科夫模型HMM、条件随机向量场CRF。基于统计的方法。基于人工规则的方法通过字典为每个词指定潜在的词性列表。使用大量的人造规则进行歧义消除。CRF模型需

2022-03-02 14:03:39 96

原创 3.2.5-语义相关的词

目录语义相关的词WordNet上下位关系分析潜在语义分析Word2Vec语义相关的词例如,‘学生’、‘老师’、‘大学’等。系统可以基于概念进行处理,而不用仅依赖于精确匹配的关键词。常见的方法:WordNet上下位关系分析潜在语义分析(Latent Semantic Analysis,LSA)基于神经网络的Word2VecWordNet上下位关系分析上位词表示更为抽象概念,下位词表示更具体概念。借用hypernyms()上位词 和 hyponyms()下位词函数。WordNet

2022-03-02 12:36:34 586

原创 3.2.4-词袋模型和TF-IDF机制

目录词袋模型编码方式TF-IDF机制设定计算方式实例词袋模型自然语言处理领域十分常用的文档表示方法。句子或者一篇文档,用一堆单词表示,且不考虑单词出现的顺序、句法以及文法,且认为每个单词的出现独立。编码方式这种词向量的编码方式称为独热编码或独热表示。构造字典,单词无重复,每一句话可以用字典个数n的n维向量表示。向量的每一维都表示1个单词,且这一维分量表示该单词在这句话中出现的次数。该编码方式不考虑单词间的位置关系,会导致词向量非常稀疏。TF-IDF机制TF:Term Freque

2022-03-01 19:08:50 843

原创 3.2.3-多元语法

目录多元语法(N-gram)二元语法模型优点缺点多元语法(N-gram)自然语言处理的常见技术。N表示任何一个词出现的概率只和其前面的N-1个词有关。二元语法模型表示某一个单词出现的频率只和其前面的1个词有关。即1个词出现在1个很长的句子中,只需要看其前面那一个1个单词。优点考虑到上下文的含义,并弥补单个单词表达力的不足。缺点增加了数据的存储量。没有考虑处理后的结果是否有正确的语法和语义。...

2022-03-01 15:49:54 68

原创 3.2.2-同义词和近义词

目录同义词Synonym处理意义同义词字典WordNet使用近义词Near-Syonoym同义词Synonym处理意义一般计算机处理自然语言时,是采用精准匹配。例如,中文中”西红柿“和”番茄“是同一种事物,但计算机在统计词频时,不认为是一种,而会分开统计词频。采用类似停用词stopword字典的方法,通过同义词字典进行处理,英文中最流行的一个同义词字典是WordNet,NLTK也提供了访问该字典的函数。同义词字典WordNet使用查询language的同义词 # 下载 WordN

2022-03-01 15:18:35 257

原创 3.2.1-停用词

目录停用词意义停用词的界定字典单词的文档频率(Document Frequency,DF)停用词处理程序实例NLTK(Natural Language Toolkit)语料库停用词意义在自然语言中,存在一些对理解而言意义不大的词,如中文中的“的、个、你”等。系统在处理文本时,可以直接忽略停用词。可以在基本不损失语义的情况下,提升系统的处理效率。停用词的界定字典根据停用词的字典,直接将字典内的词过滤。单词的文档频率(Document Frequency,DF)若DF低于或高于一定的阈值,

2022-03-01 14:05:19 1160

原创 3.2-常见NLP技术

目录通用的处理技术基础技术复杂技术通用的处理技术基础技术停用词(Stopword)和同义词(synonym)TF-IDF(Term Frequency-Inverse Document Frequency)机制多元语法(N-gram)词袋(Bag of Word)模型复杂技术语义相关词词性标注(Part of Speech Tagging)实体识别(Entity Recognition)语法分析(Synatax Parsing)语义分析(Semantic Parsing).

2022-02-28 20:22:23 203

原创 3.1-NLP发展

目录目的研究方向疑问NLP(自然语言处理)和NLU(自然语言理解)自然语言处理涵盖的范畴目的试图将文本转换为计算机所能理解的内容,建立人类和计算机系统间通过自然语言进行有效沟通的桥梁。研究方向基于语言规则的形式化语言处理体系复杂,包括:范畴语法、语言集合论等基于概率和统计的数字化语言处理目前主流,模型包括:概率语法、Bayes动态规划等。相关模型与对应算法将语言看作数字信号,使用概率论和统计的方法对其处理。疑问NLP(自然语言处理)和NLU(自然语言理解)NLU侧重让计算机在更

2022-02-28 20:14:26 120

原创 1.3-聊天机器人的模块和框架

目录常见模块语音识别模块自然语言处理模块其他技术模块常见模块语音识别模块大部分聊天机器人需要直接收录用户语音。该模块将语音转为文本。自然语言处理模块从文本中抽取对于聊天系统关键的信息,如用户的意图、关键的实体属性、用户情感等。问题匹配问答型侧重方向。对话管理任务型和闲聊型侧重。情感分析闲聊型重点。其他技术模块机器学习深度学习信息检索...

2022-02-28 19:50:47 1784

原创 1.2-聊天机器人的类型和应用

《智能聊天机器人》黄申老师著,学习笔记

2022-02-28 15:47:17 359

原创 leetcode-35-pythone

py35-搜索插入位置题目描述提示解决代码注意点题目描述给定一个排序数组和一个目标值,在数组中找到目标值,并返回其索引。如果目标值不存在于数组中,返回它将会被按顺序插入的位置。请必须使用时间复杂度为 O(log n) 的算法。示例 1:输入: nums = [1,3,5,6], target = 5输出: 2示例 2:输入: nums = [1,3,5,6], target = 2输出: 1示例 3:输入: nums = [1,3,5,6], target = 7输出: 4示例 4

2022-02-19 21:44:29 616

原创 鸿蒙-No pending exception expected: java.lang.RuntimeException: Parcel:

问题描述学习鸿蒙开发,在利用intent封装数据,这里我是自定义了1个实体对象,然后作为list的元素,封装list,进行页面跳转时,总报下列异常:A/com.example.ex: thread.cc:2560] No pending exception expected: java.lang.RuntimeException: Parcel: unable to marshal value com.example.ex1.entity.Student@e544bb0 thread.cc:25

2021-10-28 19:28:08 1478

cppcheck-1.86-x86-Setup.msi

cppcheck-1.86-x86安装包

2021-04-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除