伊直程序媛-CSDN博客

原创 python中的日志

日志级别DEBUG：调试信息，也是最详细的日志信息INFO：证明事情按预期工作WARNING：表明发生了一些意外，或者不久的将来会发生问题，还是能正常工作。ERROR：由于更严重的问题，已经不能执行一些功能了。CRITICAL：严重错误，不能继续运行了。（上面列表中的日志等级是从上到下依次升高的）logging模块logging构成Logger记录器，提供了应用程序可一直使用的接口。Handler处理器，将日志记录发送到合适的路径。Filter过滤器，提供了更细粒度的控制工具来决

2020-07-12 21:07:03 226

原创 python如何安装.whl文件

从网上下载了PyYAML-5.3.1-cp37-cp37m-win_amd64.whl文件。python安装.whl文件的方式是：pip install .whl文件路径测试是否安装成功：import yaml

2020-07-12 16:31:14 560

原创软件测试基础理论知识

测试基础问答题什么是软件测试通过手工或者工具对“被测对象”进行测试操作，从而验证实际结果与预期结果之间是否存在差异。软件测试的作用通过测试工作可以发现并修复软件当中的缺陷，从而提高用户对产品的使用信心测试可以记录软件运行过程中产生的一些数据，从而为决策提供数据支持。测试可以降低同类型产品开发遇到问题的风险。测试原则测试证明软件存在缺陷：无论执行什么样的测试工作，都不能证...

2019-12-29 21:38:22 489

原创 QA论文笔记3

题目：《Knowledge Base Question Answering With a Matching-Aggregation Model and Question-Specific Contextual Relations》来源：IEEE 2019链接：https://ieeexplore.ieee.org/document/8752379MOTIVATIONKB-QA被认为是两个...

2019-10-17 11:02:04 383

原创 python中的list,tuple,set,dict总结

list,tuple,set,dict总结表名称列表元组集合字典英文listtuplesetdict可否读写读写只读读写读写可否重复是是否是存储方式值值键（不重复）键值对（不重复）是否有序有序有序无序无序初始化[1,“a”] (备注：元素可以是不同类型)(“a”,1)set([1,“a”])或{...

2019-09-29 16:11:34 183

原创 QA论文解读2

论文题目：《Knowledge-enhanced Hierarchical Attention for Community Question Answering with Multi-task and Adaptive Learning》来源：IJCAI 2019链接：

2019-09-19 17:11:08 613 2

原创《Open-Domain Why-Question Answering with Adversarial Learning to Encode Answer Texts》笔记

来源：ACL 2019链接：https://www.aclweb.org/anthology/P19-1414MOTIVATIONwhy-QA模型检索的答案段落通常包含几个句子。这些多句的段落不仅包含了why-QA所寻求的原因及其与why-QA的联系，而且还包含了冗余的和/或不相关的部分。CONTRIBUTIONS本文训练了一个神经网络(NN)，从一个答案段落中生成一个由why-ques...

2019-09-15 16:40:05 386

原创《Adversarial Training for Community Question Answer Selection Based on Multi-scale Matching》笔记

来源：AAAI2019资源：https://arxiv.org/pdf/1804.08058.pdfMOTIVATIONCQA任务存在语义鸿沟现象，即一个和问题有很多重叠单词的答案可能并不是这个问题的相关答案。标签不均衡问题：相关答案的整体数量通常比不相关答案的数量少。而且为了更好地利用标注数据以及给QA对提供更多训练，之前的研究大多是对于当前问题，随机采样答案作为这个问题的负样本。这会...

2019-09-11 15:03:07 317

原创 QA问答论文笔记

《Multi-Task Learning with Multi-View Attention for Answer Selection and Knowledge Base Question Answering》论文笔记背景：在之前的研究工作中，都是将不同的QA任务放在不同框架中解决。在作者这篇论文中，他采用的方法是利用多任务学习同时解决答案选择和KB-QA问题。框架：multi-task...

2019-09-06 16:44:54 695 1

原创戳破气球-LeetCode

思路dp[i][j] 表示戳破 [i+1…j-1] 号气球的最大收益。假设 k 号气球（i+1 <= k <= j-1）是 [i+1…j-1] 中最后一个被戳破的，则dp[i][j] = max {for k = range(i+1, j -1) nums[i] * nums[k] * nums[j] + dp[i][k] + dp[k][j]}代码：class Solut...

2019-08-07 16:40:41 176

原创单词拆分

解法memo存放的是s中已经匹配的部分的首位坐标，例如s = “leetcode”, wordDict = [“leet”, “code”]则memo=[0,4,8]class Solution(object): def wordBreak(self, s, wordDict): """ :type s: str :type wordD...

2019-08-05 14:44:36 375

原创 spanBert

1. 对 BERT 模型进行了如下改进：对随机的邻接分词（span）而非随机的单个词语（token）添加掩膜通过使用分词边界的表示来预测被添加掩膜的分词的内容，不再依赖分词内单个 token 的表示。SpanBERT 能够对分词进行更好地表示和预测。该模型和 BERT 在掩膜机制和训练目标上存在差别。首先，SpanBERT 不再对2. 原理该模型和 BERT 在掩膜机制和训练目标上...

2019-08-05 10:27:05 856

原创完全平方数-力扣

方法一（动态规划）用memo记录每一个比n小的数的最小完全平方个数，k记录的是n开平方的整数部分。class Solution(object): def numSquares(self, n): """ :type n: int :rtype: int """ memo=[0]*(n+1) ...

2019-08-03 13:14:02 196

原创买卖股票-力扣

力扣中有6题关于股票的问题，我们先从最简单的出发，逐步解决所有问题。参考大佬们的解答，发现有一个用状态机的方法，比较通用且好理解。参考：只存在一次买卖交易- 用imin记录遍历过程中的最小值，imax记录到遍历的数据前的最大利润class Solution(object): def maxProfit(self, prices): """ :typ...

2019-07-31 19:23:37 403

原创乘积最大子序列-力扣

思路分析：整数数组，只有正数时，每一个数与前一个数相乘都大于等于这个数，考虑负数时，乘奇数个负数，整个结果变成最小，偶数个负数时，负号抵消。思路：使用三个变量，maxVal记录最大结果，maxTem 保存最大的，minTem保存最小的。遍历整个数组，如果遇到负数，那么会导致最大的变最小的，最小的变最大的。因此交换两个的值代码import sysclass Solution(object...

2019-07-29 13:43:35 141

原创正则表达式匹配-力扣

考察知识点python 动态规划回溯算法代码class Solution(object): def isMatch(self, s, p): """ :type s: str :type p: str :rtype: bool """ memo={} def dp(i,...

2019-07-28 16:11:53 244

原创通配符匹配-力扣

考察知识点回溯法，动态规划思路一用一个（m+1）*(n+1)的数组辅助，values[i][j]表示s到i位置,p到j位置位置是否匹配成功①初始化:values[0][0]:s和p都为空字符串时，为True第一行values[0][j]:s为空,与p匹配第一列values[i][0]:全部为False②双层循环判断如果(s[i] == p[j] || p[j] == “?”) ...

2019-07-27 15:35:23 158

原创删除无效的括号

考察知识点回溯，深度搜索思路一给定字符串：①首先求出不匹配的左括号数和右括号数。②在深度搜索过程中去除不匹配的符号，举例()())()③当左括号数等于右括号数时，判断是否匹配代码class Solution(object): def removeInvalidParentheses(self, s): """ :type s: str ...

2019-07-26 13:23:03 231

原创单词搜索

单词搜索2：考察知识点前缀树，回溯算法思路：1.将word存放在前缀树中，前缀树的结尾用符号“#”表示，且结尾“#”键对应的值为word。2.遍历board中的每一个元素，若是这个元素未被遍历且存在word前缀树中，则进行下一层循环。3.若是当前遍历board元素对应word前缀树的“#”。说明此元素存在board中。代码：class Solution(object): ...

2019-07-17 14:44:29 150

原创前缀树（Trie）

定义：前缀树（Trie树），即字典树，又称单词查找树或键树，是一种树形结构。核心思想是空间换时间。利用字符串的公共前缀来降低查询时间的开销以达到提高效率的目的。优点：最大限度地减少无谓的字符串比较，查询效率比哈希表高。与哈希表对比哈希表可以在 O(1)O(1) 时间内寻找键值，却无法高效的完成以下操作：1.找到具有同一前缀的全部键值。2.按词典序枚举字符串的数据集。随着哈希表大小增...

2019-07-15 16:36:58 95

原创生成对抗网络（GAN）基本介绍

文章目录GAN基本介绍1.1 概念1.2 目标函数的最优解1.3 KL散度与JS散度小结持续更新中，如有错误，请多指正GAN基本介绍1.1 概念生成对抗网络（GAN）：是一种生成假样本的生成模型。包括两个部分，生成器G和判定器D，生成器D从隐变量z产生假样本，判定器判定输入的样本是真样本还是假样本。生成器与判定器相互对抗，生成器生成与真实样本相近的假样本达到欺骗判定器的目的，判定器最大可能判...

2019-04-03 10:09:38 1475

原创 word2vec Parameter Learning Explained笔记

目录1.CBOW模型2.Skip Gram模型3.Hierarchical softmax4.Negative Sampling前言，下面公式多次用到的求导法则：sigmoid函数的导数具有以下形式：1.CBOW模型首先从输入输出都是一个词的模型讲起。模型中词典大小为V，隐藏层规模为N，连接层为全连接，输入层为one-hot编码方式。对于一个特定词，词向量为x={x1，x2，...

2019-03-17 20:33:48 491 1

原创 Distributed Representations of Sentences and Documents笔记

基本概念段向量：一种将段落（段落长度可变，可以是句子和一篇文章等）表示成向量的无监督框架。论文的提出是为了解决什么问题：解决bag-of-words（词袋模型）的缺点：不考虑词的顺序以及词的语义。也就是说只要两篇文章包含的词一样，词袋模型就认为这两篇文章一样。句子表示中的平均化单词权重导致的丢失句子顺序的问题和合并词向量的解析树仅仅适用于句子的缺点。段向量特点：为不同长度的段落训...

2019-03-16 15:15:12 2000

原创激活函数

使用目的作用就是避免神经网络中每一层输出都是线性函数，从而导致最后的输出是输入的线性组合。当使用激活函数使得最后的输出不再是线性组合而是任意的逼近函数时，神经网络的表达能力就更加强大了。常用激活函数：- sigmoid函数- tanh函数- relu函数下面详细讲解每一种激活函数sigmoid函数数学形式图形（左函数图形，右函数倒数图形）tanh函数数字形式图形...

2019-03-04 16:13:00 469

转载常用命令或快捷键（dos,win,linux）

DOSdos:一个操作系统，属于Windows。顺便提一下操作系统的分类：time 调用计算机当前的本地时间ctr+c 退出当前正在执行的命令cls 清空当前正在编辑的屏幕shutdown /s /t 设置在多少时间后自动关机（单位秒）shutdown /a 取消之前设置的自动关机ping 检查网络是否通，可以得到当前网络的IP地址ipconfig -all 将...

2019-02-27 16:01:16 377

原创计数质量（力扣）

下面用n=10来说明过程class Solution(object): def countPrimes(self, n): """ :type n: int :rtype: int """ if n < 3: return 0 prime = [1] * n ...

2019-02-26 19:40:08 152

原创 git学习

1.git初始化设置名字和emailgit config --global user.name “chen”git config --global user.email '854210@qq.com"2.获得一个仓库克隆一个仓库git clone https:... 初始化一个新的仓库git init3.仓库工作流程-创建或修改一个文件touch file...

2019-02-25 12:43:17 88

原创动态规划

解法class Solution(object): def climbStairs(self, n): """ :type n: int :rtype: int """ if n==0 or n==1: return 1 a,b=1,2

2019-02-24 21:56:33 114

原创动态规划（python）

核心：记住已经求过的解。方法：自顶向下备忘录法，自底向上钢条切割问题自顶向下备忘录法def cut(chain,chainlen,memo): q=-1 if memo[chainlen]>=0: return memo[chainlen] if chainlen==0: q=0 else: f...

2019-02-24 12:55:43 1021 1

原创线性模型

# 基本概念和公式线性模型均方误差（平方损失）最小二乘法基于均方误差最小化进行模式求解的方法。试图在线性回归中找到一条直线，使所有样本到直线的欧式距离之和最小#代码实现...

2018-09-27 15:33:51 219

原创贝叶斯分类器

基本概念和公式贝叶斯公式p（c）是类“先验概率”，p(x|c)是样本x相对于类标记c的类条件概率，p(x)是用于归一化的“证据因子”朴素贝叶斯分类器采用了属性条件独立性假设，对已知类别，假设所有属性相互独立。公式改写为：由于对所有类捏来说，p(x)相同，因此上式可表示为：为了避免某些属性在训练集中未出现，抹掉其它属性。采取拉普拉斯修正：半朴素贝叶斯分类器适当考虑一部分属...

2018-09-25 17:03:13 573

原创决策树

基本概念和公式信息信息熵度量样本集合纯度最常用的一种指标：Ent(D)值越小，则D纯度越高信息增益(信息增益标准对可取数目较多的属性有所偏好)信息增益率(信息增益率标准对可取数目较少的属性有所偏好)（C4.5采取的策略是，先从候选属性中找出信息增益高于平均值的属性，再从中选择增益率最高的）基尼指数基尼值：反映从数据集D中随机抽取两个样本，其类别标志不一致的概率G...

2018-09-22 19:25:32 133

liunianhuakai的博客