自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(40)
  • 收藏
  • 关注

原创 【rasa】表单问询容错机制设计

AI问完表单后,用户开始回答某些意图,AI回复完该意图后,接着问表单槽位内容。如果用户继续回答其他意图,AI接着回复完该意图后,接着问表单槽位内容。直到获取到表单需要信息。AI问完表单后,用户开始闲聊,AI会被带偏,用户说什么,AI回复什么。

2023-09-26 10:48:14 111

原创 Huggingface Transformers的使用记录

huggingface的使用记录:1 具体使用教程参考文章:https://zhuanlan.zhihu.com/p/143161582模型,字典等默认下载到本机(linux)的路径获取路径的代码hf_cache_home = os.path.expanduser( os.getenv("HF_HOME", os.path.join(os.getenv("XDG_CACHE_HOME", "~/.cache"), "huggingface")))实际下载地址示例:/home/you

2020-12-14 17:47:53 471

原创 【LeetCode】Python代码实现 之 237. 删除链表中的节点

请编写一个函数,使其可以删除某个链表中给定的(非末尾)节点。传入函数的唯一参数为 要被删除的节点 。示例 1:输入:head = [4,5,1,9], node = 5输出:[4,1,9]解释:给定你链表中值为 5 的第二个节点,那么在调用了你的函数之后,该链表应变为 4 -> 1 -> 9.示例 2:输入:head = [4,5,1,9], node = 1输出:[4,5,9]解释:给定你链表中值为 1 的第三个节点,那么在调用了你的函数之后,该链表应变为 4 -> 5

2020-11-30 17:07:59 262

原创 【LeetCode】Python代码实现 之 141. 环形链表(检测单链表是否有环, 判断链表中是否有环)

给定一个链表,判断链表中是否有环。如果链表中有某个节点,可以通过连续跟踪 next 指针再次到达,则链表中存在环。 为了表示给定链表中的环,我们使用整数 pos 来表示链表尾连接到链表中的位置(索引从 0 开始)。 如果 pos 是 -1,则在该链表中没有环。注意:pos 不作为参数进行传递,仅仅是为了标识链表的实际情况。如果链表中存在环,则返回 true 。 否则,返回 false 。示例 1:输入:head = [3,2,0,-4], pos = 1输出:true解释:链表中有一个环,其尾部

2020-11-30 16:39:20 250

原创 Python代码访问http方法(替换postman访问)

常用的有两种传入数据的模式,一种是参数模式,一种是json数据模式1 参数格式import requestsparams = {"data": "g"}url = "http://10.6.8.2:1990/post"headers = {"Content-type": "application/x-www-form-urlencoded;charset=utf-8"}r = requests.post(url, data=params, headers=headers)jsonData =

2020-11-27 11:28:00 391

原创 python连接redis(MongoDB, mysql,hive)操作,读取和写入数据

redis的相关操作1 连接redis from rediscluster import StrictRedisCluster from config import REDIS_NODES redis = StrictRedisCluster(startup_nodes=REDIS_NODES, max_connections=len(REDIS_NODES), decode_responses=True, password='password')# 其中REDIS_NODES=[{'host':

2020-11-20 11:43:20 648 1

原创 linux 常用命令(查找文件)

1 在当前目录下:模糊查找文件,查找含有某些字符的文件,按正则表达字符查找文件ll -lh|grep test*或者find . -name '*.txt'2 在当前目录下查找指定的一个文件find . -name test.txt

2020-11-16 09:54:15 134

原创 linux 修改文件的权限

linux中将文件或者文件夹权限分配给某个用户1 指定某个文件的所有者chown -R tom /opt/test此命令是指定test文件夹的所有者是tom,-R是递归。如果test是文件就去掉-R。2 修改某文件的所有者 的权限chmod -R 700 /opt/test此命令是分配给test文件夹的所有者700权限600 – 只有属主有读、写权限700 – 只有属主有读、写、执行权限备注:此外chmod也可以用数字来表示权限如 chmod 777 file语法为:chmod a

2020-11-04 11:25:49 747

原创 pandas dataframe的一些常用操作方法

1 定义生成dataframeimport pandas as pddf = pd.DataFrame({'A':[1,2,3], 'B':[4,5,6], 'C':[3,8,9], 'D':[1,3,5], 'E':[5,3,6], 'F':[7,4,3]})输出: A B C D E F0 1 4 3

2020-11-04 10:33:24 530 1

原创 操作hive表的常用操作

1 按时间dt分区创建表create table test.dm_fz_feature_weight (feature_name string, feature_weight float, website string, warehouse string, goods_owner string) PARTITIONED BY(dt string) ROW FORMAT DELIMITED FIELDS TERMINATED BY "\t"2 查看表结构,字段类型等desc test.dm_fz_fe

2020-10-31 16:45:42 263

原创 linux环境下配置和启动jupyter notebook

1 执行命令查看jupyter的配置文件在哪jupyter notebook --generate-config控制台打印如下:Writing default config to: /*/*/.jupyter/jupyter_notebook_config.py2 打开ipython,生成密码[root@djt_37_152 wj]# ipythonIn [1]: from notebook.auth import passwdIn [2]: passwd()Enter passwor

2020-10-28 17:21:21 3019

转载 git基本命令

git基本命令Git 是一个开源的分布式版本控制系统,该系统通过一些简单的命令就可以处理大小项目的版本控制问题。命令 解释git branch 查看本地所有分支git status 查看当前状态git commit 提交

2020-10-28 15:44:11 146

原创 linux环境下安装xgboost记录(使用Python)

参考官网安装教程:https://xgboost.readthedocs.io/en/latest/build.html1 下载whl文件,下载地址为https://s3-us-west-2.amazonaws.com/xgboost-nightly-builds/list.html下载命令:wget https://files.pythonhosted.org/packages/7c/32/a11befbb003e0e6b7e062a77f010dfcec0ec3589be537b02d2eb2f

2020-10-28 15:26:30 1431

原创 【LeetCode】Python代码实现 之 面试题67. 把字符串转换成整数

写一个函数 StrToInt,实现把字符串转换成整数这个功能。不能使用 atoi 或者其他类似的库函数。首先,该函数会根据需要丢弃无用的开头空格字符,直到寻找到第一个非空格的字符为止。当我们寻找到的第一个非空字符为正或者负号时,则将该符号与之后面尽可能多的连续数字组合起来,作为该整数的正负号;假如第一个非空字符是数字,则直接将其与之后连续的数字字符组合起来,形成整数。该字符串除了有效的整数部分之后也可能会存在多余的字符,这些字符可以被忽略,它们对于函数不应该造成影响。注意:假如该字符串中的第一个非空

2020-06-28 11:52:02 187

转载 Keras实现BiLSTM+CRF中文命名实体识别--实战篇(序列标注)

本文主要是利用Keras框架搭建BiLSTM+CRF的序列标注模型,完成中文的命名实体识别任务。这里使用的数据集是提前处理过的,已经转成命名实体识别需要的“BIO”标注格式。详细代码和数据:https://github.com/huanghao128/zh-nlp-demo输入的训练阿虎局格式如下:...

2020-06-24 10:17:00 3956 7

原创 【LeetCode】Python代码实现 之 面试题64. 求1+2+…+n

求 1+2+…+n ,要求不能使用乘除法、for、while、if、else、switch、case等关键字及条件判断语句(A?B:C)。示例 1:输入: n = 3输出: 6示例 2:输入: n = 9输出: 45

2020-06-24 10:15:37 183

原创 【LeetCode】Python代码实现 之 面试题63. 股票的最大利润

假设把某股票的价格按照时间先后顺序存储在数组中,请问买卖该股票一次可能获得的最大利润是多少?示例 1:输入: [7,1,5,3,6,4]输出: 5解释: 在第 2 天(股票价格 = 1)的时候买入,在第 5 天(股票价格 = 6)的时候卖出,最大利润 = 6-1 = 5 。注意利润不能是 7-1 = 6, 因为卖出价格需要大于买入价格。示例 2:输入: [7,6,4,3,1]输出: 0解释: 在这种情况下, 没有交易完成, 所以最大利润为 0。解答:前i日最大利润=max(前(i−1)

2020-06-23 11:44:56 324

原创 【LeetCode】Python代码实现 之 面试题61. 扑克牌中的顺子

从扑克牌中随机抽5张牌,判断是不是一个顺子,即这5张牌是不是连续的。2~10为数字本身,A为1,J为11,Q为12,K为13,而大、小王为 0 ,可以看成任意数字。A 不能视为 14。示例 1:输入: [1,2,3,4,5]输出: True示例 2:输入: [0,0,1,2,5]输出: True解答: set加遍历满足下面两个条件,则为顺子:1 除大小王外,所有牌 无重复 ;2 设此 55 张牌中最大的牌为 max,最小的牌为 min (大小王除外),则需满足:max - min &l

2020-06-22 11:16:01 315 2

原创 【LeetCode】Python代码实现 之 面试题59 - II. 队列的最大值

请定义一个队列并实现函数 max_value 得到队列里的最大值,要求函数max_value、push_back 和 pop_front 的均摊时间复杂度都是O(1)。若队列为空,pop_front 和 max_value 需要返回 -1示例 1:输入:[“MaxQueue”,“push_back”,“push_back”,“max_value”,“pop_front”,“max_value”][[],[1],[2],[],[],[]]输出: [null,null,null,2,1,2]示例

2020-06-19 15:10:47 142

原创 【LeetCode】Python代码实现 之 面试题58 - II. 左旋转字符串

字符串的左旋转操作是把字符串前面的若干个字符转移到字符串的尾部。请定义一个函数实现字符串左旋转操作的功能。比如,输入字符串"abcdefg"和数字2,该函数将返回左旋转两位得到的结果"cdefgab"。示例 1:输入: s = “abcdefg”, k = 2输出: “cdefgab”示例 2:输入: s = “lrloseumgh”, k = 6输出: “umghlrlose”解答:字符串切片:def reverse_left_word(s, n): return s[n:] +

2020-06-17 09:41:39 129

原创 【LeetCode】Python代码实现 之 面试题58 - I. 翻转单词顺序

输入一个英文句子,翻转句子中单词的顺序,但单词内字符的顺序不变。为简单起见,标点符号和普通字母一样处理。例如输入字符串"I am a student. “,则输出"student. a am I”。示例 1:输入: “the sky is blue”输出: “blue is sky the”示例 2:输入: " hello world! "输出: “world! hello”解释: 输入字符串可以在前面或者后面包含多余的空格,但是反转后的字符不能包括。示例 3:输入: “a good

2020-06-16 14:56:29 217

原创 【LeetCode】Python代码实现 之 面试题57 - II. 和为s的连续正数序列

输入一个正整数 target ,输出所有和为 target 的连续正整数序列(至少含有两个数)。序列内的数字由小到大排列,不同序列按照首个数字从小到大排列。示例 1:输入:target = 9输出:[[2,3,4],[4,5]]示例 2:输入:target = 15输出:[[1,2,3,4,5],[4,5,6],[7,8]]解答:滑动窗口法def find_continuous_sequence(target): i, j, res = 1, 2, [] # 滑动窗口的右

2020-06-16 10:57:24 129

原创 【LeetCode】Python代码实现 之 面试题57. 和为s的两个数字

输入一个递增排序的数组和一个数字s,在数组中查找两个数,使得它们的和正好是s。如果有多对数字的和等于s,则输出任意一对即可。示例 1:输入:nums = [2,7,11,15], target = 9输出:[2,7] 或者 [7,2]示例 2:输入:nums = [10,26,30,31,47,60], target = 40输出:[10,30] 或者 [30,10]解答:定义两个指针i,j,从一头和一尾开始遍历。如果两数之和小于s,则i加1, 如果两数之和大于s,则j减1Python代码

2020-06-15 11:13:12 136

转载 tensorflow2.0(Keras)实现seq2seq+Attention模型的对话系统--实战篇(序列生成)

本文目录结构序列生成的两种方法比较seq2seq模型介绍Keras实现seq2seq+Atttention模型序列生成的两种方法比较:序列生成任务主要有两种方案实现,一种是传统的seq2seq(lstm+attention),一种是基于self-attention的transformer模型实现。(具体实现方法参考另一篇博客https://blog.csdn.net/qq_35549634/article/details/106549346),本文将介绍第一种方法。问:attention与sel

2020-06-07 17:29:42 10308 4

原创 项目总结之机器翻译(使用tensor2tensor框架,transformer算法实现)--实战篇(机器翻译,序列生成)

先留坑,以后再填

2020-06-04 16:08:25 2285 1

转载 NLP相关经典书籍和论文

经典书籍:1 Speech and Language Processing这个是NLP大牛Daniel Jurafsky的关于语音和语言处理的一本书,NLP领域非常经典的入门教程,语言通俗易通,实例简单形象。最近作者在写最新的第三版,要知道第二版是2008年完成的,最新版除了介绍传统的自然语言处理方法外,如贝叶斯分类、逻辑回归、TF-IDF等,也加入了最新的神经网络和深度学习一类方法,有介绍神经网络语言模型、问答系统、对话系统、机器翻译等。还有信息检索、实体链接分析等。现在第三版还没有完全写完,作者把已

2020-06-04 15:02:46 1070

原创 【LeetCode】Python代码实现 之 面试题55 - I. 二叉树的深度

输入一棵二叉树的根节点,求该树的深度。从根节点到叶节点依次经过的节点(含根、叶节点)形成树的一条路径,最长路径的长度为树的深度。例如:给定二叉树 [3,9,20,null,null,15,7],3/ \9 20/ \15 7返回它的最大深度 3 。解答:树的遍历的方法可以分为:深度优先搜索(DFS),广度优先搜索(BFS)DFS包括:先序遍历,中序遍历,后序遍历BFS包括:层序遍历解法1:DFS,树的深度为左子树和右子树深度的最大值加1.解法2:BFS,每遍历一层,计数器

2020-06-04 11:23:54 139

转载 word2vec词向量的训练--实战篇(语言模型词向量的生成)

新闻语料预处理本文使用的是搜狗新闻语料库,原始语料是类似下图中xml格式,首先需要提取中语料中正真的新闻内容,就是中对应的文本。还需要过滤一些特殊字符,以及半角和全角的转换问题。...

2020-06-03 17:53:34 1723

原创 【LeetCode】Python代码实现 之 面试题54. 二叉搜索树的第k大节点

给定一棵二叉搜索树,请找出其中第k大的节点。示例 1:输入: root = [3,1,4,null,2], k = 13/ 1 42输出: 4示例 2:输入: root = [5,3,6,2,4,null,null,1], k = 35/ 3 6/ 2 4/1输出: 4解答:解法基于此性质:二叉搜索树的中序遍历为 递增序列 。根据以上性质,易得二叉搜索树的 中序遍历倒序 为 递减序列 。因此,求 “二叉搜索树第 k大的节点” 可转化为求 “此树的中序遍

2020-06-03 17:50:10 254

原创 【LeetCode】Python代码实现 之 面试题53 - II. 0~n-1中缺失的数字

一个长度为n-1的递增排序数组中的所有数字都是唯一的,并且每个数字都在范围0~n-1之内。在范围0~n-1内的n个数字中有且只有一个数字不在该数组中,请找出这个数字。示例 1:输入: [0,1,3]输出: 2示例 2:输入: [0,1,2,3,4,5,6,7,9]输出: 8算法解析:初始化: 左边界 i = 0,右边界 j = len(nums) - 1;代表闭区间 [i, j]。循环二分: 当i≤j 时循环 (即当闭区间 [i,j] 为空时跳出) ;1 计算中点 m = (i + j)

2020-06-03 17:17:10 164 2

原创 传统神经网络语言模型与word2vec 篇(二)

本篇介绍语言模型word2vec,大部分摘抄自博客:https://blog.csdn.net/huanghaocs/article/details/77935556与https://www.cnblogs.com/ooon/p/5558119.htmlword2vec的网络结构其实和神经概率语言模型(NPLM)是基本类似的,word2vec的训练方法有两种,一种是CBOW根据上下文,预测中间的词。另一种是Skip-gram,输入某个词,预测这个词的上下文。其实都是在发现语料中局部词汇之间的共现关系。

2020-06-03 14:49:04 538

原创 传统神经网络语言模型与word2vec 篇(一)

神经网络语言模型NNLM(Neural Network Language Model)用神经网络来训练语言模型的思想来源于2003年Bengjo发表的《A Neural Probabilistic Language Model》,下面我们来详细分析一下该模型结构。在训练过程中,输入是一串词序列,输出是该序列下一个词的概率值。假设有一组序列:w1,w2,⋅⋅⋅,wtw_{1},w_{2},\cdot \cdot \cdot ,w_{t}w1​,w2​,⋅⋅⋅,wt​ , 其中wiϵv,vw_{i} \e

2020-06-02 17:56:48 824

原创 【LeetCode】Python代码实现 之 面试题53 - I. 在排序数组中查找数字

统计一个数字在排序数组中出现的次数。示例 1:输入: nums = [5,7,7,8,8,10], target = 8输出: 2示例 2:输入: nums = [5,7,7,8,8,10], target = 6输出: 0解答:# 方法1,使用二分查找与递归count = 0def search(nums, target): global count if len(nums) == 0: return 0 # 二分查找 mid = len(nums)//

2020-06-02 15:09:01 112

原创 【LeetCode】Python代码实现 之 面试题52. 两个链表的第一个公共节点

输入两个链表,找出它们的第一个公共节点。如下面的两个链表:在节点 c1 开始相交。示例 1:输入:intersectVal = 8, listA = [4,1,8,4,5], listB = [5,0,1,8,4,5], skipA = 2, skipB = 3输出:Reference of the node with value = 8输入解释:相交节点的值为 8 (注意,如果两个列表相交则不能为 0)。从各自的表头开始算起,链表 A 为 [4,1,8,4,5],链表 B 为 [5,0,1

2020-06-02 11:50:10 126

原创 【LeetCode】Python代码实现 之 面试题51. 数组中的逆序对------------暴力解法

在数组中的两个数字,如果前面一个数字大于后面的数字,则这两个数字组成一个逆序对。输入一个数组,求出这个数组中的逆序对的总数。示例 1:输入: [7,5,6,4]输出: 5解答:# 方法1# 先上暴力解法(依次遍历数组,查看后面的是否小于前面的值)def reverse_pairs(l): num = 0 for i in range(len(l)): for j in range(i+1, len(l)): if l[i] > l[

2020-06-02 11:45:01 141

原创 【LeetCode】Python代码实现 之 面试题50. 第一个只出现一次的字符

在字符串 s 中找出第一个只出现一次的字符。如果没有,返回一个单空格。 s 只包含小写字母。示例:s = “abaccdeff”返回 “b”s = “”返回 " "限制:0 <= s 的长度 <= 50000解答:# 方法1# dic存入的数据为{"a" :Flase, "b": True, "c" :Flase, "d": True, "e": True, "f" : Flase}# 返回第一个value值为True的字符def first_uniq_char(s):

2020-06-02 11:09:00 300

原创 排序算法介绍讲解(冒泡排序,插入排序,选择排序,归并排序,快速排序,堆排序)及其Python代码实现

排序基于比较的排序算法的执行过程,会涉及两种操作,一种是元素比较大小,另一种是元素交换或移动。所以,如果我们在分析排序算法的执行效率的时候,应该把比较次数和交换(或移动)次数也考虑进去。1 冒泡排序冒泡排序只会操作相邻的两个数据。每次冒泡操作都会对相邻的两个元素进行比较,看是否满足大小关系要求。如果不满足就让它俩互换。Python代码实现如下:def bubble(arr): # 遍历所有的元素 for i in range(len(arr)): # 比对还未排

2020-05-15 16:45:12 487

原创 python使用中需要注意的知识点

1、不能在函数内部随意改变全局变量的值这里的 global 关键字,并不表示重新创建了一个全局变量 MIN_VALUE,而是告诉 Python 解释器,函数内部的变量 MIN_VALUE,就是之前定义的全局变量,并不是新的全局变量,也不是局部变量2、函数式编程Python 主要提供了这么几个函数:map()、filter() 和 reduce(),通常结合匿名函数 lambda 一起使用。...

2020-05-04 16:44:08 233

原创 数据结构与算法总结笔记 及其 Python代码实现

**常用的数据结构:**数组,链表,栈、队列、散列表、二叉树、堆、跳表、图、Trie 树;**常用的算法:**递归、排序、二分查找、搜索、哈希算法、贪心算法、分治算法、回溯算法、动态规划、字符串匹配算法常见的时间复杂度:常见的空间复杂度: O(1)、O(n)、O(n2) (表示算法的存储空间与数据规模之间的增长关系)...

2020-04-28 17:56:39 682

原创 Bert论文笔记-细读

Bert论文笔记-细读说明一、 介绍二、相关工作说明本文结合英语原文和网上各种资料的理解, 下面列出本文的来源:英文原文:https://arxiv.org/abs/1810.04805其他博客文章:https://blog.csdn.net/u010891397/article/details/87284172一、 介绍Introduction预训练的语言模型被证实在提升自然语...

2019-09-30 16:53:06 210

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除