- 博客(76)
- 资源 (17)
- 收藏
- 关注
原创 词向量训练总结
使用pytorch实现了TextCNN,TextRNN,FastText,TextRCNN,BiLSTM_Attention,DPCNN,Transformer。github:Chinese-Text-Classification-Pytorch,开箱即用。一般字会比词效果好点,原因有几点:1.分词后会有长尾问题,有的词只在数据集中出现一两次,不能学到很好的分布。2.分词会有OOV问题。3.分词不标准,中文分词技术还不能达到没有错误。4.使用字的预训练向量会比使用词的容错性好一点...
2020-08-13 10:15:38 370
原创 bilstm-crf_序列标注问题
3.模型每个batch下提前将数据读取到内存,且将train数据指标不再监控(减少打印log),test数据进行指标监控时随机选取1W条数据进行计算指标(减小运算,后续需要)2.增加模型监控指标(调整batchsize、学习率)1.训练集调整...
2020-06-18 10:35:09 821
原创 纠错
1.百度中文纠错技术百度中文纠错一方面需要支持多种类型的错误识别,另一方面需要支持不同模态的输入数据,同时还需要提供快速的场景迁移以及深度定制能力。2.基于语言模型的拼写纠错给定一个自然语言的句子,识别出其中出错的汉字或词语,并对其进行纠正3.美团BERT的探索和实践模型优化...
2020-04-24 18:26:03 306
原创 BERT
Bert与Transform掩码语言模型(1.)对bert的基本原理做介绍(2.)Transformer 源码中 Mask 机制的实现GPT解读(论文 + TensorFlow实现)(3.)BERT源码分析2.美团BERT的探索和实践(1.)bert基本原理(2.)基于字做mask,基于词语做mask(3.)Bert模型性能调优(4.)模型结构...
2020-04-20 17:03:32 198
原创 pytorch安装
注:较特殊cuda9.0安装pytorch:https://blog.csdn.net/xnmc2014/article/details/853398221.Pytorch(一) Pytorch 的安装:https://blog.csdn.net/qq_23013309/article/details/1039656192.查看pytorch版本并匹配正确CUDA版本的方法:https...
2020-03-25 13:58:15 187
原创 vscode配置Python版本
1.如果anaconda,通过anaconda安装所需Python版本安装指定版本Python2.配置vscode所需Python版本配置重启vscode
2020-03-02 17:43:39 1376
原创 error: RPC failed; curl 56 OpenSSL SSL_read: SSL_ERROR_SYSCALL, errnffo 10054 atal: the remote end h
git clone https://github.com/XX/XX.gitgit clone 出错,提示信息为:error: RPC failed; curl 56 OpenSSL SSL_read: SSL_ERROR_SYSCALL, errnffo 10054atal: the remote end hung up unexpectedlyatal: early EOFfatal...
2019-12-16 10:51:24 211
原创 VScod下 git clone 项目地址 若下载不成功项目,可尝试如下操作
https://blog.csdn.net/Esc_Tab_End/article/details/84144063
2019-12-12 19:07:03 330
原创 CRF源码
获取模型的张量所有名称Tensorflow 中 crf_decode 和 viterbi_decode 的使用(实际举例计算,程序实现)
2019-12-02 10:49:52 385
原创 tensorflow-gpu安装(包括降级安装)
降级安装失败(原因):1.python为3.7版本,指定版本查找不到(tensorflow1.12);将python版本更改为3.62.安装tensorflow-gpu.1.12版本:pip install -i http://mirrors.aliyun.com/pypi/simple/ tensorflow-gpu1.12.0 --trusted-host mirrors.aliyun....
2019-11-15 17:13:10 1754
原创 数据库操作
1.查找最接近指定日期的数据select * FROM address_relation_test_0001 WHERE abs(create_time-convert(“20191107”,datetime))in (SELECT MIN(abs(create_time-convert(“20191107”,datetime))) FROM address_relation_test_000...
2019-11-08 10:35:51 97
原创 C4.5决策树中的连续值处理(取平均值进行分割)
C4.5决策树连续值处理rr={0.697:1,0.774:1,0.634:1,0.608:1,0.556:1,0.403:1,0.481:1,0.437:1}a=[0.243,0.245,0.343,0.36,0.403,0.437,0.481,0.556,0.593,0.608,0.634,0.639,0.657,0.666,0.697,0.719,0.774]# b=[0.244,...
2019-10-23 15:31:50 1145
原创 阿里妈妈搜索广告转化预测新手入门与lightgbm、xgboost
阿里妈妈搜索广告转化预测亚军解决方案阿里妈妈搜索广告转化预测___搜索广告数据探索与可视化数据天池- IJCAI-18 阿里妈妈搜索广告转化预测新手入门经历(一:数据预处理、特征工程)xgboost公式推导LightGBM原理及实现机器学习算法之LightGBMlightgbm原理以及Python代码...
2019-10-22 16:13:10 320
原创 链表排序_(快速排序,冒泡排序、节点交换)
1.0.快速排序_数组快速排序1.快速排序_链表2.0:链表值相邻节点交换:链表值相邻节点交换2.0:数组冒泡排序数组_冒泡排序2.冒泡排序_链表:链表冒泡排序...
2019-10-17 19:06:01 653
原创 V_决策树
决策树是通过一系列规则对数据进行分类的过程。它提供一种在什么条件下会得到什么值的类似规则的方法。决策树分为分类树和回归树两种,分类树对离散变量做决策树,回归树对连续变量做决策树。 决策树的优点:计算量简单,可解释性强,比较适合处理有缺失属性值的样本,能够处理不相关的特征; 缺点:容易过拟合(...
2019-08-06 17:53:13 135
原创 v_3_线性回归L1与L2正则化
机器学习监督算法的基本思路是 让拟合的模型尽量接近真实数据 。在这个过程可能存在两个截然相反的问题:过拟合和欠拟合。欠拟合是模型预测值与真实值之间误差较大,梯度下降就是讨论解决问题(求损失函数最小)。而正则化则是探讨过拟合的问题。正则化通过降低模型的复杂性,达到避免过拟合的问题。损失函数后面会添加一个额外项,常用的额外项一般有两种:L1正则化和L2正则化。L1正则化和L2正则化可以看做是损失...
2019-08-06 13:49:15 412
原创 v_2_线性回归似然函数(逻辑回归与似然函数)
假设:这里的error也就是模型和实际数值之间的误差值对于任意一个x(其中包括x1,x2…xn),总有其对应的y值。此时,线性回归的问题就变成了求解最小误差值的问题。高斯分布函数:误差项符合高斯分布:线性回归使用似然函数解释...
2019-08-06 12:39:01 982
原创 V_线性回归
tips:1.机器学习分为:监督学习,无监督学习,半监督学习(也可以用hinton所说的强化学习)等2.监督学习训练数据就是有标签数据,无监督学习训练数据就是无标签数据...
2019-08-06 12:31:04 365
原创 线性与回归知识点
1.斜率与梯度斜率定义为在曲线在一个点的切线,梯度定义为在曲线上曲线的法线方向。2.梯度下降方向?为什么梯度反方向是函数值下降最快的方向?梯度是一个方向向量,若α是函数在某点的梯度,那么函数在该点沿着α方向的变化最快;下降的方向:由于随着越接近最小值,函数切线的斜率逐渐变小。这就是下降的方向。3.梯度下降算法假设我们位于黄山的某个山腰处,山势连绵不绝,不知道怎么下山。于是决定走一步算...
2019-08-05 15:08:10 489
原创 SVM小知识点
1-凹函数Y=X^2是凹函数因为y的导数是2x,二阶导数是2>02.拉格朗日(1)拉格朗日对偶问题一般是凹函数(求最大值),即使原问题是非凸的,变成对偶问题更容易优化求解(2)拉格朗日对偶函数一定是凹函数(3)凹函数一般都有极大值...
2019-08-05 14:44:18 280
转载 三数之和为0(leetcode:15)
给定一个包含 n 个整数的数组 nums,判断 nums 中是否存在三个元素 a,b,c , 使得 a + b + c = 0 ?找出所有满足条件且不重复的三元组。 注意:答案中不可以包含重复的三元组。 例如, 给定数组 nums = [-1, 0, 1, 2, -1, -4], 满足要求的三元组集合为:[ [-1, 0, 1], [-1, -1, 2]]解题思路讲解1:首先安...
2019-06-13 15:06:44 483
原创 二分查找
二分查找def midFind(arr,target): # 二分查找 # [2,3,4,5,6] low,high=0,len(arr)-1 while low<high: mid=(low+high)//2 if arr[mid]>target: high=mid-1 eli...
2019-06-12 19:18:07 178
原创 在一个有序的旋转数组中,查找给定值
题目描述有一个排过序的数组,包含n个整数,但是这个数组向左进行了一定长度的移位,例如,原数组为[1,2,3,4,5,6],向左移位5个位置即变成了[6,1,2,3,4,5],现在对于移位后的数组,需要查找某个元素的位置def find(nums,target): low,high=0,len(nums)-1 mid=(low+high)//2 if num...
2019-06-12 19:09:33 1397 2
原创 给定两个单词 word1 和 word2,计算出将 word1 转换成 word2 所使用的最少操作数 。
示例 1:输入: word1 = "horse", word2 = "ros"输出: 3解释: horse -> rorse (将 'h' 替换为 'r')rorse -> rose (删除 'r')rose -> ros (删除 'e')示例 2:输入: word1 = "intention", word2 = "execution"输出: 5解释: i...
2019-06-12 19:07:31 5435
原创 两个栈实现一个队列
#进栈:元素入队列A#出栈:判断如果队列A只有一个元素,则直接出队。否则,把队A中的元素出队并入队B,直到队A中只有一个元素,再直接出队。为了下一次继续操作,互换队A和队B。class Solution: def __init__(self): self.stackA = [] # stackA用来保存进队的元素 self.stackB = [] #...
2019-06-10 16:47:18 94
原创 从尾到头打印链表
输入一个链表,按链表值从尾到头的顺序返回一个ArrayList。class listNode: def __init__(self,data): self.data=data self.next=Noneclass List: def __init__(self): self.head=None def headInser...
2019-06-10 15:54:58 83
原创 替换空格
请实现一个函数,将一个字符串中的每个空格替换成“%20”。例如,当字符串为We Are Happy.则经过替换之后的字符串为We%20Are%20Happy。class Solution: # s 源字符串 def replaceSpace(self, s): return s.replace(' ',"%20")...
2019-06-10 15:53:20 93
下载nltk_data.zip
2019-12-19
tensorflow-1.14.0-cp37-cp37m-_amd64win_amd64_amd64aaaa.zip
2019-09-17
tensorflow-1.4.0-cp27-cp27m-macosx_10_11_x86_64.whl
2019-06-18
从零起步搭建Hadoop单机和伪分布式开发环境图文教程.
2016-01-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人