算法
文章平均质量分 85
一杯拿铁go
好记性不如烂笔头
展开
-
ChatGPT笔记
把微调好的SFT模型去回答prompt dataset某个问题,然后通过收集4个不同的SFT输出而获取4个回答,接着人工对这4个回答的好坏进行标注且排序,排序的结果用来训练一个奖励模型RM,具体做法就是学习排序结果从而理解人类的偏好。模型使用与 GPT-3 相同的预训练数据集,但进行了额外的微调,从而更擅长以下两点:更擅长上下文学习、对话可以生成更加符合人类期待的反馈。所谓的语言模型的训练,其实就是让模型调整候选句对应的概率,使我们人类希望输出的候选句的概率尽可能大,而不希望输出的概率尽可能小。原创 2023-02-15 19:23:46 · 5414 阅读 · 0 评论 -
布隆过滤器
主要作用:根据给定的布隆过滤器判断值是否存在。尤其适用于当数据量非常大时的判断。但是会存在一定的误判率,属于是牺牲了准确率来提升判断速度和节省存储空间。原理是将数据映射到一个很长的二进制向量上,通过查询映射数据在二进制向量的存在情况来判断数据是否存在。核心概念是若k哈希函数和一个长度为m的超大的位数组。添加时将元素通过函数函数得到k个值,然后将位数组上的这个k个位置置为1;判断元素时,同样通过函数得到k个值,然后判断在位数组上着k个位置是不是都是1,如果不是那数据肯定不存在,如果是那数据可能是存原创 2021-01-15 12:13:37 · 200 阅读 · 0 评论 -
Doc2vec的原理以及实战demo
一,测试demo代码如下:from gensim.test.utils import common_textsfrom gensim.models.doc2vec import Doc2Vec, TaggedDocumentdef doc2vec_demo(): # 得到文本训练数据 documents = [TaggedDocument(doc, [i]) for...原创 2019-08-14 15:24:07 · 1112 阅读 · 0 评论 -
【机器学习】SVM漫谈
SVM对于中小规模的数据来说是非常好的模型。由于其可以用数学严谨的推导出结果,可解释性比较强,所以在工业上应用的比较广。一,SVM的推导简单起见先考虑SVM在线性的二分类中的应用。 如图1所示svm的目的就是找到一条直线能够很好的将正、负样本“很好的”分开。这个“很好的”是指对于样本的鲁棒性比较好,及时样本点受到一点噪声也不会影响分类的结果,比较直观的看就是正负样本点离分割线的距离比较远。这就是s原创 2017-10-16 10:37:16 · 519 阅读 · 0 评论 -
均方误差、平方差、方差、均方差
简述均方误差、平方差、方差、均方差、协方差原创 2017-10-15 11:21:20 · 9098 阅读 · 0 评论 -
【C++】2015去哪网笔试题目:译码
2015去哪网笔试题目原创 2015-05-11 19:44:50 · 445 阅读 · 0 评论 -
【机器学习】SVM浅谈
SVM对于中小规模的数据来说是非常好的模型。由于其可以用数学严谨的推导出结果,可解释性比较强,所以在工业上应用的比较广。一,SVM的推导简单起见先考虑SVM在线性的二分类中的应用。图1如图1所示svm的目的就是找到一条直线能够很好的将正、负样本“很好的”分开。这个“很好的”是指对于样本的鲁棒性比较好,及时样本点受到一点噪声也不会影响分类的结果,比较直观的看就是正原创 2017-05-09 14:20:39 · 821 阅读 · 0 评论 -
【机器学习】浅谈聚类算法
聚类是一种非监督式学习算法,聚类不要求源数据集有标签,聚类一般应用于做数据探索性分析,聚类算法的结果是将不同的数据集按照各自的典型特征分成不同类别,不同人对聚类的结果解读可能不同;本文主要讲述了k-means,k-means++以及学习向量量化原创 2017-05-08 16:01:33 · 616 阅读 · 0 评论 -
浅析贝叶斯
贝叶斯定理的关于随机事件A和B的条件概率(或边缘概率)的一则定理,其主要陈述的是在通过A条件下B发生的概率(即P(B|A))来求解B条件下A发生的概率(即P(A|B))。其基本公式如下:朴素贝叶斯的思想基础是:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。 一,符号约定: x={a_1,a_2,…,a_m} 为一个待分类项,而a为原创 2017-04-21 15:44:49 · 329 阅读 · 0 评论 -
【python】在pycharm初次使用的时候出现错误:no python interpreter configured for the project
在pycharm初次使用的时候出现错误:no python interpreter configured for the project意思是说没有找到python解释器。那我们添加Python解释器即可。保存。原创 2017-07-03 10:32:52 · 4181 阅读 · 0 评论 -
【Python】list数组赋值
list数组对于python带来了很大的方便,在数组中存入数据时不用有那么多的顾虑,但是对list数组赋值时要特别的注意,若是赋值不当很容易会改变原数组的值。1,对一维数组来说使用赋值符号会影响原数组如下代码:li_a=[2,3,4,6,8]li_c=li_ali_c[0]=11li_c[1]=11print(li_c)print(li_a)将一维数组li_a赋值给数组li_原创 2017-02-03 21:50:41 · 40739 阅读 · 0 评论 -
【Python】python对齐问题的总结
Python的对齐方式很重要,对齐方式决定了函数或者判断条件的作用域。def print_circle(matrix,up_hang,up_lie,down_hang,down_lie): result=[] if up_lie==down_hang and down_hang==down_lie: result.append(matrix[up_原创 2017-02-02 23:15:28 · 14719 阅读 · 0 评论 -
【Python】旋转打印各种矩形
打印旋转矩阵应该是很经典的算法问题了。题目描述如下:给定一个m * n要素的矩阵。按照螺旋顺序,返回该矩阵的所有要素。思路:1,先定义矩阵的左上和右下的坐标,然后通过两个坐标来打印这一圈矩阵; 2,将左上的坐标下右下移动,右下的坐标向左上移动,来缩小打印圈,进行下一圈矩阵的打印; 3,一直缩小打印直到结束。代码:def print_circle(matrix,u原创 2017-02-02 23:30:16 · 2345 阅读 · 0 评论 -
对有向图的环的判定,并且输出图中所有的路径 C++算法
说明:我们选择的图是有向图,图的存储方式是邻接矩阵,使用C++语言,基于vs2010平台算法思想:逐个对图中的出度不为0的点进行遍历。假如是先对图A节点进行遍历:首先,将A节点所连接的点存储在数组vect1中,然后对A节点进栈,并对A节点的连接点进行深度优先。当节点的出度为0时,出栈,出栈的时候判断该节点是不是在vec1中的元素,如果是则为环,若不是则不是环。 代码:#incl原创 2015-09-11 18:16:07 · 10559 阅读 · 3 评论 -
图像处理.surf,算法,图像处理
在对surf编码完成之后,对surf进行改进。将图像在邻域内相交的特征点连接起来。两两比较特征点的半径(scale)之和r与其距离d的大小。若d小于r,说明这个特征点有交集,连接两个特征点,否则,没有交集。加入的代码如下:void getPointRelation(IplImage *img,std::vector &ipts){ int i=0,j=0; int n=ipts.原创 2015-08-17 17:32:42 · 1497 阅读 · 0 评论 -
【图像处理】对opencv的配置
对opencv的配置原创 2015-08-16 22:13:30 · 458 阅读 · 0 评论