自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 收藏
  • 关注

原创 大模型-GLM-130B

大模型,LLM,GLM-130B,GPT

2023-10-06 18:47:20 244

原创 图像描述生成(image caption)

图像字幕、图像处理、文本生成

2023-05-14 14:29:35 2805

原创 推荐系统之召回

学习推荐系统召回

2023-05-12 12:25:55 383

原创 图文结合-ViLBERT

图文结合,自然语言处理、多模态学习、双流模型

2022-12-23 23:03:10 580

原创 图文结合-LXMERT

图文结合、单流模型、交叉注意力、LXMERT

2022-12-16 23:07:11 349

原创 图文结合-UNITER

自然语言处理、多模态、图文结合

2022-12-12 18:07:06 349

原创 图文结合-ViLT

自然语言处理,多模态

2022-12-12 11:13:59 408 1

原创 图文结合-SOHO

多模态,自然语言处理,图文结合

2022-12-11 10:27:41 265

原创 中文文本分类

基于bert的中文文本分类,数据处理

2022-12-10 15:58:11 309

原创 GBDT学习笔记

GBDT算法

2022-12-09 17:20:15 248

原创 TinyBERT-模型蒸馏

模型蒸馏

2022-12-09 13:19:52 319

原创 tf1-estimator的使用

estimator的使用

2022-12-09 11:24:23 1027

原创 图文结合-imagebert

图文结合

2022-12-08 17:27:20 428

原创 KBERT-给模型引入知识图谱

知识增强,外部知识接入bert

2022-12-08 17:16:59 418

原创 关于笔记本电脑无法连接到网络

前言解决笔记本电脑无法连接wifi的小技巧。大致说明下情况。原因今天打算写写代码,打开笔记本后发现wifi无法连接。笔记本为华硕天选,win10。具体情况如下:(1)笔记本左下角存在网络图标(win10是地球仪,之前版本的Windows是类似信号的图标)(2)点击图标可以搜索到每个wifi,也就是可以正常搜索wifi(3)点击连接网络,无法连接到之前记忆的网络,手机端可以正常连接,其他电脑可以正常连接;尝试连接其他网络,不行;尝试连接手机热点,不行。由此,可以得到一个结论,这必定电脑本身的问题

2021-07-29 22:55:48 11858 11

原创 异常检测4

task4:基于邻近度的方法1基于距离的度量基于距离的异常检测有一个前提假设,即异常点的k近邻距离要远大于正常点。一般使用嵌套循环就可以实现。第一层遍历每个数据,第二层循环进行异常判断,需要计算当前点到其他点的距离,一旦已识别出多于k个点与当前点的距离在D内,则将该点标记为非异常点。这样计算的实间复杂度为O(N*(N-1))。当数据量较大时,需要修剪方法以加快距离的计算。1.1基于单元格的方法在基于单元格的方法中,数据空间被划分为单元格,单元格的宽度是阈值D和数据维数的函数。具体地说,每个维度被划分

2021-05-21 01:15:25 166

原创 异常检测3

task3:线性相关方法1前言真实数据集中不同维度的数据通常具有高度的相关性,这是因为不同的属性往往由相同的基础过程以密切相关的方式产生的。在古典统计学中这被称为回归建模,一种参数化的相关性分析。一类相关性分析试图通过其他变量预测单独的属性值,另一类用一些潜在变量来代表整个数据。前者的代表是线性回归,后者的一个典型例子是主成分分析。需要明确的是,这里有两个重要的假设:假设一:近似线性相关假设。线性相关假设是使用两种模型进行异常检测的重要理论基础。假设二:子空间假设。子空间假设认为数据是镶嵌在低维子

2021-05-17 21:13:54 124

原创 异常检测2

task2:基于统计学的异常检测1.概念异常检测的统计学方法有两种:参数方法:假定数据对象由以Θ为参数的参数分布产生,该参数分布的概率密度函数f给出对象x在该分布下出现的概率,该概率值越小,说明是异常值的可能性越大。非参数方法:不假定先验统计模型,从输入数据确定模型。非参数方法并非无参数,其通常假定参数的个数和性质都是灵活的,不预先确定。2.参数方法2.1基于正态分布的一元异常点检测首先,假定数据分布符合正态分布,然后通过输入数据学习正态分布的参数,并把低概率的点作为异常点。下面是通过输入来

2021-05-14 23:21:24 275

原创 异常检测1

task1:异常检测相关概念1.概念异常检测:根据领域的不同又不同的概念,如,对于数据处理,就是检测异常数据;对于图像处理就是检测出异常图片;在工业上,对于零部件的检测等等,都属于异常检测。以数据处理为场景,异常可以分为多个类别,点异常、条件异常与群体异常。点异常:指个别数据的异常条件异常:又称上下文异常,是指在特定条件下个体实例出现异常,在其他条件下是正常的,比如,在特定时间下的温度突然上升或下降群体异常:群体集合中的个体实例出现异常的情况,而该个体实例自身可能不是异常2.异常检测方法2.

2021-05-11 22:47:25 112

原创 基于感知器的手写数字识别

1原理介绍本次实验要求使用线性分类器实现手写数字识别,线性分类器选择的是感知器模型。基于感知器的实验数据必须是线性可分的,感知器不仅可以使用在二分类还可以使用在多分类。不过,在二分类与多分类的算法实现过程略有不同。这些不同主要体现在权重更新与判别超平面的实现两个方面。1.1二分类将数据分为两类。首先,要求数据是线性可分的;然后,选择初始权重,通过训练集实现对权重的更新;接着,使用更新后的权重实现对测试集的识别;最后,将识别结果与测试数据的标签进行比较,得出正确率。上图是感知器的损失函数,该损失函数表

2021-01-08 01:14:53 1759 6

原创 升级pip时报错ValueError: Unable to find resource t64.exe in package pip._vendor.distlib

#1升级pip时报错ValueError: Unable to find resource t64.exe in package pip._vendor.distlib#2解决办法python -m pip install --user --upgrade pip加上–user,就可以解决注:这里参考的一位up主的视频链接:https://www.bilibili.com/video/av202973137...

2020-12-09 01:00:06 4293 17

原创 python+selenium实现微博自动登录+用户微博信息爬取

1主要内容目的:实现微博的自动登录,实现对某个用户所发微博的时间,客户端,文案,转发数,评论数以及点赞数的爬取。难点:如下图所示:这个微博时是用户转载的自己以前的博文,而且在对目标信息进行爬取时会出现两个不一样的信息,由于我最后会将这个信息形成列表进行提取,所以会出现时间,客户端,文案,转发数,评论数以及点赞数不匹配的情况,所以需要将爬取到的多余的信息删除。需要分辨出哪个是多余的信息,这里两个时间以及客户端的节点元素信息是一样的并且在同一个div下面,所以无法从HTML的角度着手;而另外的三个信息由

2020-11-14 12:07:43 2427

原创 基于python里selenium库的信息盒爬取

1.以百度百科为信息来源爬取信息盒百度百科爬取信息是根据输入name,然后点击进入词条按钮,实现对目标内容的爬取,所以可以将所要查找的内容name先写入一个文本文件,然后遍历文件,实现对每一个name的搜索。搜索到内容后,找到信息盒节点的元素,对信息盒内容进行爬取,最后将爬取的内容写入文本文件保存。如图便是一个信息盒的内容。我所做的就是爬取这个内容,然后将内容按顺序输出。1.1建立所要爬取的信息目录文本文件将自己所要搜索的东西先写入文本文件,然后实现遍历如上图所示,之所以竖着写是为了可以使用l

2020-11-09 12:36:00 367 1

原创 基于python中selenium库,实现百度账号的自动登陆

如何实现自动打开百度网页并登录账号首先使用chmore浏览器自动打开百度页面,然后寻找到登陆按键的节点元素,并实现点击。接着,找到用户名登陆的节点元素,实现扫码登陆到用户名登陆的切换。然后,找到用户名一栏的节点元素,自动输入用户名,找到密码一栏的节点元素,自动输入密码,找到登陆button的节点元素,自动按下按键。下面一布是针对需要进行短信验证的情况,此时会弹出短信验证窗口,找到发送短信的节点元素,并实现点击,手动填入接受到的验证码,并找到登陆button的节点元素,点击。成功登陆账号后,在搜索框输入指定

2020-11-08 12:02:17 974

原创 Python:手写数字识别

#基于朴素贝叶斯分类实现对手写数字体的识别朴素贝叶斯分类就是基于先验概率,类条件概率以及后验概率的分类,后验概率可以由先验概率与类条件概率来求得。下图是书本上一段关于朴素贝叶斯方法的介绍:由于在对每一类的样本进行识别时,一般都会使每个类型的样本数都保持一致,所以一般来说先验概率可以取值0.1。对于类概率密度的求法则相对复杂,如上图所示,wi代表每个不同的类型,也就是0-9这十个类型,X则表示每一个样本的特征向量,可以理解为X这个向量就可以将数字图片表示出来,然后对于一类数字的类条件概率则是通过对同一类

2020-10-27 21:23:09 1022

原创 python.tensorflow

python.tensorflow@[关于使用python.tensorflow时出现finished with exit code -1073740791 (0xC0000409)报错的一个解决方案]欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器

2020-10-12 11:00:21 108

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除