- 博客(380)
- 资源 (17)
- 收藏
- 关注
原创 【大模型推理】GPT2模型深度剖析(最清晰透彻、通俗易懂、精确到各个算子)
下方是GPT2的架构整体,包括嵌入层、归一化层,多头注意力机制、前馈神经网络层,以及最后的argmax操作(Vec2Word部分)。我们将对各个算子作详细透彻地解读。彩蛋:GPT2数据流程的原始操作在此处:https://download.csdn.net/download/qq_37150711/89648003。
2024-08-17 22:53:13 468
原创 【安全多方计算之FSS】通俗易懂理解函数秘密分享——FSS(一)
通俗理解函数密码分享,形象生动地介绍了函数密码分享的前世今生,后续将陆续推出FSS的底层原理和深度哲学。
2024-05-20 14:21:33 1576 2
原创 离线装docker和相关应用保姆级教程——以安装docker-jupyter/notebook为例
离线安装docker以及相关应用的保姆级教程
2023-06-05 11:42:23 2914 2
原创 使用windows的python-faiss库报错指南
windows的python-faiss库的常见报错指南,在conda虚拟环境中可以使用该库
2023-02-23 14:01:54 1927
原创 【Python技术难题】Python中准确测量对象占用的内存大小——解决sys.getsizeof测不准和不起作用
在Python中如何准确测量对象占用的内存大小——彻底解决sys.getsizeof测不准和不起作用这一技术难点,这个问题是困扰很多编程新手的问题。
2022-12-29 16:22:09 1259
原创 【实体关系抽取】OneRel和TPLinker两篇方案的不同之处
实体关系一次性抽取论文——《OneRel》和《TPLinker》所采用的方法是不同的,如果真的像OneRel实验部分所表述的那样,那么OneRel是非常有价值的一次探索,它从图嵌入技术中得到启发,改变了边和关系的交互方法,理应效果好一些。但是想使用到工业上的话,还有很长的一段路要走。
2022-10-17 14:29:13 2800
原创 NLP应用:情感分析和自然语言推断
重点介绍如何应用 DL表征学习*来解决NLP问题;讨论两种经典的 NLP任务:情感分析(针对单个文本) 和 自然语言推断(针对文本对)
2022-05-06 03:30:30 1789
原创 基于CRF的医疗实体识别baseline
基于CRF的医疗实体识别baseline,数据中共包含5种实体:治疗、身体部位、疾病和诊断、症状和体征、检查和检验。可用于多种NLP下游任务。
2022-04-21 16:58:26 2852 7
原创 【数学建模】我的数模记忆
我的数模记忆 夜幕暗淡,窗前竟已是点点灯光。在截止日的最后一天,就要毕业的我还是决定来记录一下过去这几年数学建模的点点滴滴。 在2016年春季的一堂高数课下课前,黄老师正鼓励班上所有人都积极参加学院组织的数学建模,依然是用那平和的语调,但却一直令我受到鼓舞,最后他说:“你们的现状是三年前的你们所造就了,如果你们想要三年后不再后悔,那么现在就必须努力学习。”的确,参加数学建模竞赛就是一个很好的开始,从那次报名校赛之后,我便从寻找队友组队、带领团队学习数模知识、共同参与学校培训、督促和鼓舞队友等方面学到
2022-04-21 02:37:00 486
原创 知识图谱综述(三)
知识图谱综述(三)论文原文链接这部分为数据图(页码4)部分,主要包括了:图结构数据模型的介绍:有向边标签图(多关系图)、异构体、属性图、图数据集、其他图数据模型、图存储;查询(语言):图模式、复杂的图模式、导航图模式、其他特性。下文的每一小点即论文中的一个段落。任何KG的建立都要事先将数据抽象成图模型,本章选取一些在实际中常用的图结构数据模型来表示数据图。然后,我们在图查询语言的基础上,讨论了此类数据图的查询原语。一、图结构数据模型撇开图表不谈,先假设我们所呈现示例中的旅游
2022-04-15 01:18:15 1617
原创 知识图谱综述(二)
这部分为《知识图谱大综述》引言(页码1)部分,主要包括了六点内容:相关工作、KG的概念、KG的应用、本文使用的例子(智利的旅游业)、KG综述文献对比、本文结构。
2022-04-10 18:59:48 791
原创 解决seq2seq+attention机器翻译中的技术小难题
1 源码首先上源码:https://github.com/keon/seq2seq通常我们使用这个源代码来学习机器翻译的模型架构,但是会遇到诸多小技术问题。2 python -m spacy download en 提示服务器连接一直失败安装不上官方描述的以下命令行是无法使用的,会出现连接不上的错误:python -m spacy download depython -m spacy download en于是乎,需要使用这两个包de_core_news_sm-2.3.0.tar.gz和en
2022-02-26 15:09:50 712
原创 Win10启动VMware虚拟机开机秒蓝屏问题完美解决
大家在工作中都常用到虚拟机,本人也是。但是用了虚拟机工作了一段时间后,经常发现开机秒蓝屏,我遇到过两三次了,网上的教程也是良莠不齐,不能彻底解决这个问题,于是今天打算彻底解决这个问题。不废话,直接上教程。一定要看完,最后一步是关键!1 操作控制面板右键windows图标,点击搜索,搜索“控制面板”,点击右上角的“大图标”或者“小图标”显示,点击“程序和功能”,如下图操作:接下来,按照下图操作。2 操作此电脑的“服务”右键“此电脑”。点击“管理”,按照下图依次操作:然后直接禁用“HV .
2021-11-23 09:52:20 80635 56
原创 win10 + neo4j + jdk 完美安装教程 欲哭无泪贴!!教你彻底卸载老的jdk!
本安装必须按照版本来,否则后果自理!!!!一、安装Java环境1.0 jdk-13.0.2 一定是要这个版本1.1 在系统变量里新建"JAVA_HOME"变量,变量值例如为:C:\Program Files\Java\jdk1.8.0_60(根据自己的jdk的安装路径填写)1.2 在系统变量里新建"classpath"变量,变量值为:.;%JAVA_HOME%\lib;%JAVA_HOME%\lib\tools.jar (注意最前面有一点)1.3 找到path变量(已存在不用新建)添加变量值:
2021-09-06 21:09:28 2458 2
原创 人这一生啊
Helloworld说:我家庭出身不好,农村娃,拉过犁子,割过麦子那种。 父母在小县城卖点菜。回去就是和他们一起睡,读研之前,基本没有过自己房间,挺苦的,他们文化水平低,也意识不到人个人成长独立性要求。 我吧,我感觉我也一点点争气。农村进县城读初中时候,千人考试考第四,abc仨城市都考上了,去了c,他们卖菜的地方。 中考,abc仨高中都考上了,也去了c。现在知道了a全国排名99,bc全国排名450+。 高中呢,就找不到方向,爸妈给我说多交朋友,我的经验值就在刷社交,然后学习落下了。高考g了,30
2021-09-06 16:51:45 239
原创 通俗解析KMP算法和next函数(小学生都能懂!!!!)
1 目标搞任何算法前我们需要搞清楚目标,我们的目标是:给定一个文本串和一个模式串,从文本串里面找第一次出现的模式串。特别地,找不到就返回-1,模式串为空则返回。例如:kmp(‘aadaadaaf’, ‘aadaaf’) = 32 概念我们学习模式串匹配文本串之前,必须明确几个重要的概念:文本串:一个长字符串,里面可能有模式串,如aadaadaaf。模式串:一个比文本串短的字符串,它可能蕴含在文本串中,如aadaaf。前缀:一个字符串的子串(去除最后一个字符)。如aad的前缀:a,
2021-09-05 18:25:31 602
原创 2021-09-03 爬虫模板(只支持静态页面)
# -*- coding: utf-8 -*-# @Time : 2021/9/3 21:32# @Author : Yj Xue# @FileName: entity_car.py# @Software: PyCharm 2020.2.2 x64# @Blog :https://blog.csdn.net/qq_37150711/category_9396602.htmlfrom requests_html import HTMLSessionfrom requests_ht
2021-09-03 22:26:54 195
原创 python实现打乱文件夹里的文件顺序/文件随机排列
最近因为一些图片文件保持新鲜感(嘻嘻~),所以希望图片能够随机排列,我发现通过window10的文件资源管理器无法实现随机排序,因为几万张图片总有几十张图片的属性是极其相似的。此blog通过python实现图片(或者其他文件)的随机排序,唯一的坏处就是排序后的文件名会被修改。废话不多说,直接上干货,以下是完整可运行代码!但是小伙伴们注意可能需要修改若干个地方!使用方法:创建一个空白的txt文件到image文件夹的同级目录下,重命名该txt文件为“a.txt”,然后将下面代码复制到这个txt文件,再.
2021-08-21 01:45:19 6959 9
原创 win10完美安装cuda11.x + pytorch 1.9 (血流成河贴┭┮﹏┭┮)让你的torch.cuda.is_available()变成True!
当大家有一个小梦想要搞人工智能的时候,甚至要搞深度学习的时候,屁颠屁颠地买重金买来一个N卡的机器之后,却发现你的torch.cuda.is_available()居然是False!顿时泪奔o(╥﹏╥)o,当你忙活大半天之后发现一无所获之后,让你顿时有了砸电脑的想法。对,这篇blog就是来帮你解决这个困惑,让你重拾深度学习的信心与动力!!!0 先看看你的GPU支不支持cuda,一般来说N卡是支持的。0.1 右键任务栏,打开任务管理器,看看自己的卡的型号。0.2 打开N卡官网,滑到官网首页最下面,找.
2021-08-09 07:47:22 5365 7
原创 Python基础综合训练(四)自动发送邮件
废话不多说直接上代码!#!/usr/bin/python3.7# -*- coding: utf-8 -*-# @Time : 2021/7/7 1:08# @Author : Yujie_Xue# @Email : xyj19970628@163.com# @File : 14.7 发送有附件的邮件.py# @Software: PyCharm 2019.1from smtplib import SMTPfrom email.header import Header
2021-07-07 01:48:05 164
原创 Python基础综合训练三(tkinter牛刀小试)
1 目的了解Python GUI编程;熟悉GUI编程的大致流程;熟悉组件和用户行为交互的方式。2 GUI编码流程基本上使用tkinter来开发GUI应用需要以下5个步骤:导入tkinter模块中我们需要的东西。(导包)创建一个顶层窗口对象并用它来承载整个GUI应用。在顶层窗口对象上添加GUI组件。通过代码将这些GUI组件的功能组织起来。进入主事件循环(main loop)。3 牛刀小试——修改label的内容和颜色***注意confirm_to_quit中需要最后加入“ ex
2021-06-24 18:28:54 765 6
原创 Python基础综合训练二(21点扑克牌大战)
1 游戏规则百度参考21点的游戏规则。2 目的学习类中私有属性构建方法(封装内部属性,只允许外部访问,防止外部篡改值);学习继承父类;学习对抽象类的具体化方法;学习多态的实现方法。3 代码#!/usr/bin/python3.7# -*- coding: utf-8 -*-# @Time : 2021/6/24 15:05# @Author : Yujie_Xue# @Email : xyj19970628@163.com# @File : 9.5 puk
2021-06-24 16:51:24 563
原创 Python基础综合训练一(杨辉三角的打印)
1 写作动机答案太过于敷衍了事,自己重新编码了一下。2 答案参考代码#!/usr/bin/python3.8# -*- coding: utf-8 -*-# @Time : 2021/6/23 11:24# @Author : Yujie_Xue# @Email : xyj19970628@163.com# @File : 7.6 yanghui_angle_answer.py# @Software: PyCharm# 答案太垃圾!!根本没有体现出杨辉三角的性质de
2021-06-23 11:34:28 416
原创 Pyqt5 遇到的超级无敌大坑!clicked.connect后面的connect出现下划线 & 计算机积极拒绝问题
1 计算机积极拒绝问题这类问题真的好幼稚,我是没有启动服务器文件,所以这样。。。。还有就是服务器堵塞宕机了;端口被占用,打开cmd,输入netstat -ano, 查看端口是否被占用,总之就是计算机找不到这个ip下的端口服务器。2 clicked.connect后面的connect出现下划线这个问题其实很简单,千万不能把库里面所有的包都导入,否则会有重名包会有冲突,视频教程里面真的是坑!3 总结发现出错的时候觉得非常恼火,本来看起来不应该出错的,结果就发生了,找到原因了,又觉得好
2021-05-16 15:33:46 7730 2
原创 2 构建红楼梦关系图谱
1 导入相关的包import csvimport py2neofrom py2neo import Graph, Node, Relationship, NodeMatcher2 连接neo4j知识图谱数据库g = Graph('http://localhost:7474', user = 'neo4j', password = 'neo4j') # 此处为系统默认的密码3 导入数据并构建知识图谱with open('triples.csv', 'r', encoding='utf-8')
2021-05-14 15:43:05 766 2
原创 1 知识图谱快速入门
0 前言知识图谱属于一种特殊的结构化数据,具有良好的可读性;知识图谱是高效知识检索系统的一部分,摒弃的非结构化数据(如文本)的低效性;知识图谱的数据集来自于非结构化数据,其得益于自然语言处理的一系列流程(如:词性标注,命名实体识别,实体消歧等),自然语言处理之后的非结构化数据可以存放在csv等结构化数据数据库中,常常以三元组的形式存放,还可以存放属性。1 安装JDK方法自行度娘:先在官网下载最新的JDK,然后添加环境变量,最后如果运行不了neo4j的话,就重新安装老版本的JDK。2 下载
2021-05-14 14:48:24 495 1
原创 软考高级《信息系统项目管理师》(简称高项)考证经验(满满的干货)
1 写作动机深夜睡不着,打算写这样一篇文章,纪念这半年以来(2020年5月底-2020年11月07日)考证生涯的我。各位也可以参考本人的考证经历,可供参考。2 考证动机本人大学三年级一次性考过了软考中级《网络工程师》,顺便看完了谢希仁老师的《计算机网络》,盲目地刷完了最近十年的真题,考完感觉很难没有什么胜算,因为配置语句都记不太熟练,纯粹的题海战术。结果是:上午选择题是50,下午案例分析题是51。因此抱着想考一个高级的想法,在研究生阶段想通过这个神秘的高级考试。其实还有一个动机:那就是疫情在家感觉
2021-02-04 04:33:22 21627 39
原创 密码学——保序加密算法(OPE算法-2009年提出)通俗易懂解析(小学生都能懂!)含python代码
保序加密算法(OPE算法-2009年提出)通俗易懂解析(小学生都能懂!)一、 预备知识保序加密算法:最初是由2009年,Boldyreva等四个人提出来的,可简称BCLO-09算法,论文题目为。。。。。。。,请自行搜索并下载,本文直接让你读懂该论文的核心算法。算法目的:简单来说就是本来有顺序的明文,加密之后依然保持顺序,但是除此之外不知道任何信息。简单来说,我要加密2,5,8三个数字,我把它们分别换成45,4424,22224,这样就保证了别人不知道我原来的数字,但是又保持了原来的顺序,但是我们必须
2020-12-17 22:52:20 12637 4
原创 4 复习神经网络——FizzBuzz游戏
1 构建这个游戏标签的一些方法def fizz_buzz_encode(i): if i % 15 == 0: return 3 elif i % 5 == 0: return 2 elif i % 3 == 0: return 1 else: return 0 def fizz_buzz_decode(i, prediction): return [str(i), 'fizz', 'buzz
2020-11-01 18:56:01 322 1
原创 3 神经网络学习——最后两次改进
1 第四次改进——optim更新参数import torchimport torch.nn as nnimport torch.nn.functional as Fimport numpy as npimport pandas as pdimport random, mathimport sklearnimport scipyN, D_in, H, D_out = 64, 1000, 100, 10x = torch.randn(N, D_in)y = torch.randn(N
2020-11-01 14:06:52 202
原创 2 神经网络学习——对numpy手敲神经网络的三次改进
1 第一次改进——修改成torch语法1.1 初始化部分import torchimport torch.nn as nnimport torch.nn.functional as Fimport numpy as npimport pandas as pdimport random, mathimport sklearnimport scipy# 大小定义N, D_in, H, D_out = 64, 1000, 100, 10# 变量初始化x = torch.randn
2020-10-30 17:06:57 151
所有neo4j-community-3.x老版本下载
2023-02-06
protege 5.5 实现动物animal推理项目,并且带注释
2022-06-29
该软件经过整合,是目前最新的protege5版本,可以让你直接不需要任何jdk,就可以直接运行非常方便。
2022-06-20
de-core-news-sm-2.3.0.tar.gz和en-core-web-sm-2.2.5.tar.gz
2022-02-26
命名实体识别命名实体识别ner-dataset.7z
2020-07-29
pycharm中文补丁可打开设置.zip
2020-07-11
历年全国研究生数学建模竞赛赛题合集(04-19年).zip
2020-07-07
itchat替代品中的msgDB.py
2020-06-04
LADR1007B-win.zip
2020-04-24
18 深度学习案例-基于卷积神经网络的手写体识别数据集.zip
2020-04-17
17 机器学习案例——基于朴素贝叶斯算法的文本分类(垃圾邮件过滤)的数据集
2020-04-11
itchat替代品.7z
2020-03-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人