自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

夏小悠的博客

一位喜欢薰衣草的工科男^_^

  • 博客(121)
  • 资源 (7)
  • 收藏
  • 关注

原创 微信公众号上部署自己训练的聊天机器人(腾讯云服务器+TensorFlow2.1+Django3.1)

本篇博客主要介绍一下Seq2Seq模型,以及模型训练后的部署,使用的深度学习框架为TensorFlow2.1,GPU为Tesla P100(白嫖Kaggle的),由于网站有时间限制,只训练了两个epoch就先部署了哈,所以机器人目前还很沙雕。

2021-01-10 22:08:43 3749 14

原创 Python爬虫:逆向分析某云音乐加密参数

本篇博文通过对网易云音乐进行逆向分析,用Python代码模拟了AES和RSA加密过程,并在文章的末尾提供了一些参数,可以用这些参数来获取歌曲对应的歌词及用户的评论。

2020-09-22 14:43:33 48323 183

原创 Python爬虫:博客被抄袭了还不知道?快来查查

本篇博文通过分享一个自己写的博客查重程序,对百度和微信公众号进行文章搜索,然后用doc2vec将网页向量化,通过余弦相似度对相关网页进行相似度分析,并保存相似度高的文章链接,以便后面的版权申诉。

2020-09-20 01:10:12 13422 25

原创 大黄脸,原来你是这样的!!!——聚类实现图像分割

本篇博客主要借助机器学习中常用的一个库——scikit-learn来实现图像分割。

2020-07-26 23:46:59 6456 18

原创 震惊!更换GPU会改变LLM的行为

大多数技术人员都知道,依赖项的不同版本可能会导致行为不同。然而,在大型语言模型领域,由于我们需要大量的计算资源,因此在训练和推理任务中我们严重依赖于GPU。然而,很少有人真正意识到更换GPU也会影响LLM的输出。当然,你可以创造两个完全相同的环境,可以设置依赖项版本,可以使用,可以将LLM的温度系数设置为0,也可以设定任何你想要的seed。归根结底,除非你没有使用完全相同的GPU模型,否则这些都不会起作用。在这篇文章中,我将通过一个实验来强调这一现象,该实验显示了差异发生的位置和原因。

2024-08-31 19:03:56 908

原创 MTEB评估基准使用指北

MTEB评估基准使用指北

2024-07-12 10:04:26 587

原创 解决libcusparse.so.12: undefined symbol: __nvJitLinkAddData_12_1, version libnvJitLink.so.12

解决libcusparse.so.12: undefined symbol: __nvJitLinkAddData_12_1, version libnvJitLink.so.12

2024-06-10 21:42:30 1573

原创 REPLUG:检索增强的黑盒语言模型

REPLUG:一种检索增强的语言建模框架

2024-03-31 18:35:54 1446 1

原创 WebCPM:首个开源的交互式网页搜索中文问答模型

WebCPM:首个开源的交互式网页搜索中文问答模型

2024-02-29 19:40:11 1488

原创 U-ViT:A ViT Backbone for Diffusion Models

U-ViT论文

2023-12-31 17:42:43 1473

原创 PromptRank:使用Prompt进行无监督关键词提取

PromptRank:使用Prompt进行无监督关键词提取。

2023-11-30 21:26:35 1105

原创 坦克世界WOT知识图谱之知识图谱篇

坦克世界WOT知识图谱之知识图谱篇

2023-10-24 22:49:52 238

原创 坦克世界WOT知识图谱三部曲之爬虫篇

坦克世界WOT知识图谱三部曲之爬虫篇

2023-10-05 21:46:58 1271

原创 收藏!2023年CCF推荐的『人工智能』领域国际学术会议和期刊目录

2023年CCF推荐的人工智能领域国际学术会议和期刊。

2023-09-21 10:35:49 15371 1

原创 Python中的诡异事:不可见字符!

今天分享一件很诡异的事情,我写代码的时候遇到了不可见的字符!!!

2023-08-12 17:05:46 744

原创 ChatLaw:中文法律大模型

ChatGPT浪潮下,人工智能的不断扩展和发展为LLM的扩散提供了肥沃的土壤,目前医疗、教育、金融领域已逐渐有了各自的模型,但法律领域迟迟没有明显进展。这不,它来啦!北京大学实验团队发布了首个中文法律大模型落地产品ChatLaw,为大众提供普惠法律服务。

2023-07-05 15:26:02 5197 2

原创 SeeKeR: 寻找知识的语言模型

SeeKeR:一个使用搜索引擎的模块化语言模型架构

2023-06-30 10:05:50 502

原创 智能算法系列之蚁群算法(详细补充版)

本篇是[智能算法(Python复现)]专栏的第六篇文章,主要是对蚁群算法的补充。在上篇博客中对蚁群算法的原理进行了简单的介绍,并用`python`实现蚁群算法在求函数极值方面的应用,但仔细研读一番发现重点没有突出来,而且与原始`TSP`问题中的蚁群算法又较大区别,感觉只涉及到蚁群算法的外壳,并没有触及灵魂。因此,在本篇中对蚁群算法在求函数极值方面的应用进行一个详细补充,并尽可能的触及蚁群算法的灵魂。

2023-05-14 23:27:42 482 1

原创 智能算法系列之蚁群算法

本篇是[智能算法(Python复现)]专栏的第五篇文章,主要介绍蚁群算法`(Ant Colony Optimization, ACO)`的思想,`python`实现及相关应用场景模拟。

2023-05-07 17:06:52 3637 10

原创 智能算法系列之基于粒子群优化的模拟退火算法

本篇是[智能算法(Python复现)]专栏的第四篇文章,主要介绍粒子群优化算法与模拟退火算法的结合,以弥补各自算法之间的不足。

2023-04-30 23:28:18 2891 1

原创 AI-ISP:手机相机是如何将风景变成图片的?

本篇文章只干一件事:`AI-ISP`:手机相机是如何将风景变成图片的?

2023-04-23 18:51:19 2379 1

原创 腾讯TNN神经网络推理框架手动实现多设备单算子卷积推理

近期调研了一下腾讯的`TNN`神经网络推理框架,因此这篇博客主要介绍一下`TNN`的基本架构、模型量化以及手动实现`x86`和`arm`设备上单算子卷积推理。

2023-04-11 18:46:25 1314 2

原创 智能算法系列之粒子群优化算法

本篇是[智能算法(Python复现)]专栏的第三篇文章,主要介绍粒子群优化算法`(ParticleSwarm Optimization, PSO)`的思想,`python`实现及相关应用场景模拟。

2023-04-09 15:10:50 1950

原创 智能算法系列之模拟退火算法

本篇是[智能算法(Python复现)]专栏的第二篇文章,主要介绍模拟退火算法`(Simulate Anneal Algorithm, SAA)`的思想,`python`实现及相关应用场景模拟。

2023-03-31 15:48:20 1470

原创 智能算法系列之遗传算法

本篇是[智能算法(Python复现)]专栏的第一篇文章,主要介绍遗传算法`(Genetic Algorithm, GA)`的思想,`python`实现及相关应用场景模拟。

2023-03-24 19:12:12 3325 2

原创 论文精读:Ansor: Generating High-Performance Tensor Programs for Deep Learning

Ansor: Generating High-Performance Tensor Programs for Deep Learning

2023-03-06 15:47:35 947

原创 docker-py(Docker SDK for Python)使用指南

本篇博客围绕官方提供的`python`版的`docker Engine API(Docker SDK for Python)`,结合具体示例,详细介绍如何使用`python`来自动化操作`docker`。

2023-02-08 14:34:27 6465

原创 Docker常用指令汇总

本篇文章主要汇总了项目开发过程中常用的`docker`命令,以便后续查询。

2023-02-08 14:20:58 855

原创 就挺无语的,这是有脾气的博客

本篇博客主要是对`ChatGPT`做了简要介绍,并在微信公众号上进行了部署,可以免费体验,目前仅支持短文本对话。

2023-02-03 10:47:13 4837 2

原创 机器学习之求解无约束最优化问题方法(手推公式版)

本篇博文主要介绍了机器学习里面的常见的求解无约束最优化问题的方法,包括梯度下降法、牛顿法和拟牛顿法,并给出了相关的推导过程及代码实现。

2023-01-31 20:37:58 1732 1

原创 机器学习之支持向量机(手推公式版)

支持向量机(Support Vector Machine, SVM)源于统计学习理论,是一种二分类模型,是机器学习中获得关注最多的算法,没错,是“最”,没有之一。

2022-12-27 19:21:11 1268

原创 那些被渐渐遗忘的python知识点(二)

正所谓:时运则存,不用则亡,这些有关python的知识点你还记得多少。

2022-12-27 19:19:20 684

原创 协方差矩阵与相关系数矩阵

本篇博客主要介绍一下方差、协方差及相关系数的相关知识,进而引入了协方差矩阵与相关系数矩阵,并结合相关实例进行说明。

2022-12-27 11:11:48 8644

原创 在x86的Docker中构建TVM的ARM环境

本篇文章介绍如何在`x86`的`docker`中构建`tvm`的`ARM`环境,以及如何使用`RPC`使编译在`x86`的环境中运行在`arm`的环境中,还介绍了如何在`arm`环境中进行编译和运行,并提供详细的示例以供验证,其中包括`rpc`测试代码,`acl`测试代码,`pytorch`模型在`arm`上的推理以及在`arm`上进行`autotvm`。

2022-11-19 15:32:09 2532

原创 Python进程间的通信之管道通信:os.pipe

本篇主要介绍Python进程间的通信:管道通信,包含的内容有管道通信的原理、os.pipe()模拟管道通信以及实现管道的单向和双向通信。

2022-11-07 16:40:48 4341

原创 那些被渐渐遗忘的python知识点

正所谓:时运则存,不用则亡,这些有关python的知识点你还记得多少。

2022-10-24 19:09:00 1145

原创 tvm在linux环境下的安装与编译及vscode如何配置tvm的远程连接调试环境

本篇文章介绍一下 `tvm` 在`linux`环境下的安装与编译,以及如何使用`vscode`来配置`tvm`的远程连接调试环境。

2022-09-06 13:29:05 2221 6

原创 pycharm如何远程连接服务器上的docker容器

本篇文章介绍一下 `Pycharm` 如何远程连接服务器上的`docker`,并在本地完成代码的运行与调试。

2022-08-22 20:58:26 1617 5

原创 解析PR曲线与目标检测中的mAP指标

本篇博客主要是介绍`PR`曲线与目标检测中的`mAP`指标。

2022-08-12 14:38:23 2488 4

原创 非极大值抑制算法(NMS)的python实现

本篇博客主要是介绍非极大值抑制`NMS`算法的`python`实现,并根据实例检测实现效果。

2022-08-09 12:14:03 5097

聊天机器人对话数据集-ChatRobot

聊天机器人训练语料,100万条中文对话

2021-02-21

zhwiki-20200720-pages-articles5.xml-p4271087p4731439.bz2

维基百科中文语料库,是自然语言处理中常用的一个数据集,里面包含了大量的中文词条,本文件是2020年7月份最新的语料(5)

2020-07-29

zhwiki-20200720-pages-articles4.xml-p2654618p2771086.bz2

维基百科中文语料库,是自然语言处理中常用的一个数据集,里面包含了大量的中文词条,本文件是2020年7月份最新的语料(4)

2020-07-29

zhwiki-20200720-pages-articles3.xml-p544645p1154617.bz2

维基百科中文语料库,是自然语言处理中常用的一个数据集,里面包含了大量的中文词条,本文件是2020年7月份最新的语料(3)

2020-07-29

zhwiki-20200720-pages-articles2.xml-p162887p544644.bz2

维基百科中文语料库,是自然语言处理中常用的一个数据集,里面包含了大量的中文词条,本文件是2020年7月份最新的语料(2)。

2020-07-28

zhwiki-20200720-pages-articles1.xml-p1p162886.bz2

维基百科中文语料库,是自然语言处理中常用的一个数据集,里面包含了大量的中文词条,本文件是2020年7月份最新的语料(1)。

2020-07-28

zhwiki-20200720-pages-articles-multistream5.xml-p4271087p4731439.bz2

维基百科中文语料库,是自然语言处理中常用的一个数据集,里面包含了大量的中文词条,本文件是2020年7月份最新的语料(部分)。

2020-07-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除