自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大卫DrDavidS的博客

记录自己的点点滴滴

  • 博客(94)
  • 资源 (5)
  • 收藏
  • 关注

原创 apline镜像出现npm下载错误

node-pre-gyp http 403 on Mac M1

2022-03-18 00:11:20 2328

原创 DGL笔记4——用GNN预测关系

原文:Link Prediction using Graph Neural NetworksDGL笔记1——用DGL表示图DGL笔记2——用DGL识别节点DGL笔记3——自己写一个GNN模型在DGL笔记2——用DGL识别节点中

2021-06-25 16:53:10 493

原创 DGL笔记3——自己写一个GNN模型

原文:Write your own GNN module之前我们学习了 DGL 怎么表示一个图,然后怎么写一个简单的 GCN 模型进行节点识别。但是有时候我们的模型不仅仅是简单地堆叠现有的 GNN 模块。 比如我们现在想发明一种考虑节点重要性或边权重来聚合邻域信息的新方法,该怎么办?所以我们现在将要学习:DGL 的消息传递 API。自己实现 GraphSAGE 卷积模块。记得在看这篇之前先看上一篇 GNN 分类哈~首先导入相关包:import dglimport torchim

2021-06-24 21:12:24 849 1

原创 DGL笔记2——用DGL识别节点

原文:How Does DGL Represent A Graph?GNN 对于很多图机器学习任务来说是一个很强大的工具。这篇文章我们会学习使用 GNN 进行节点分类的工作流程,也就是“如何为节点分类”。学习完本文,我们可以加载 DGL 自带的数据集。使用 DGL 提供的神经网络模块构建 GNN 模型。在 CPU 或 GPU 上训练用于节点分类的 GNN 模型,并且评估效果。当然这都建立在你已经有 PyTorch 的使用经验上。import dglimport torchimport

2021-06-24 20:22:28 1024

原创 DGL笔记1——用DGL表示图

DGL是如何表示一个图的原文:How Does DGL Represent A Graph?今天我们来学习一下 DGL 是如何表示一个图的。我们会学到以下内容:从零开始新建一个图将节点和边特征分配给图查询DGL图的属性将DGL图转换为其他图加载和保存DGL图DGL图的构建DGL 将有向图表示为一个 DGL 图对象。图中的节点编号连续,从0开始。我们一般通过指定图中的节点数,以及源节点和目标节点的列表,来构建这么一个图。举个???? ,下面的代码构造了一个图,这个图有五个叶子????节

2021-06-24 00:17:44 1245

原创 浅尝Pytorch自动混合精度AMP

这里写自定义目录标题Pytorch自动混合精度简述Autocasting未完待续合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入Pytorch自动混合精度本文是《AUTOMATIC MIXED PRECISION PACKAGE - TO

2021-06-03 01:11:26 1523 2

原创 2021-02-07

重回CSDN自从上班以后很少写Blog了,以前老文章也没维护,都落伍了,最近趁着新年重回博客。打算写一下常用的技术代码,给自己存个档。保证注释完善、说明详细,也算是回馈大众了。

2021-02-07 10:55:56 68

原创 使用Anaconda3的Docker镜像

原创作者:你们大卫假设本地 Ubuntu 服务器已经安装好了Docker,这里讲述一下如何开始运行Anaconda3的Docker镜像:1. 搜索镜像搜索我们想要的anaconda镜像:docker search anaconda2. 拉取镜像我们决定拉anaconda3官方镜像,即continuumio/anaconda3这个镜像:...

2019-09-17 15:54:04 14242 3

原创 Python性能测试调优

line_profiler 和 memory_profiler 性能测试调优

2017-08-11 15:51:01 480

原创 sklearn.metrics.precision_score 中 unknow is not supported 问题

sklearn.metrics.precision_score 中 unknow is not supported 问题解决

2017-08-10 10:47:57 3087

原创 CentOS 安装 XGboost

CentOS 安装 XGboost 报错解决。

2017-08-07 09:37:21 1440

转载 从决策树到GBDT再到XGBoost

决策树到CART,到GBDT,到XGBoost

2017-08-03 11:30:07 2555

原创 XGBoost 与 信用卡诈骗数据集 三

增加了储存模型和读取模型的功能,分别写在两段代码里面。

2017-08-02 10:03:08 3745 1

原创 XGBoost 与 信用卡诈骗数据集 二

解决了之前的问题,成功使用 sklearn API

2017-08-01 16:38:34 1144

原创 XGBoost 与 信用卡诈骗数据集

在Github 上面找到了一个信用卡诈骗数据集:https://github.com/georgymh/ml-fraud-detection数据源于 kaggle 的信用卡诈骗数据。其中给出了三种大方法,分别是神经网络,kmeans,以及逻辑回归。但是今天我想要用XGBoost 试一试。

2017-07-31 16:44:10 4204

原创 智障自学深度学习系列-2 字词的向量表示

补充一下什么是 One-Hot 编码。中文又叫独热码,比如前文MNIST中把数字1编码为 [0,0,0,0,0,0,0,0,0,1],这种就是独热码编码形式,有多少个状态就有多少个bit,这里有十个数字,就有十个bit。首先你得知道什么是 Word Embedding,word embedding的意思是:给出一个文档,文档就是一个单词序列比如 “A B A C B F

2017-07-24 14:47:16 555

原创 智障自学深度学习系列-1 MNIST

安装 TensorFlow 会另外单独讲,这里零碎记录 http://wiki.jikexueyuan.com/project/tensorflow-zh/ 开始的流程。首先会跑一个 hello world,注意这里原本是 Python 2.x 的代码,我已经修改为 Python 3.x 代码了

2017-07-21 17:56:04 743

原创 Scikit-Learn 官方示例

部分sklearn示例

2017-07-02 23:41:11 3648

原创 Spark快速大数据分析-第一和第二章

先简单介绍了Spark,然后介绍如何下载和入门使用。

2017-06-13 16:14:39 451

原创 Head First SQL 第十章

外联接,自联接与联合左右外联接。

2017-05-09 09:42:42 373

原创 Head First SQL 第九章

查询中的查询——子查询非关联子查询,关联子查询

2017-05-06 15:51:16 365

原创 Head First SQL 第八章

联接与多张表的操作!别名的设置三种内联接

2017-04-27 12:34:51 467

原创 Head First SQL 第七章

如何创立新表,使用外键。以及第一二三范式的学习。

2017-04-24 12:23:10 333

原创 Head First SQL 第六章

学习如何给数据排序和归组,学习如何对查询结果套用数学运算。

2017-04-20 14:36:42 253

原创 Head First SQL 第五章

ALTER

2017-04-16 15:00:52 374

原创 Head First SQL 第四章

表格规范化~

2017-04-14 16:30:03 432

原创 Head First SQL 第三章

DELETE 和 UPDATE

2017-04-14 10:05:03 217

原创 Head First SQL 第二章

SELECT 语句,AND OR NOT等逻辑运算符的用法

2017-04-13 10:36:54 302

原创 Head First SQL 第一章

这一次要跟着 Head First SQL这本书学习数据库。安装参见:http://blog.csdn.net/qq_27469517/article/details/64122464

2017-04-12 17:40:34 517

原创 亲测:MySQL 5.7.17 安装教程

在 win10 和 win7 上安装 MySQL 5.7.17 的详细方法。

2017-03-20 11:06:03 531

原创 爬虫MOOC 第三周 实战

实战了爬取淘宝页面商品价格和股票信息

2017-03-17 23:07:30 1060

原创 爬虫MOOC 第二周 入门

主要学习Beautiful Soup的使用,以及一个实例 爬取中国大学排名。

2017-03-16 15:40:25 908

原创 爬虫MOOC 第一周 入门

Python网络爬虫与信息提取讲师:嵩天给出了五个爬虫实例,很简单

2017-03-09 22:26:58 1513

原创 集体智慧编程 第三章 发现群组

第三章是第二章的扩展,引入了“数据聚类”的概念,这是一种用以寻找紧密相关的事、人或观点,并将其可视化的方法。聚类(data intensive)时常被用于数据量很大的应用中。本章第一个例子将对博客用户所讨论的话题,以及特殊词缀进行考察。第二个例子将对社区网站进行考察。

2017-02-27 15:48:25 506

原创 集体智慧编程 第二章 匹配商品

我们在前面学习了如何为指定人员寻找品味相近的人,以及如何向其推荐商品。但是如果我们想了解哪些商品是彼此相近的,应该如何做?

2017-01-05 14:54:02 1187 1

原创 集体智慧编程 第二章 提供推荐

我们要知道在购物网站中,如何构建一个系统,用以寻找具有相同品味的人,并根据他人的喜好自动给出推荐。一个协作型过滤算法通常的做法是对一大群人进行搜索,并从中找到与我们品味相近的一小群人。算法会对这些人所偏爱的其他内容进行考察,并将它们组合起来构造出一个经过排名的推荐列表。

2016-12-29 17:29:23 654

原创 第十章 k-均值算法 10.4 对地图上的点进行聚类

将地图上的点进行聚类,安排交通工具抵达这些簇的质心,然后步行到每个簇内地址。这里我们直接用给出的文件进行操作,跳过10.4.1节。

2016-12-27 10:28:42 7464

原创 第十章 10.2 提高聚类性能 10.3 二分K-均值算法

上一节提到,在K-均值聚类中的簇的数目K是一个用户预先定义的参数,那么用户如何才能知道 K 的选择是不是正确?如何才能知道生成的簇比较好呢?在包含簇分配结果的矩阵中保存着每个点的误差,即该点到簇质心的距离平方值。下面要做的就是利用该误差来评价聚类质量的方法。

2016-12-26 15:38:30 486

原创 第十章 利用k-均值聚类算法对未标注数据分组

本章内容:1. K-均值聚类算法。2. 对聚类得到的簇进行后处理。3. 二分K-均值聚类算法。4.  对地理位置进行聚类。========================================================================K-聚类算法是一种无监督学习算法。首先明白什么是无监督学习:输入数据有标签,则为有监督学习,没标签则为无监督学

2016-12-24 16:09:19 743

原创 第三章 决策树 3.3+3.4 测试算法:使用决策树执行分类

本节我们将使用决策树构建匪类器,我们可以将它用于实际数据的分类。

2016-12-20 17:26:08 898

chinese-roberta-wwm-ext.rar

哈工大版本,for pytorch

2021-02-07

chinese-bert-wwm-ext.rar

哈工大版本,for pytorch

2021-02-07

albert-chinese-base.rar

for transformers and pytorch

2021-02-07

bert-chinese-pytorch.rar

transformers+pytorch框架下使用的bert-chinese谷歌官方预训练版本,其中有三个文件:config.json、pytorch_model.bin、vocab.txt

2021-02-07

利用Python进行数据分析-配套数据

《利用Python进行数据分析》的配套数据,完全和书上的配套

2017-05-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除