自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

zhougb3的博客

It's been kind of tough, but tough people last.

  • 博客(12)
  • 问答 (5)
  • 收藏
  • 关注

原创 Graph Algorithms(图算法)

(u,v)是有向图中的边,我们就称顶点v领接顶点u。从顶点u到顶点v的路径是顶点序列<v0,v1,v2...vk>,其中v0 = v,vk=u。路径中的顶点是唯一的,则称路径是简单的。起点和终点一致则为一个环。如果所有的中间顶点都不相同,则称环是简单的。如果图中的每一对顶点都邻接,则称图为完全图。树林是无圈图,树是连通无圈图。如果图是树,则边为顶点数减去一。在计算机程序中,有两...

2018-05-31 00:09:26 5684

原创 Dense Matrix Algorithms(稠密矩阵算法)

矩阵向量乘法串行算法中需要n*n次乘法和加法运算。一维行划分每个进程一行以及向量的一个元素:进程数少于n:每个进程存储n/p个整行还有n/p个元素。使用超立方体结构推导矩阵向量乘法的等效率函数一维列划分参考一维行划分(习题8.2)二维划分每个进程一个元素:向量x分布在n个进程的最后一列。将向量x沿着矩阵A的主对角线排列,接着复制到相应列...

2018-05-29 13:32:25 7731 1

原创 RPC TAF(TARS) 框架 初学

RPC简介RPC 即远程过程调用(Remote Procedure Call Protocol,简称RPC),像调用本地服务(方法)一样调用服务器的服务(方法)。通常的实现有 XML-RPC , JSON-RPC , 通信方式基本相同, 所不同的只是传输数据的格式.RPC是分布式架构的核心,按响应方式分如下两种:同步调用:客户端调用服务方方法,等待直到服务方返回结果或者超时,再继续自己...

2018-05-22 11:16:25 10581 1

原创 Sorting(排序)

内排序与外排序:外排序需要利用辅助存储器件(硬盘等),内排序可以全部放入主存储器中。基于比较的排序算法和不基于比较的排序算法:基于比较的排序算法时间复杂度最低为O(N * logN),基于非比较的排序算法的复杂度下界为O(N)。输入输出序列分散存放在各个进程当中,枚举出全部进程,使用一个全局排序,如果进程Pi枚举值小于Pj,则排序完之后Pi存放的值全都小于Pj。每个进程存放一个元素: ...

2018-05-19 13:55:32 1529 1

原创 数据挖掘之特征工程

标签编码与独热编码OneHotEncoder独热编码和 LabelEncoder标签编码数据挖掘的基本流程 dfs dsf

2018-05-13 15:12:04 378

原创 数据挖掘之实例学习

在简书上看到一个简单的数据挖掘流程文章,很不错:数据科学入门,使用 xgboost 初试 kaggle这里面有用到网格搜索:网格搜索简介sklearn.model_selection.GridSearchCV中文版网格搜索文档Python超参数自动搜索模块GridSearchCV上手...

2018-05-13 13:03:57 3634

原创 数据挖掘之模型初探

由于我要打的比赛是做一个二分类预测器,所以就开始找到有关的模型进行了解学习。常见的分类模型如下:逻辑回归(Logistic Regression, LR)朴素贝叶斯(Naive Bayes, NB)K近邻(K-nearest neighbors, KNN) 决策树(Decision Tree, DT)支持向量机(Support Vector Machine, SVM)神经网络(Neu...

2018-05-13 10:05:05 277

原创 数据挖掘之模型评估(AUC和F-measure)

最近在打一个数据挖掘的比赛,看到评分标准如下: 按如下公式计算得分: score=0.6×auc+0.4×F1 其中: auc值为在测试集上,根据预测结果按照标准auc定义计算的分值; F1值为针对测试集中实际标签为1(风险用户)的用户,根据预测结果,按照标准F-measure定义计算的分值。对于一个刚接触数据挖掘的人来说,连评分规则都没看懂,GG了,于是果断...

2018-05-09 15:26:50 6204

原创 Programming Shared Address Space Platforms(共享地址空间平台的编程)

由于所有处理器可以访问部分(或者全部)内存,通信是隐式指定的。在共享地址空间平台上,轻量级进程和线程比较适合于并行编程。多线程编程已经很熟悉了,这里就不做笔记了~...

2018-05-08 22:57:46 558

原创 分布式计算——补充

多个处理器和多核处理器的区别:对于多个处理器而言,它们在执行命令的时候多个处理器之间的通信手段是电脑主板上的总线;而对于多核处理器而言,多个核心处理器之间通信时通过CPU内部总线进行信息的交互的。对于执行效率而言,多核处理器要优于多个处理器。对于分布式计算而言,我们讲的通常都是多个处理器。处理器和内存关系对于一台拥有多个处理器的计算器,每个处理器可能各自都有一个cache,也可...

2018-05-08 15:30:22 639

原创 Programming Using the Message-Passing Paradigm(使用消息传递模式编程)

消息传递编程的原理两个关键特性:假设存在一个分块地址空间(个人理解这是一个多进程共享的空间),只支持显示并行化分块地址空间的含义: 1. 每一数据单元必须属于空间的分块之一,数据必须被显示地划分和存放。(促进存取本地化,对非UMA结构很重要)。 2. 所有的相互操作需要两个进程间的协作。消息传递程序的结构: 1. 异步:所有的并发任务都异步执行,由于存在...

2018-05-08 13:56:34 742

原创 Analytical Modeling of Parallel Programs(并行程序的解析建模)

A parallel system is the combination of an algorithm and the parallel architecture on which it is implemented. In this chapter, we study various metrics for evaluating the performance of parallel syst...

2018-05-07 17:12:23 407

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除