![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
云计算/大数据
文章平均质量分 94
风风雨雨中寻觅
平平淡淡,简简单单,取长补短,修炼身心
展开
-
联通数据能力开放平台介绍
1.概述:2017年9月25日,联通大数据有限公司(定位:大数据对外商业应用的集中运营主体与大数据产业拓展的合资合作平台)揭牌成立,并对外发布联通大数据的基础、标准应用和平台级行业解决方案三层共八大对外统一运营产品及系列产品白皮书2.联通八大产品能力:1.标签体系-提供用户标签库,支持标签按需定制;2.数据能力开放平台-提供开放数据平台,支持数据模型;3.风控平台-提供风控数据验证评分;4.沃...原创 2018-10-11 15:04:37 · 14462 阅读 · 0 评论 -
Tencent AI Lab Embedding Corpus使用-提取目标词汇词向量+余弦相似度计算
Tencent AI Lab Embedding Corpus for Chinese Words and Phrases为超过800万个中文单词和词语(包括标点符号)提供200维矢量表示,这些向量捕捉了中文单词和词语的语义含义,可广泛应用于许多中下游的中文处理任务。Tencent_AILab_ChineseEmbedding.txt(开源下载文件)第一行显示嵌入总数和尺寸大小,下面每一行(第一列...原创 2018-11-01 20:19:10 · 6154 阅读 · 0 评论 -
初识hadoop与云计算
1.组合的模拟Hadoop发布者Apache软件基金会对Hadoop的定义:Hadoop的软件库是一个框架,允许在集群(是一组通过网络连接通信和协同工作的计算机,集群中的每一台计算机被称为一个节点,Hadoop部署在集群上)中使用简单的编程模型对大规模数据集进行分布式计算。Hadoop被设计为可以从单一服务器扩展到数以千计的本地计算和存储节点,且Hadoop会在应用层面监测和处理错误,而不依靠...原创 2018-11-25 17:34:46 · 695 阅读 · 0 评论 -
hadoop分布式文件系统HDFS初识
HDFS是可扩展、容错、高性能的分布式文件系统,异步复制,一次写入多次读取,专门存储超大数据文件,为整个hadoop生态圈提供了基础的存储服务1.认识HDFSHDFS可在许多服务器上运行,根据需要HDFS可轻松扩展到数千个节点和PB量级的数据。HDFS设置容量越大,某些磁盘(每个磁盘都有默认的数据块大小,这是磁盘在对数据进行读和写时要求的最小单位)、服务器或网络交换机出故障的概率越高(可通...原创 2018-11-26 19:17:17 · 271 阅读 · 0 评论 -
R语言中的并行计算汇总
上一篇博文:R语言中的代码运算性能提升R语言运行在CPU单核单线程上,使用并行计算原因是程序运行时间太长。大部分程序都可以进行并行化改造以提高运算性能1.lapply只需要一个参数(list\vector\array\matrix\data.frame),和一个以该参数为输入的函数,函数返回列表listlapply(1:3/3, round, digits=3);[[1]] ...原创 2019-02-26 21:02:02 · 6435 阅读 · 0 评论