陌上疏影凉-CSDN博客

原创《利用Python进行数据分析》读书笔记（一）Python Basic

这一系列博客是看《Python for Data Analysis》的读书笔记，只截取了大部分自己认为重要的知识点，不少例子也是来自于书中。本机安装的是python 3.6版本，并使用anaconda安装了jupyter notebook和一些常用模块。Python Interpreter在终端命令行输入python指令后调出python交互界面，使用exit()或者Ctrl+D退出p...

2018-09-02 07:49:41 377

原创【论文阅读】Community Structure in Time-Dependent, Multiscale, and Multiplex Networks

论文地址这篇论文相比之前一篇读起来有点吃力，一是生词有点多，二是牵扯到过多的专业知识，很多框架结构多是其他论文中提到的，对于论文的实现细节无法深究，但能大概明白文章做了什么事。网络科学（Network Science）是一门跨专业的学科，一个重要的问题就是网络节点中社区（community）的检测，就是将网络中关系密切的一些节点归为一个集合，称为community。本文提出了一种方法可以解...

2018-03-24 21:09:41 1988 3

原创【论文阅读】Distributed Representation of Sentence and Document

Abstract传统的单词模型（bag-of-words）在实际应用中有一些缺点：They lose the ordering of the words，丢失了单词的顺序。They ignore semantics of the words，忽略了单词的语义。因此本文提出了一种新的模型（Paragraph Vector），解决了上述的一些问题，带来了更好的效果。Intro...

2018-03-24 20:59:19 1313

原创【论文阅读】TextBoxes: A Fast Text Detector with a Single Deep Neural Network

论文标题：TextBoxes: A Fast Text Detector with a Single Deep Neural Network 作者：Minghui Liao, Baoguang Shi, Xiang Bai, Xinggang Wang, Wenyu LiuIntroduction场景文字识别与传统OCR有区别，场景文字识别需要区别文字与背景的关系，...

2018-02-26 21:50:25 1292 1

原创算法导论学习笔记（一）快速排序及优化

快速排序的描述快排的伪代码：QUICK_SORT(A,p,r){ if p<r q = PARTITION(A,p,r) QUICK_SORT(A,p,q-1) QUICK_SORT(A,q+1,r)}初始调用传入的参数是QUICK_SORT(A,1,A.length)。PARTITION的伪代码：PARTITION(A,p,r){

2017-10-27 00:10:56 351

HBase Architectural Components（HBase架构组件）HBase架构也是主从架构，由三部分构成HRegionServer、HBase Master和ZooKeeper。RegionServer负责数据的读写与客户端交互，对于region的操作则是由HMaster处理，ZooKeeper则是负责维护运行中的节点。在底层，它将数据存储于HDFS文件中，因而涉及到HDFS的NN

2017-10-24 08:27:46 594

翻译 HBase学习笔记（一）HBase数据模型

HBase是运行在Hadoop集群上的一个数据库，与传统的数据库有严格的ACID（原子性、一致性、隔离性、持久性）要求不一样，HBase降低了这些要求从而获得更好的扩展性，它更适合存储一些非结构化和半结构化的数据。 Apache HBase is a database that runs on a Hadoop cluster. HBase is not a traditional RDBMS,

2017-10-23 10:33:18 1001

原创 Hadoop学习笔记（六）实战word count

配置工程在maven官网上下载最新的maven压缩包并解压。下载IntelliJ IDEA并安装。在IDEA中新建工程，选择maven，sdk选择java jdk的目录，勾选上Create form archetype，选择quickstart，下一步。填写GroupId和ArtifactId，version填写1.0，下一步。 User settings file配置选择下载解压后的mav

2017-10-21 12:53:38 512

原创 Hadoop学习笔记（五）MapReduce

MapReduce概述源自于Google的MapReduce论文，发表于2004年12月Hadoop MapReduce是Google MapReduce的克隆版MapReduce优点：海量数据的离线处理、易开发、易运行。所谓海量数据，说明MapReduce可以处理的数据量非常大，离线处理说明MapReduce跟实时响应不同，用户将作业提交，系统按批次进行处理，由于数据量大，自然非常耗时。所

2017-10-20 07:28:54 504

原创 Hadoop学习笔记（四）YARN

YARN产生背景为什么会产生YRAN？这个与MapReduce1.x的架构有关，正是因为MapReduce1.x存在许多的问题，才会产生 YARN。MapReduce1.x的架构如下：Hadoop1.x时，MapReduce的架构仍然是主从架构。一个JobTracker带多个TaskTracker，主节点为JobTracker，只有一个，从节点为TaskTracker，可以有多个，从节点通过向

2017-10-16 23:04:15 407

原创 Hadoop学习笔记（三）漫画解读HDFS读写原理

首先看看出场的角色，第一个是client客户端，用来发起读写请求，读取HDFS上的文件或往HDFS中写文件；第二个是Namenode，唯一的一个，会协调所有客户端发起的请求；第三个是DataNode，负责数据存储，跟Namenode不一样，DataNode有很多个，有时候能达到数以千计。写数据流程往HDFS中写数据的流程如下：第1幅图：我们跟客户端说，你帮我写一个200M的数据吧，客户端说没问题啊，

2017-10-15 20:14:00 1299

原创 Hadoop学习笔记（二）HDFS

HDFS的设计目标通过上一篇文章的介绍我们已经了解到HDFS到底是怎样的东西，以及它是怎样通过多副本机制来提供高可靠性的，我们可以发现HDFS设计目标可以总结为以下几点：非常巨大的分布式文件系统运行在普通廉价的硬件上易扩展、为用户提供性能不错的文件存储服务HDFS的架构我们通过官网的文档来了解HDFS的基础架构（http://hadoop.apache.org/docs/current/ha

2017-10-15 19:52:27 541

原创 Hadoop学习笔记（一）初识Hadoop

研究生阶段将要接触大数据和深度学习的知识，在网上找的教程大多一上来就是一堆名词又解释不清楚，对新手相当不友好，在慕课网看到一个教程，利用博客记录下自己学习的过程。hadoop介绍关于hadoop 最好的介绍莫过于官网的文档，hadoop的官网如下，http://hadoop.apache.org我们一句一句来看看hadoop官网是怎么介绍的。

2017-10-11 16:57:30 1354

原创 LitePal学习笔记

litepal学习笔记

2017-01-19 22:02:50 415

原创解析json存储到model中

在volley请求返回json时，需要对返回的json字符串进行解析，并将其中的属性分离出来存到我们定义好的对应的model中。下面说一下步骤：一、php产生字符串利用本地服务器编写php文件产生json字符串produce_json.php<?php/** * Created by PhpStorm. * User: Momo * Date: 2016/10/29 * Time: 1

2016-10-29 11:13:56 1098