关闭

Mysql--基本索引介绍

在数据库表中,对字段建立索引可以大大提高查询速度。假如我们创建了一个 mytable表: CREATE TABLE mytable( ID INT NOT NULL, username VARCHAR(16) NOT NULL ); 我们随机向里面插入了10000条记录,其中有一条:5555, admin。 在查找username="admin"的记录 SELECT...
阅读(156) 评论(0)

在线广告产品实践

互联网上有三种资产能够变成钱:数据,流量,品牌属性。 数据:可能来自于媒体,可能是第三方的数据拥有者,后两项是媒体的专属。 而在当今越来越复杂的广告交易和数据变现市场中,如果从实际需求的角度来看,不外乎有下面三类问题: a)、媒体如何利用合适的广告产品更好地变现? 要兼顾短期收益和长期品牌价值的双重目的,如何利用自有的销售渠道以及各种供给方的广告产品以平衡这两方面的目的。 b)、广告主如...
阅读(155) 评论(0)

Linux Shell-认识与学习bash

1、认识bash这个shell bash:Linux使用的shell版本。 我们通过shell将我们输入的命令与内核通信,好让内核可以控制硬件来正确无误地工作。 2、bash的优点: 1)命令记忆能力:通过按上下键就可以找到前/后一个输入的命令(1000个)。好处就是可以查询曾经做过的操作。 2)命令与文件补全功能(Tab键的好处) 3)命令别名设置功能(alias) eg:ali...
阅读(157) 评论(0)

论文BigTable-Google's BigTable 原理 (翻译)

Google's BigTable 原理 (翻译)    题记:google 的成功除了一个个出色的创意外,还因为有 Jeff Dean 这样的软件架构天才。                                                 欢迎订阅作者微博 ------ 编者 官方的Google Reader blog 中有对BigTable 的解释。这是Google...
阅读(94) 评论(0)

MapReduce论文- 中文翻译

MapReduce:超大机群上的简单数据处理                                             摘要 MapReduce是一个编程模型,和处理,产生大数据集的相关实现.用户指定一个map函数处理一个key/value对,从而产生中间的key/value对集.然后再指定一个reduce函数合并所有的具有相同中间key的中间value.下面将列举许多可以用...
阅读(170) 评论(0)

GFS论文-Google File System(中文翻译)

Google文件系统 GFS是一个可扩展的分布式文件系统,用于大型的、分布式的、对大量数据进行访问的应用。它运行于廉价的普通硬件上,但可以提供容错功能。它可以给大量的用户提供总体性能较高的服务。 1、设计概览 (1)设计想定 GFS与过去的分布式文件系统有很多相同的目标,但GFS的设计受到了当前及预期的应用方面的工作量及技术环境的驱动,这反映了它与早期的文件系统明显不同的设想。这...
阅读(262) 评论(0)

性能测试基础知识

一、性能测试典型术语 1、并发用户 2、用户并发数量 3、请求响应时间(TTLB:Time to last byte) 4、事务响应时间:事务可能有多个请求组成,主要是为了向用户说明业务响应时间。 5、吞吐量(Throughput):单位时间内网络上传输的数据流量...
阅读(148) 评论(0)

计算广告-系统结构组成

计算广告技术: 一、个性化系统与搜索系统介绍 有很多大数据驱动的产品,就其技术架构而言,往往落地成个性化系统,即根据用户、上下文的一些信息动态决定返回什么内容的系统。计算广告是一个典型的个性化系统。 个性化系统与搜索系统都是互联网时代具有挑战性的大规模计算问题。由于数据规模的要求:一般采用检索+排序这样类搜索的系统架构。 两者的差别:在于大量的用户特征的使用。 常...
阅读(513) 评论(0)

Linux常用命令-crontab:

crontab定时任务      crontab -l:查看当前系统中的定时任务      cronrab -e:编辑定时任务         第1列分钟1~59 第2列小时1~23(0表示子夜) 第3列日1~31 第4列月1~12 第5列星期0~6(0表示星期天) 第6列要运行的命令 这里有crontab文件条目的一些例子: 30 21 * * * /usr/local/...
阅读(96) 评论(0)

Hadoop 常用命令

启动Hadoop 进入HADOOP_HOME目录。执行sh bin/start-all.sh 关闭Hadoop 进入HADOOP_HOME目录。执行sh bin/stop-all.sh   1、查看指定目录下内容 hadoop dfs –ls [文件目录] eg: hadoop dfs –ls /user/wangkai.pt 2、打开某个已存在文件 hadoop dfs...
阅读(61) 评论(0)

计算广告-在线广告的产品概况

参考书籍---刘鹏老师的《计算广告》 在线广告不同于传统广告,其产品形式相当丰富 1、合约广告产品:这类广告主要服务于后续效果不宜直接衡量的品牌类广告主,在门户网站和视频网站较为常见。 a)按照时段售卖的CPT(Cost Per Time)广告 b)按照约定展示量售卖的CPM(Cost Per Mille)广告。 2、竞价广告产品:最重要的形式是搜索广告,产品形式为对搜索...
阅读(319) 评论(0)

基于Dubbo的分布式系统架构(二)-消息中间件在分布式系统中的作用及介绍

一、消息中间件的定义        Message-orientedmiddleware (MOM) is software infrastructure focused on sending and receivingmessages between distributed systems.        消息中间件是在分布式系统中完成消息的发送和接收的基础软件。 二、消息中间件的作用...
阅读(1811) 评论(0)

全文检索Lucene(三)--中文分词与高亮显示

一、中文分词smartcn 二、检索结果高亮显示实现        首先,建立索引,自己在D盘创建lucene6文件夹 package com.feiyang.lucene3; import java.nio.file.Paths; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis...
阅读(564) 评论(0)

基于Dubbo的分布式系统架构(一)-分布式系统架构介绍

一、基于Dubbo的分布式系统架构规划(以第三方支付系统为例)        二、结合业务场景,对系统的应用类型进行划分: (1)   服务子系统 ------ 账户、交易、对账、结算、打款、风控…… (2)   内部管理应用 ---- 运营、风控、会计…… (3)   对外业务应用 ---- 门户、代理商系统…… (4)   对外接入应用 ---- 网关、前置、交易接口……...
阅读(2582) 评论(0)

全文检索Lucene(二)--特定项搜索与queryParser搜索

一、对特定项的搜索       1、准备数据源信息,这里准备了7个txt文档(纯英文)。              2、建立索引信息,通过三个文本域建立索引,并使用了标准的分词器,分别是fileName(存储在索引目录中),fullPath(存储),contents(不存储)。 package com.feiyang.lucene; import java.io.File; impor...
阅读(344) 评论(0)
66条 共5页1 2 3 4 5 ... 下一页 尾页
    个人资料
    • 访问:46377次
    • 积分:1045
    • 等级:
    • 排名:千里之外
    • 原创:53篇
    • 转载:13篇
    • 译文:0篇
    • 评论:3条