自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

舒哥的blog

https://www.6aiq.com AIQ-人工智能技术社区 全国最专业的人工智能大数据技术社区。...

原创 搜索、推荐、广告系统等人工智能优质技术资源最全整理
原力计划

前沿 文章目录前沿开源地址[算法学习资料: AI_Tutorial](https://github.com/cbamls/AI_Tutorial)开源相关LuceneSolrElasticLucidWorks中文分词大公司阿里百度京东美团点评携程去哪儿搜狗一号店待分类开发应用理论基础源码解读常见问...

2020-03-13 18:16:10 884 0

原创 我的2020年度总结 “既往不恋,纵情向前”

写在前面 复盘总结能力是一项个人重要的基本功,通过对过往的拆解与反思,沉淀出经验规律,更精准的“以终为始”做好未来的事情。 本文以心路历程为主线: 阐述述从大学以来成长经历,分享心得 重点回顾2019做的好和有待改进的地方 2020的规划 成长经历 我是2018年普通本科毕业,毕业后就一直在北...

2020-01-03 02:23:46 413 0

原创 开通了程序员技术公众号~!持续分享,欢迎互粉!

本人从小就有特别多的想法,对很多事务都喜欢有自己的思考,热爱学习。大学中有一年多疯狂刷ACM,一年多疯狂学Java后端工程性技术,其它时间就浪费掉了,,。开通csdn也好多年了,自从大三拿到一些大厂Offer后就没咋更新过了,不过最近及以后,要督促自己有更强的自驱力,技术及软实力更上一层楼!希望各...

2019-11-14 17:37:33 185 0

原创 有哪些比较好的机器学习人工智能技术社区推荐

AIQ - 全国最专业的机器学习大数据技术社区,是一个以机器学习,大数据,云计算,数据分析,数据挖掘,人工智能,区块链为主要学习方向的学习交流社区,在这里可以讨论各种当下比较火热的技术,分享大数据,机器学习算法等各种优质精华文章与教程资料,填补了机器学习技术社区宇宙级空白,分享学习心得。 人工...

2018-04-04 10:37:19 5464 0

原创 深入剖析ReentrantLock公平锁与非公平锁源码实现

本文以公平与非公平锁的加锁缩成为主线,分析整个加锁过程。准备知识简介ReentrantLock类图: NonfairSync继承关系: Node结点:作为获取锁失败线程的包装类, 组合了Thread引用, 实现为FIFO双向队列。 下图为Node结点的属性描述...

2017-03-19 15:29:40 9441 12

原创 Elasticsearch 电商营销活动索引Mapping参考

原文:https://truemped.github.io/posts/search/campaigns-in-elasticsearch/ Mapping定义: { "mappings": { "properties": { &quo...

2020-04-20 15:03:24 132 0

原创 Word delimiter graph token filter(word_delimiter_graph 词元过滤器)
原力计划

本文禁止转载。原文地址 word_delimiter_graph 使用非字母字符切分 tokens,并可以根据规则执行一些可选的 token 正则化。默认情况下,word_delimiter_graph 会使用以下规则: 使用非字母字符作为切分点。 比如 Super-Duper → Super...

2020-04-01 11:41:05 171 0

原创 水墨-在线 Markdown 编辑器

墨刀-在线 Markdown 编辑器 基于 Spring-boot、FreeMarker、layui、Vditor 构建的一款在线 所见即所得的 Markdown 编辑器。墨刀-在线 Markdown 编辑器。本人使用 Vditor 编辑器时日已久,眼看着其功能日益强大,特此基于 Vditor 构...

2020-03-01 23:24:32 252 0

原创 NLP中文分词知识梳理

中文分词开源工具ik,jieba优缺点优点:使用开源通用语料,综合全面,但缺乏专业词汇缺点:词汇时效方面,新词不及时识别行业结论实践证明,基于统计学习的分词工具要优于基于人工规则的分词工具评测结果表明,未登录词所造成的分词精度下降至少比分词歧义大5倍以上实验结果证明,字标注统计学习方法能够大幅提高...

2020-02-06 16:33:18 249 0

原创 “肺炎疫情”安置在家的“碎碎念”

“武汉肺炎”疫情期间,除特殊必须行业外,很多上班的,务工的都闷在家里。人一闲下来就胡思乱想。 我爸非常固执,没啥文化,根本不懂逻辑,抽象,整天强迫症似的瞎唠叨,家里人干任何事,他都得插手,说三道四,总觉得我们干不好。然后矛盾就来了,他认为是为我们简直操碎了心,而我们而嫌各种被管制,闹挺的要命,天...

2020-02-01 00:04:46 428 0

原创 搜索,推荐,广告系统架构及算法技术资料大合集吐血整理——2020年终分享

算法学习资料: AI_Tutorial 各大厂架构开发学习资源;精华机器学习,NLP,图像识别等人工智能领域学习资料,搜索,推荐,广告系统架构及算法技术资料吐血整理 你还在为学习算法摸不着头脑么?你还在为技术调研各种Google么?AI的牛b吹不上去?盯紧了,这里就是你的2020女朋友~。本项...

2020-01-03 16:42:18 2030 0

原创 程序员必知必会的零拷贝技术

写在前面 本篇文章我们学习Linux IO中的零拷贝技术,最后的参考链接中介绍的非常好,大家都可以看一下 传统IO过程 考虑这样一个过程:我们从磁盘中读取一个文件数据,然后将数据通过网络传输到另一个机器。对用户来说可能就是简单的理解为两步操作。 File.read(fileDesc, buf, l...

2019-12-31 17:20:34 420 0

原创 沟通的重要工具——乔哈里视窗

写在前面 今年最大的成长之一就是对沟通的理解和认知,包括沟通的意义,如何更好的去沟通,毕竟因为沟通踩了不少坑。但就在最近从樊登的一个演讲中,听到了“沟通视窗”的模型,感觉特别惊艳,它将沟通这个抽象高维的事情映射到更多人可以理解的二维上去讨论,不同场景不同个体的沟通都可以套用的框架。为我们如何做好沟...

2019-12-29 19:57:25 2083 0

原创 Tensorflow SavedModel 模型的保存和加载

from tensorflow.examples.tutorials.mnist import input_data import tensorflow as tf from tensorflow.saved_model.signature_def_utils import predict_sig...

2019-12-25 18:35:44 476 0

原创 读《影响力》这本书

作者: [美] 罗伯特·西奥迪尼 写了为什么有些人极具说服力,而我们总是容易上当受骗。隐藏在冲动地顺从他人行为背后的心理秘笈,正是这一切的根源。 前言 凡选择必有歧视。 凡竞争必有成本。 凡政策必遭遇对策。 凡争夺必有妥协。 … 嗯~,凡不看此文,必成为不了小坏蛋。 咔哒,毕 在说动物体内...

2019-12-24 22:53:59 238 0

原创 NIO中的Channel和Buffer

前言 打算输出一系列Netty源码分析与实践的文章,也作为后端开发学习过程中的沉淀。写作风格会遵循目标导向,关注核心,抽离出知识的Pattern,无价值细节决不花时间。 此文章为第三篇,和大家一块了解下NIO中的核心组件Channel和Buffer。 Channel Buffer Buffer...

2019-12-22 19:51:02 187 0

原创 深入理解 AQS 之 Condition 源码

前言 很久之前分享过ReetrantLock的实现深入剖析ReentrantLock公平锁与非公平锁源码实现,而今再回头去看,对AQS也有了更深刻准确的理解,随即更新了下之前的文章。今天分享利用AQS实现的另一个重要的JUC工具类Condition。如果上篇理解到位,这个Condition的学习就...

2019-12-15 19:44:34 225 0

原创 搜索推荐系统中用户意图识别——查询理解知识体系

最近调研了下查询理解的相关知识体系 分享个前段时间阿里对外分享的一个电商查询理解的PPT: 【搜索推荐直播系列第三场】开放搜索行业智能搜索技术介绍-电商查询理解-20191105 ...

2019-11-26 16:18:41 436 1

原创 微服务高可用利器——Hystrix熔断降级原理&实践总结

前言 最近在工作中参与组内服务稳定性建设,梳理我们目前服务现状并接入公司自研稳定性保障平台。对公司内自研组件以及业界流行的Hystrix做了学习,Netflix Hystrix 里面大量RxJava响应式实现,实在看着有点绕。所以在这里梳理一些实践以及Hystrix知识点。 为什么要做这个事情 服...

2019-11-25 14:53:51 327 0

原创 杭电 HDU ACM 2191 悼念512汶川大地震遇难同胞——珍惜现在,感恩生活(多重背包)

悼念512汶川大地震遇难同胞——珍惜现在,感恩生活 Time Limit: 1000/1000 MS (Java/Others)Memory Limit: 32768/32768 K (Java/Others) Total Submission(s): 19574Accepted Submi...

2019-11-07 22:40:01 978 0

原创 一行代码引发的集群服务宕掉的血案分析

本文禁止转载! 紧急处理过程 11.05号晚上接近20点,有同事反应其它服务调用XXX服务出现少量超时,看了下Cat监控,发现些许机器当时处于fullgc,因为我们的XXX服务本身在高峰期就有较为频繁的fullgc,并且当天我还灰度了一台调过JVM参的XXX机器(本意是解决之前fullgc问题)...

2019-11-07 12:35:39 243 0

原创 由Finalizer和SocksSocketImpl引起的Fullgc问题盘点

本文作者禁止转载 问题描述 问题1: 我们的网关服务在发布刚启动的时候,总是会报几次fullgc,并且会引起少量请求超时。 问题2.:同时服务在某些时间点会报出较多的超时异常,在cat监控上观察到超时异常和fullgc时间点吻合,fullgc耗时在600ms左右,那么至少fullgc停...

2019-10-18 21:06:51 253 0

原创 Centos7 安装Nodejs8.x

wget https://nodejs.org/dist/v8.6.0/node-v8.6.0-linux-x64.tar.xz sudo xz -d node-v8.6.0-linux-x64.tar.xz sudo tar xvf node-v8.6.0-linux-x64.tar sudo ...

2019-09-16 14:19:30 320 0

原创 关于“协议”的理解

工作中在一个网关服务中,对于一个接口的响应体ApiResponse,由之前返回给上游的“一定成功的响应”,改成了 返回 有可能包含“失败的响应”。当服务端业务逻辑处理失败时,封装了失败的响应体给上游后,上游校验到响应状态码ERROR后报警。 错误假设。 根据召回条件理论上该接口一定会从召回数据;...

2019-09-04 14:25:15 247 0

原创 大佬的课

对话录: 目前在做的东西?这些东西不做不行么?所做东西的定位和价值输出是什么? 个人目前有怎样的职业规划? 业务目标是什么? 为什么设立这样的目标? 在最终的业务目标上 所负责的东西为什么有利于目标达成 或业务价值? OKR中,如何评估你的关键结果? 所负责的东西 最终的对组织上的沉淀是什么? ...

2019-08-23 18:17:38 210 0

转载 分享一篇很棒的Linux IO栈讲解

原文地址: https://www.0xffffff.org/2017/05/01/41-linux-io/ 写在前面 在开始正式的讨论前,我先抛出几个问题: 谈到磁盘时,常说的HDD磁盘和SSD磁盘最大的区别是什么?这些差异会影响我们的系统设计吗? 单线程写文件有点慢,那...

2019-08-16 23:25:34 430 1

原创 InnoDB事务与分布式事务中一些关键问题

事务特性 ? •原子性: 事务是最小的执行单位,不允许分割。事务的原子性确保动作要么全部完成,要么完全不起作用; •一致性: 执行事务前后,数据保持一致; •隔离性: 并发访问数据库时,一个用户的事物不被其他事物所干扰,各并发事务之间数据库是独立的; •持久性:&n...

2019-08-11 01:51:39 237 0

原创 通用搜索系统整体架构

上周梳理了下搜索流程,抽取了通用的流程,先有全貌,然后再对每个环节细化学习。

2019-07-29 16:53:41 274 0

原创 Guava EventBus原理

引用

2019-07-24 02:18:18 190 0

原创 AB/Testing 实验平台

2019-07-24 02:10:19 458 0

原创 工作中一些原则体会

尽可能让一切变得简单,用最简单的方式完成工作 能用最少的概念,最精简易懂的概念模型来抽象系统,多一个概念就多一份别人了解系统以及维护系统的复杂度,别人也会质疑多一个概念的意义所在,自己如果没想清楚就容易被diss。特别是在类的设计中,会发现其实很多时候用一个类就可以表达要干的单一职责了,每个类职责...

2019-07-14 02:31:59 220 0

原创 关于redis的底层存储结构的几个问题

ziplist和 intse都是对小对象 比如小的set集合 小的dict 进行压缩存储的t底层数据结构,压缩队列 ziplist 是列表对象和哈希对象的底层实现之一。当满足一定条件时,列表对象和哈希对象都会以压缩队列为底层实现。 列表对象的编码可以是 ziplist 或 linkedlist,当...

2019-07-09 21:48:48 305 0

原创 《深度思维》内容脑图

买的时候以为是一本,类似《XX编程思想》类的书,需要耐心揣摩很长时间。看了后发现更多是工具性的书,所以半下午加半个晚上看完了,整理了一个知识点脑图。其实我觉得在生活中这些思维模型其实已经在应用了,只是有些没有去给他定义。 ...

2019-07-08 03:28:50 611 0

原创 微软 AB/Testing EXP 实验管理平台

Conference Paper · May 2018 The Anatomy of a Large-Scale Online Experimentation Platform。 因为工作负责和ABTest相关的事情,所以对ABTest系统理论与工程落地情况一直在调研,根据上面这篇论文,我们一起来...

2019-05-16 02:36:50 805 0

原创 深入剖析 Netty 源码设计(二)——BIO NIO AIO Reactor 模式到底干了啥

本文首发于 点击转到原文 前言 周末向往常一样睡了一上午,惆怅了一个中午,下午学了会习,梳理了下Netty的线程模型是如何体现Reactor模式的。继上一篇对一些通信底层IO的C函数学习,这一篇主要是总结Java里对底层IO不同层次的抽象,每一层都为了解决什么问题?为什么Reator模型使得现在N...

2019-01-28 12:35:49 537 1

原创 深入剖析Netty源码设计(一)——深入理解select poll epoll机制

前言 打算输出一系列Netty源码分析与实践的文章,也作为后端开发学习过程中的沉淀,此文章为第一篇,从操作系统底层的IO讲起,为Netty 的出场做下知识准备。 一些概念 文件描述符 文件描述符在形式上是一个非负整数。实际上,它是一个索引值,指向为每一个进程所维护的该进程打开文件的记录表。...

2019-01-24 10:51:08 968 0

转载 Google 重叠实验框架:更多,更好,更快地实验

转载自: http://www.6aiq.com/article/1548255866526 Introduction Google是一个数据驱动型公司,这意味着所有对用户的改动的发布,都要决策者以相应的经验数据作为依据。这些数据大部分是由在线流量上的实验产生的。在web的语境下,一个实验是由一股...

2019-01-23 23:10:54 1817 0

原创 工作中组内遇到的elasticsearch使用上的踩坑总结

嵌套索引的坑 场景: 一个spu doc下有多个内嵌的csu,csu内有上下架状态,前台操作某csu上下架,在商城界面看起来未生效。 坑1: mysql binlog消息监控组件dbus 通知服务端B多台机器消息变更时,未考虑spu下csu消息的消费顺序性,导致同一spu的多个csu上下架变更...

2019-01-13 20:52:01 1366 0

原创 Effective Java要点笔记

基础知识要常回顾~,为了把姿势搞的优雅些,leader推荐花一周看下这本书,写了个笔记。新的一年打算常更新博客。 第一章: 创建和销毁对象 1.类可以通过静态工厂方法来提供客户端,而不是通过构造器 优点: 自定义工厂名称,提高可读性 可以工厂里搞单例 控制实例类是哪...

2019-01-10 18:46:18 300 2

原创 Spark性能调优总结

使用正确的 transformations操作 虽然开发者达到某一目标,可以通过不同的transformations操作,但是有时候不同的姿势,性能差异非常明显。优化姿势的总体目标是尽可能少的产生shuffle, 和待被 shuffled data。因为shffule过程存在写盘和节点间网络IO...

2019-01-09 17:55:27 472 0

提示
确定要删除当前文章?
取消 删除