自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

舒哥的blog

https://www.6aiq.com AIQ-人工智能技术社区 全国最专业的人工智能大数据技术社区。

  • 博客(472)
  • 资源 (4)
  • 论坛 (7)
  • 收藏
  • 关注

原创 搜索、推荐、广告系统等人工智能优质技术资源最全整理
原力计划

前沿文章目录前沿开源地址[算法学习资料: AI_Tutorial](https://github.com/cbamls/AI_Tutorial)开源相关LuceneSolrElasticLucidWorks中文分词大公司阿里百度京东美团点评携程去哪儿搜狗一号店待分类开发应用理论基础源码解读常见问题其他人工智能领域文集算法学习资料: AI_Tutorial人工智能、AI架构、搜索系统、推荐系统...

2020-03-13 18:16:10 4095

原创 我的2020年度总结 “既往不恋,纵情向前”

写在前面复盘总结能力是一项个人重要的基本功,通过对过往的拆解与反思,沉淀出经验规律,更精准的“以终为始”做好未来的事情。本文以心路历程为主线:阐述述从大学以来成长经历,分享心得重点回顾2019做的好和有待改进的地方2020的规划成长经历我是2018年普通本科毕业,毕业后就一直在北京某互联网工作。初来乍到的碰撞我记得刚上大一的时候,是我大学思念认知冲击最痛的一年,当时核心暴露了...

2020-01-03 02:23:46 1005

原创 有哪些比较好的机器学习人工智能技术社区推荐

AIQ - 全国最专业的机器学习大数据技术社区,是一个以机器学习,大数据,云计算,数据分析,数据挖掘,人工智能,区块链为主要学习方向的学习交流社区,在这里可以讨论各种当下比较火热的技术,分享大数据,机器学习算法等各种优质精华文章与教程资料,填补了机器学习技术社区宇宙级空白,分享学习心得。人工智能是一个非常广泛的领域。当前人工智能涵盖很多大的学科,我把它们归纳为六个:(1)计算机视...

2018-04-04 10:37:19 6066

原创 Java9模块间的服务化详解

Jdk9模块化实战入门 本章我们来到了Jdk9新增的最重要的一块内容——模块化。有过编程经验的人都不应该对模块化陌生, 无论是项目代码的组织、还是应用的拆分、架构的设计都渗透着模块化的思想,如今jdk9 不但本身已经模块化,且对我们创建模块化的应用程序提供了“本地原生”支持。模块化的程序提供了更高级的封装性与服务化特性。本章我们将学习:什么是模块化jdk9 的模块化特性如何构建模块化程序面

2017-12-05 16:06:31 2132 1

原创 Git+Spring-boot+Docker+ Maven +Registry私有仓库 +jenkins 持续集成测试

测试Github项目地址:https://github.com/cbamls/eureka-registry 第一步 pull docker-registry#:docker pull registry// 此/opt/data/registry目录为私有仓库镜像宿主机映射目录#:/usr/bin/docker -d -v -v /opt/data/registry:/tmp/regist

2017-05-21 12:40:54 8892 1

原创 深入剖析ReentrantLock公平锁与非公平锁源码实现

本文以公平与非公平锁的加锁缩成为主线,分析整个加锁过程。准备知识简介ReentrantLock类图: NonfairSync继承关系: Node结点:作为获取锁失败线程的包装类, 组合了Thread引用, 实现为FIFO双向队列。 下图为Node结点的属性描述 锁的创建非公平锁(默认)final ReentrantLock lock = new ReentrantL

2017-03-19 15:29:40 13550 19

原创 如何做好规划?

周末下午听了我司高P的一堂课,讲的内容以及听众的提问都非常精彩,特此做下笔记。 共性问题: 想的少 闭门造车 不会规划 不会带人 不善表达 什么是规划?•融合多要素的发展愿景•对未来整体性、长期性、基本性问题的思考•设计全面长远的发展计划和行动方案 规划的意义? 无规划容易布朗运动,有规划给人确定感,比较靠谱,更有助于一步步达成最终目标。 规划的三个层次: 目的•三个层次:解决现有问

2020-11-23 00:43:25 32 1

原创 《领域驱动设计 DDD》核心知识梳理笔记

本书是毕业后读的第二本偏专业书,刚工作读的第一本教的是代码层面的如何让具体实现更优雅, 而这本书旨在提升抽象能力、顶层设计、领域建模能力。看书的过程中,书里解答了之前工作中很多的困惑,比如 团队间,项目模块间如何界定边界?有没有好的方式让项目代码摆脱越来越不可控的结局?另外更重要的是,我们看书的过程中,对内容的思考不要局限在工作本身, 里面的思想完全可以指导对生活中的领域问题如何建模,体会生活的别致与美妙。书里很多共鸣也有很多内容由于工作经验不足体会不深,目前对这座丰碑的精华摄取尚浅,期待在后续的工作和生活

2020-10-30 11:15:20 120 1

原创 CPU load高但CPU usage低问题排查

讲故事最近服务总是出现 cpu load高的告警,且告警经常还出现在低峰期的凌晨,所以很明显不是用户流量导致的负载高,但是 cpu buzy却很低。查看内存使用情况:mem.memused 接近100%,查看磁盘情况:swap.used周期性(30分钟左右)的较高, disk.io.util 低,但是 disk.io.avgqu-sz(平均请求队列的长度)周期性(30分钟左右)的较高,且和 cpu load高 同频。 后续经排查机器上上 crontab -l,查看周期为30分钟的定时任务,发现定时任务为

2020-10-19 18:44:13 98

原创 《金字塔原理》核心思想梳理

金字塔结构中心思想论点1论点2论点3概括概括概括论据2论据1论据3论据2论据1论据3论据2论据1论据3概括概括概括自上而下表达,结论先行自下而上思考,总结概括同一逻辑范畴必须按照逻辑顺序组织第一篇:表达的逻辑第一章:为什么要用金字塔结构1.金字塔结构可以让受众有兴趣,听得懂,记得住;2.金字塔结构可以让表达者观点鲜明,重点突出,思路清晰,层次分明,简单易懂。第一篇:表达的逻辑第二章:金字塔内部子结构中心思想论点:原因论点:经过论点:结果原因1原因2原因2经过1经过2经过3结果1结果2结果3自下而上,上一层

2020-10-11 22:35:09 73

原创 架构笔记

根据本文学习整理的架构图 贝壳找房 | 降本提效,贝壳搜索推荐架构统一之路

2020-09-29 20:19:56 30

原创 浅谈性能优化与稳定性保障实践

作者: 梁尔舒转载自:浅谈性能优化与稳定性保障实践序言良好的用户体验是业务持续增长的基础,而稳定性又是服务的基石。试想如果用户在商城购物时发现展位白屏,用户在搜索框搜索时,3秒后才返回结果,首先用户侧必然造成极差的用户体验,进而流失客户同时带来直接的企业损失。从产研侧,服务不稳定别说去“追求卓越“了,很可能会影响员工的绩效。在我们场景下,随着业务的迅猛发展:业务量的飞升、团队的快速扩张,对系统的稳定性和性能不断的提出新的挑战,记得团队内有段时间,几乎每次上线都存在大大小小的问题,稳定性问题是对团队.

2020-09-29 20:12:22 51

原创 Elasticsearch DSL语法中queries/filters执行顺序探秘

作者: 梁尔舒,李昀晖写在前面我们之前应该都了解链表求交、求并的算法,但是很少在实际工作中见过这些算法是怎么体现的,解决了哪些场景下的问题,其实lucene解决链表求交并的算法非常漂亮。最近因为工作中需要排查线上总是出现某些检索DSL执行比较慢,在网上到处找底层具体执行的资料,发现资料少之又少,讲API的文章千篇一律,直到在官网找到一篇漂亮的文章还特么全网没找到翻译,便借此机会系统学习了DSL在lucene底层到底是怎么执行的以及 profile API 工具的使用。在这里我把这篇文章的翻译分享给国人

2020-08-17 01:23:35 153

原创 企业级AB/Testing平台实践

什么是AB测试?在现实的产品迭代场景中,我们经常会遇到多个方案的选择的问题,在这里迭代的可以是UI界面,可以是算法策略。简单来说就是为同一个产品目标制定两个方案,一部分用户走A方案,另一部分走B方案,然后通过日志记录用户的使用情况,并通过结构化的日志数据分析相关指标,如点击率、转化率等,从而得出哪个方案更符合预期设计目标,并最终将全部流量切换至符合目标的方案。AB测试的价值?为评估产品优化效果提供科学的证据,量化收益判断方案的好坏,不断迭代优化,提升企业变现能力科学性的实验能够提升组织在产品层面

2020-08-05 22:07:03 364

原创 喜提北极代码库贡献者勋章(Arctic Code Vault Contributor)

项目地址。从此项目千年不腐、万年不朽了~,加波儿注释?方便后世研究。

2020-08-04 01:13:37 520

原创 在星巴克的碎碎念

碎碎念我觉得招聘应该把质量放在第一位,如果迫于招聘KPI的压力,或者目前业务发展现状招不来牛人,可以有一些妥协,但是依然需要秉持 质量 > 数量。因为会发现牛人的工作效率远高于水平一般的人。并且长期来看,团队之间的高下,很大程度归因于团队成员水平的高低,人是团队乃至公司的核心资产。什么样的团队是一个好的团队?记录下我目前的所见所闻。扁平化。上下级经常oneone。因为程序员本身不善言辞,上级主动一点,下级会心存感激。有利于上下目标等信息对齐,减少上下级的信息壁垒。有分享,成长驱动。基

2020-07-26 17:56:16 154

原创 用户一个搜索query进来,我是如何提供头等舱服务能力的?

背景近期要做述职,趁机思考下个人专业能力现状。思考围绕一个搜索领域常见的一个问题: 用户一个query进来,我是如何提供头等舱服务能力的? 来从个人能力模型角度思考下,应该提供怎样的服务,在服务的各个环节,“我”扮演的角色以及各环节中我的核心能力应该是哪些?将这个问题抽象为,用火箭( 类似鱼骨)将用户服务到上天的一个事情。首先底层燃料,就是我们肚子里的智慧,一级一级的火箭燃烧过程就是我们的能力变现为业务服务的过程。核心就是把燃料烧到关键位置上(落地、决策能力),还得恰到火候(团队、架构规划)召回查

2020-06-20 18:56:21 172

原创 塔勒布《反脆弱》读后感

关于作者作者纳西姆·尼古拉斯·塔勒布的两部超级畅销书《随机漫步的傻瓜》和《黑天鹅》,已经成为华尔街投资人士必读的经典著作。其本人也曾因成功预测金融危机,做空美股而名声大噪。他一生专注于研究运气、不确定性、概率和知识。之前在樊登一个演讲中,听他给了《反脆弱》这本书极高的评价,只好百忙之中拜读一番。黑天鹅三个特点:不可预测影响重大事后具有可解释性它跟我们看待问题的视角有关。塔勒布指出,就是这一点大大降低了我们对黑天鹅实践的重视程度。从事前来看,会发现这件事情并没有原因,在当时没办法预测。但是事件

2020-06-20 00:30:31 1190

原创 Elasticsearch 电商营销活动索引Mapping参考

原文:https://truemped.github.io/posts/search/campaigns-in-elasticsearch/Mapping定义:{ "mappings": { "properties": { "prices": { "type": "nested", "properties": { "p...

2020-04-20 15:03:24 247

原创 Word delimiter graph token filter(word_delimiter_graph 词元过滤器)
原力计划

本文禁止转载。原文地址word_delimiter_graph 使用非字母字符切分 tokens,并可以根据规则执行一些可选的 token 正则化。默认情况下,word_delimiter_graph 会使用以下规则:使用非字母字符作为切分点。 比如 Super-Duper → Super, Duper移除每个 token 前置和后置分隔符。比如 XL---42+'Autocoder'...

2020-04-01 11:41:05 373

原创 水墨-在线 Markdown 编辑器

墨刀-在线 Markdown 编辑器基于 Spring-boot、FreeMarker、layui、Vditor 构建的一款在线 所见即所得的 Markdown 编辑器。墨刀-在线 Markdown 编辑器。本人使用 Vditor 编辑器时日已久,眼看着其功能日益强大,特此基于 Vditor 构建一款 Web 编辑器,愿为天下文人墨客贡献微不足道的力量。此项目正在陆续开源,疫情期间代码仓促,...

2020-03-01 23:24:32 437

原创 NLP中文分词知识梳理

中文分词开源工具ik,jieba优缺点优点:使用开源通用语料,综合全面,但缺乏专业词汇缺点:词汇时效方面,新词不及时识别行业结论实践证明,基于统计学习的分词工具要优于基于人工规则的分词工具评测结果表明,未登录词所造成的分词精度下降至少比分词歧义大5倍以上实验结果证明,字标注统计学习方法能够大幅提高未登录词的识别率难点1清晰地界定中文词汇: 如“科教兴国”切词成【科教兴国】和【科教】,【兴国】都符合...

2020-02-06 16:33:18 342

原创 “肺炎疫情”安置在家的“碎碎念”

“武汉肺炎”疫情期间,除特殊必须行业外,很多上班的,务工的都闷在家里。人一闲下来就胡思乱想。我爸非常固执,没啥文化,根本不懂逻辑,抽象,整天强迫症似的瞎唠叨,家里人干任何事,他都得插手,说三道四,总觉得我们干不好。然后矛盾就来了,他认为是为我们简直操碎了心,而我们而嫌各种被管制,闹挺的要命,天天一些琐碎的细节说个不停。然后我就总是针对性的要想改造他,对他讲一通大道理,但是这么年下来,屁用没有,...

2020-02-01 00:04:46 553

原创 搜索,推荐,广告系统架构及算法技术资料大合集吐血整理——2020年终分享

算法学习资料: AI_Tutorial各大厂架构开发学习资源;精华机器学习,NLP,图像识别等人工智能领域学习资料,搜索,推荐,广告系统架构及算法技术资料吐血整理你还在为学习算法摸不着头脑么?你还在为技术调研各种Google么?AI的牛b吹不上去?盯紧了,这里就是你的2020女朋友~。本项目会持续关注AI落地的一些优质技术资料。大家也可以去网站投稿。算法学习资料: AI_Tutorial...

2020-01-03 16:42:18 10331 4

原创 程序员必知必会的零拷贝技术

写在前面本篇文章我们学习Linux IO中的零拷贝技术,最后的参考链接中介绍的非常好,大家都可以看一下传统IO过程考虑这样一个过程:我们从磁盘中读取一个文件数据,然后将数据通过网络传输到另一个机器。对用户来说可能就是简单的理解为两步操作。File.read(fileDesc, buf, len);Socket.send(socket, buf, len);但是,如果我们看传输中涉及的...

2019-12-31 17:20:34 536

原创 沟通的重要工具——乔哈里视窗

写在前面今年最大的成长之一就是对沟通的理解和认知,包括沟通的意义,如何更好的去沟通,毕竟因为沟通踩了不少坑。但就在最近从樊登的一个演讲中,听到了“沟通视窗”的模型,感觉特别惊艳,它将沟通这个抽象高维的事情映射到更多人可以理解的二维上去讨论,不同场景不同个体的沟通都可以套用的框架。为我们如何做好沟通,成就个人和组织价值,提供了指导思想。我便找了更多的资料来了解并分享它,“沟通”是一项基本功,希望我...

2019-12-29 19:57:25 10460

原创 Tensorflow SavedModel 模型的保存和加载

from tensorflow.examples.tutorials.mnist import input_dataimport tensorflow as tffrom tensorflow.saved_model.signature_def_utils import predict_signature_deffrom tensorflow.saved_model import tag_c...

2019-12-25 18:35:44 833

原创 读《影响力》这本书

作者: [美] 罗伯特·西奥迪尼写了为什么有些人极具说服力,而我们总是容易上当受骗。隐藏在冲动地顺从他人行为背后的心理秘笈,正是这一切的根源。前言凡选择必有歧视。凡竞争必有成本。凡政策必遭遇对策。凡争夺必有妥协。…嗯~,凡不看此文,必成为不了小坏蛋。咔哒,毕在说动物体内会有很多固定的行为模式,组成这个模式的所有行为,每一次都以同样的方式,按照同样的次序出现,就好像已经...

2019-12-24 22:53:59 341

原创 NIO中的Channel和Buffer

前言打算输出一系列Netty源码分析与实践的文章,也作为后端开发学习过程中的沉淀。写作风格会遵循目标导向,关注核心,抽离出知识的Pattern,无价值细节决不花时间。此文章为第三篇,和大家一块了解下NIO中的核心组件Channel和Buffer。Channel BufferBuffer顾名思义,本质上就是一个内存缓冲区,作为存储数据的一块内存而已。对于每个非布尔原始数据类型都有一个缓冲...

2019-12-22 19:51:02 261

原创 深入理解 AQS 之 Condition 源码

前言很久之前分享过ReetrantLock的实现深入剖析ReentrantLock公平锁与非公平锁源码实现,而今再回头去看,对AQS也有了更深刻准确的理解,随即更新了下之前的文章。今天分享利用AQS实现的另一个重要的JUC工具类Condition。如果上篇理解到位,这个Condition的学习就没啥难度的~我们应该都了解过Object的一些监视器方法:wait(), notify(), not...

2019-12-15 19:44:34 417

原创 搜索推荐系统中用户意图识别——查询理解知识体系

最近调研了下查询理解的相关知识体系分享个前段时间阿里对外分享的一个电商查询理解的PPT:【搜索推荐直播系列第三场】开放搜索行业智能搜索技术介绍-电商查询理解-20191105...

2019-11-26 16:18:41 1005 1

原创 微服务高可用利器——Hystrix熔断降级原理&实践总结

前言最近在工作中参与组内服务稳定性建设,梳理我们目前服务现状并接入公司自研稳定性保障平台。对公司内自研组件以及业界流行的Hystrix做了学习,Netflix Hystrix 里面大量RxJava响应式实现,实在看着有点绕。所以在这里梳理一些实践以及Hystrix知识点。为什么要做这个事情服务的稳定是公司可持续发展的重要基石,随着业务量的快速发展,一些平时正常运行的服务,会出现各种突发状况...

2019-11-25 14:53:51 674

原创 杭电 HDU ACM 2191 悼念512汶川大地震遇难同胞——珍惜现在,感恩生活(多重背包)

悼念512汶川大地震遇难同胞——珍惜现在,感恩生活Time Limit: 1000/1000 MS (Java/Others)Memory Limit: 32768/32768 K (Java/Others)Total Submission(s): 19574Accepted Submission(s): 8285Problem Descripti...

2019-11-07 22:40:01 1113

原创 一行代码引发的集群服务宕掉的血案分析

本文禁止转载!紧急处理过程11.05号晚上接近20点,有同事反应其它服务调用XXX服务出现少量超时,看了下Cat监控,发现些许机器当时处于fullgc,因为我们的XXX服务本身在高峰期就有较为频繁的fullgc,并且当天我还灰度了一台调过JVM参的XXX机器(本意是解决之前fullgc问题)。 所以当时误以为是像往常一样的fullgc引发的上游超时,同时从Cat gc指标来看,我灰度的一台...

2019-11-07 12:35:39 326

原创 由Finalizer和SocksSocketImpl引起的Fullgc问题盘点

本文作者禁止转载问题描述问题1: 我们的网关服务在发布刚启动的时候,总是会报几次fullgc,并且会引起少量请求超时。问题2.:同时服务在某些时间点会报出较多的超时异常,在cat监控上观察到超时异常和fullgc时间点吻合,fullgc耗时在600ms左右,那么至少fullgc停顿时间是造成短时间内大量超时的因素。并且观察到old区内存非常缓慢的线性增长,在达到old区内存92...

2019-10-18 21:06:51 636

原创 Centos7 安装Nodejs8.x

wget https://nodejs.org/dist/v8.6.0/node-v8.6.0-linux-x64.tar.xzsudo xz -d node-v8.6.0-linux-x64.tar.xzsudo tar xvf node-v8.6.0-linux-x64.tarsudo mv node-v8.6.0-linux-x64 nodesudo cp -R node /usr/...

2019-09-16 14:19:30 484

原创 关于“协议”的理解

工作中在一个网关服务中,对于一个接口的响应体ApiResponse,由之前返回给上游的“一定成功的响应”,改成了 返回 有可能包含“失败的响应”。当服务端业务逻辑处理失败时,封装了失败的响应体给上游后,上游校验到响应状态码ERROR后报警。错误假设。 根据召回条件理论上该接口一定会从召回数据; 一般客户端都会校验服务端响应状态码,并做好不同响应的处理逻辑,思维只停留在自身代码的重构,未评估好影...

2019-09-04 14:25:15 353

原创 大佬的课

对话录:目前在做的东西?这些东西不做不行么?所做东西的定位和价值输出是什么?个人目前有怎样的职业规划?业务目标是什么? 为什么设立这样的目标?在最终的业务目标上 所负责的东西为什么有利于目标达成 或业务价值?OKR中,如何评估你的关键结果?所负责的东西 最终的对组织上的沉淀是什么?所负责的东西 个人有什么提升?打算怎么去做, n年后如何迭代?n年后会有什么提升?一个新的需求过来,...

2019-08-23 18:17:38 252

转载 分享一篇很棒的Linux IO栈讲解

原文地址: https://www.0xffffff.org/2017/05/01/41-linux-io/写在前面在开始正式的讨论前,我先抛出几个问题:谈到磁盘时,常说的HDD磁盘和SSD磁盘最大的区别是什么?这些差异会影响我们的系统设计吗?单线程写文件有点慢,那多开几个线程一起写是不是可以加速呢?write(2)函数成功返回了,数据就已经成功写入磁盘了吗?此时设备断电会有...

2019-08-16 23:25:34 704 1

原创 InnoDB事务与分布式事务中一些关键问题

事务特性 ?•原子性: 事务是最小的执行单位,不允许分割。事务的原子性确保动作要么全部完成,要么完全不起作用;•一致性: 执行事务前后,数据保持一致;•隔离性: 并发访问数据库时,一个用户的事物不被其他事物所干扰,各并发事务之间数据库是独立的;•持久性: 一个事务被提交之后。它对数据库中数据的改变是持久的,即使数据库发生故障也不应该对其有任何影响...

2019-08-11 01:51:39 298

《C语言程序设计》课后习题答案(第四版)谭浩强.docx

《C语言程序设计》课后习题答案(第四版)谭浩强 从此 课后习题再也不是事 帮助同学们练习c语言实践能力 提高技能

2014-11-20

CPU-Z测试参数详解

cpu-z对系统测试的各项参数进行了 详细的分析和原理介绍~!让您成为“业内人士”。此文档必为卖家买家的必备神器!

2015-11-10

杭电acm初学者课件

杭电 acm 对于很多新手来说 可以说是帮助非常大 里面有acm 题库的使用方法 和 acm 竞赛及其发展的介绍。还有很多常见错误解析 初学者首先要了解这些

2015-09-22

宾馆信息管理系统课程设计报告(大一)

大一的课程设计 一个宾馆信息管理系统 ,同时适用其他 管理系统课题 只需做稍加修改。

2015-09-08

研发之道的留言板

发表于 2020-01-02 最后回复 2020-01-02

csdn 头像问题

发表于 2015-04-04 最后回复 2017-03-07

acm 深搜题目

发表于 2015-05-07 最后回复 2015-05-08

杭电一个典型dp问题 特别简单 就是a不了

发表于 2015-04-30 最后回复 2015-05-07

一个oj题目 判断括弧是否匹配

发表于 2015-04-11 最后回复 2015-04-11

csdn博客 头像问题

发表于 2015-03-20 最后回复 2015-04-04

内置类型 范围问题 long double

发表于 2015-03-16 最后回复 2015-03-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除