自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

更上一层楼!

人类的悲欢并不相通!

原创 jetbrains系列IDE license免费制作

前言今天偶然看到一篇好文章,至于具体内容嘛,如题。先前没用过jetbrains公司的IDE的时候,觉得还不是这么的依赖它,但是这家伙却能在你用过一次后深深地抓住你的心,从此再也离不开了。1 每次安装好,面对不激活无法使用的弹出框,心里不知道问候了多少次它祖宗,但是没办法,生活还得继续不是,因此再去网上搜索一些免费的license,姑且用着了。2 然而,用着用着,在某一天的清晨,再次打开IDE...

2018-09-23 01:57:10 649

原创 网页制作pdf

前言沉迷农药,抖音,总归是不好的。在要吃苦的年纪里选择安逸,那么老了一定会后悔,埋怨年轻的时候不知道努力的自己。于是又找出了尘封已久的kindle,打算好好看看书,给自己充充电。Amazon上好书要钱,readfree上充斥着文学类的书,思来想去,找到自己喜欢的内容,自己制作电子书来看岂不是一个更好的选择。而且内容完全由自己来定,把每天搜集到的不错的网页制成PDF发到kindle上,下班回去就...

2018-09-20 23:44:27 945

原创 Go+PHP实现敏感词检测

概述广告,敏感词检测一直以来都是让人头疼的话题,仅仅通过添加敏感词列表是解决不了问题的。今天封禁了这个词,明天又会有新的违禁词冒出来,比起愚公无穷尽的子孙更甚。敏感词匹配这种治标不治本的方法,在一定的语义下蛮有效的,但是这个场景对高并发,访问QPS高的服务来说,不是很合适。前段时间看到垃圾邮件检测用到的贝叶斯分类算法,这种“半学习”形式的方法的准确度依赖于先验概率的准确性,而公司长期以来整...

2018-09-14 11:28:39 1736 1

原创 simhash

听闻SimHash很强,对海量文档相似度的计算有很高的效率。查了查文档,大致的流程如下:大致流程就是:分词, 配合词频计算哈希串(每个分出来的词最终会计算处同样的长度), 降维,计算海明距离。#coding:utf8import mathimport jiebaimport jieba.analyseclass SimHash(object): def __init...

2018-09-09 15:57:35 851

原创 supervisor笔记

最近写了一个wiki看门狗(wiki-watchdog), 作用就是监控wiki的改动,然后通过钉钉机器人发送到群组。因为脚本健壮性的问题,代码有可能会不定期crash掉,所以需要一个能在脚本crash后及时恢复的服务,查了查发现supervisor挺合适。简介Supervisor是一款用于管理和监控类 UNIX 操作系统上面的进程工具,基于Python开发,典型的Client/Ser...

2018-09-04 21:01:32 293

转载 转载--《写给工程师的十条精进原则》

昨晚看到一篇美团技术团队的文章分享,觉得作者写的很走心,作为一个刚毕业的学生,有太多太多的地方还差得多,更得虚心求教,充实自己才是。引言时间回到8年前,我人生中第一份实习的工作,是在某互联网公司的无线搜索部做一个C++工程师。当时的我可谓意气风发,想要大干一场,结果第一次上线就写了人生中第一个Casestudy。由于对部署环境的不了解,把SVN库里的配置文件错误地发到线上,并且上完...

2018-09-02 13:01:09 228

提示
确定要删除当前文章?
取消 删除