自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Hugh

听话乖巧吃得少

  • 博客(22)
  • 收藏
  • 关注

原创 「 Vue×Docker」服务器部署Vue遇到的那些坑

项目之前一直在电脑本地做的,废弃了很久才想起来部署到服务器上。因为是第一次用vue,发布时遇到了很多问题,用了5个小时才解决掉。 主要问题有两个: 1. 不清楚如何发布vue项目,服务器上npm run dev只能本地测试使用。 2. 数据接口的代理加载不出资源。服务器环境: linux 7.0 x86_64 npm 6.1.0 vue 2.9.6 docker...

2018-06-13 00:35:16 6738

原创 Photoshop 简笔效果

Photoshop打开图片,图像 >> 调整 >> 去色 复制图层 或 Ctrl+J 将新图层混合模式选择为 “颜色减淡” 图像 >> 调整 >> 反相 滤镜 >> 其他 >> 最小化 选择半径为1,半径过大会使图片失真 ...

2018-06-10 19:30:42 472

原创 「PPT」养成计划

接触PPT也有三四年的时间了,谈不上精通也算是蛮熟悉的。 因为常听朋友抱怨没有好用的模板可用,做出来的PPT无法直视等等…… 很多做PPT的朋友都觉得好模板千金难求,还专门买了某图网的会员来下模板。 所以这篇文章着重讲讲作为一个PPT新手,是如何一步步「摆脱模板」,做出自己风格的。 为了写这篇博客,我把几年前做的PPT都翻了出来,简直是公开处刑了(逃)。从零到一回顾这几年做...

2018-06-10 19:29:35 432

原创 「Vue」点击滚动页面与$nextTick问题解决

这一篇主要讲述今天使用Vue点击滚动的实现 以及Vue在页面渲染未完成时滚动偏移的问题页面结构添加滚动前页面的基本结构 点击标题时触发绑定样式.table-display,当前点击显示的表格为display:table;其他详情表格为display:none; 监听点击事件触发方法修改标识,控制样式的绑定。<template> &l...

2018-06-10 19:28:38 1323

原创 网页中GIF不循环播放解决方案

需求在网页中使用img标签嵌入gif动态图时会遇到只播放一次就停止的情况, 只需要在photoshop中对图进行一些简单的修改,保存即可Photoshop中打开GIF图,打开时间轴看到左下角循环为1次文件>>存储为Web所用格式,或使用快捷键alt+ctrl+shift+s动画循环次数选择”永远”,存储 保存完成后嵌入网页就可以看到效果啦...

2018-06-10 19:27:49 27303

原创 「Mongo」聚合操作与清洗重复数据项

使用Mongo聚合操作来进行重复的数据项清洗,并使用PyMongo加入到数据清洗组件中。当前环境:PyMongo 3.6.1 / MongoDB 3.4.7 / Python 3.6.4 :: Anaconda, Inc.在爬虫中断续爬时会出现少量数据重复的问题,我将数据去重放在了数据清洗环节,清洗的过程中顺带将重复的数据删除。 Mongo老版本的解决方案是建立单一索引,Mo...

2018-06-10 19:26:06 2736

原创 「Mongo」索引优先级的问题

在MongoDB复合索引的情况下,写在前面的字段优先级更高,直接影响查询速度。我的数据库结构是集合 test 中有爬虫数据,字段结构基本相同。{ "_id" : ObjectId(), "source" : "hhnsh", // 区分数据来源 "date" : "2001-01-01", // 通过日期排序 "title&q

2018-06-10 19:25:26 1256

原创 「Python」正则\b异常的问题解决

在使用正则表达式排除指定字符串时,经常用到\b(?!*)来匹配, Python的正则引擎有个需要注意的问题,否则会导致\b失效需求是将html标签中的参数匹配出来洗掉,但要保留src,href>…等几个指定的参数, 网上常用的思路是使用\b(?!xxx)\w+来实现排除指定单词, 在sublime中的测试结果: regextester在线工具测试结果: 在j...

2018-06-10 19:24:52 1681

原创 「Python」数据清洗常用正则

爬虫从网站上爬取的内容在读写操作时经常会报以下错误: UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\u200b’ in position 7: illegal multibyte sequence 所以需要我们对数据Unicode进行清洗,排除文章内异常的Unicode符号。清洗思路我的思路是用正则...

2018-06-10 19:24:17 3502 2

原创 「Python」数据清洗常用正则

对爬虫数据进行自然语言清洗时用到的一些正则表达式标签中的所有属性匹配(排除src,href等指定参数)参考链接# \b(?!src|href)\w+=[\'\"].*?[\'\"](?=[\s\>])# 匹配特征 id="..." # \b(?!...)排除属性名中的指定参数,零宽断言前向界定判断属性结束# tips: 带\b的python正则匹配一定要加r...

2018-06-10 19:23:13 1422

原创 「Python」记一次凭想象重复造轮子的错误示范

读文档的意义在于知道别人已经实现了什么,怎么用 读源码的意义在于知道轮子是怎么造出来的 要好好学英语 用了三天的时间造了一个方形轮子,记录下来以吸取教训。 需求是用正则匹配一段文章,有n个匹配项,指定删除其中的某一个(第1个/第2个/倒数第1个…) Python re库的文档是英文的,在提不起兴趣一句一句翻译下,从这里开始走上了一条岔路。 错误的实现思路: ...

2018-06-10 19:22:01 374

原创 「Python」爬虫自然语言清洗组件 v1.0.0

公告:博主因使用魔理沙的扫把表达清洗,已被车万粉拉去祭天。设计思路我认为从网站上爬取下来的内容要清洗的有两大块:通用清洗和规则清洗,换句话说就是可复用的和不可复用的。 通用清洗是每个爬虫常见的问题,比如特殊编码、html标签、换行空格符等。 特殊清洗是在通用清洗的基础上,网站结构产生的特殊问题,比如多余的固定字符等。通用清洗通用清洗涵盖以下几个方面: ...

2018-06-09 23:00:01 642 1

原创 「Mongo」块操作初体验

在MongoDB中使用批量操作或块操作「Bulk Write」在效率上有非常大的提升,适合大量写操作第一次尝试使用批量操作进行数据清洗,并且用PyMongo模拟了少量数据来进行测试,构造50w条数据进行插入或更新操作。 模拟环境: PyMongo 3.6.1 MongoDB 3.4.7 Python 3.6.4 :: Anaconda, Inc.模拟数据...

2018-06-09 22:59:32 397

原创 「Scrapy」爬虫状态反馈组件 v1.0.0

爬虫服务在服务器上跑着,心里面难免会犯嘀咕, 爬虫死掉了怎么办? 爬虫漏了数据怎么办? 爬虫被网站封禁了怎么办? 目标网站挂了怎么办? 返回页面错误或被跳转怎么办? …以上来自一个被迫害妄想症患者的自白(误) 一次性爬取数据可以通过人工看日志来判断,不行就多爬几遍, 但如果是放在服务器上定时爬取的服务怎么办?尤其是已经部署在Docker中的爬...

2018-06-09 22:58:42 959

原创 「Python」控制台输出颜色

显示格式 \033[显示方式;前景色;背景色m显示方式 显示方式 意义 0 终端默认设置 1 高亮显示 4 使用下划线 5 闪烁 7 反白显示 8 不可见前景色和背景色 前景色 背景色 颜色 30 40 黑色 31 41 红色 ...

2018-06-09 22:57:30 1994

原创 「Docker」配置NodeJS+MongoDB

需求在Docker中运行一个Nodejs项目,连接Mongo数据库进行数据操作,并启动RockMongo容器思路使用容器连接(link)方法,Mongo容器与WebApp容器连接数据库连接语句要通过容器别名构建!!!宿主机只需监听Web端口即可Rockmongo用于图形化界面管理数据库前期准备服务器上已有nodejs环境并可运行,根目录在/usr/l...

2018-06-09 22:56:23 1545

原创 「Docker」配置Nginx反向代理

功能需求同一主机上有多个web项目,需要将不同的宿主机端口绑定到对应域名解决方案宿主机可以直接配置Nginx来实现,配置各个域名对应的nginx配置文件即可,在这里将反向代理封装进Docker前期准备宿主机安装Docker创建配置文件nginx配置文件存放在宿主机,直接在宿主机修改配置文件就可以添加新映射,后续不需要进入容器$ mkdir...

2018-06-09 22:55:51 2468 2

原创 「Docker」配置Hexo+Git+Nginx

功能需求像我这种废柴码字儿的总喜欢追求逼格,原来用博客园onenote可以直接导入,后来就想迁移到自己云主机上 为了保证服务器环境的干净(强迫症晚期),将整套环境封装进docker中 如果想要8003直接绑定到域名上,见另一篇Docker配置Nginx反向代理解决方案Hexo+Github的构建博客资料网上有很多,不赘述,不使用这种方法Hexo+Git+Nginx+...

2018-06-09 22:55:02 1556

原创 我们的责任心去哪儿了?

责任即「对契约的履行」责任心的定义是:责任感是一种自觉主动地做好分内分外一切有益事情的精神状态。 在定义中的重点是:「分外」和「有益事情」。 「分外」即在自己职责之外,或者可以认为是需要花费自己的时间精力却得不到正向收益的事情。 「有益事情」即非利己而利事情,以事情完成度的好坏为基准而非以自身利益为基准的。 而站在责任心对立面的是人的「趋利性」。 事情的高完成度除了自身能力以...

2018-06-09 22:54:01 295

原创 你那么优秀还这么拼干嘛

谨以此文怀念以前那个拼命的自己,并且狠狠打现在的自己一耳光。「你那么优秀还这么拼干嘛?」 这个问题一天的时间被人问了两次,实在不知道应该怎么回答。 因为在自己的认知里,现在的我不仅配不上“优秀”二字,更失去了“拼”的劲头,心里挺不是滋味的。 记得2014年高中毕业,暑假里跟着公司做系统集成。那个时候的自己真好,虽然一无所长,但是什么都愿意学,愿意思考。在江师大招标做投影仪迁移项目...

2018-06-09 22:53:24 218

原创 开通博客一周年:新手的从零到一

开通博客整整一年了,走了很多弯路,也换了很多平台。现在总算是能写成“成段”的文字了,但距离“成篇”还差很多。通过回首这一年走过来,通过自己的写字的经历来聊聊如何从零到一来开始写作。 第一阶段 第二阶段 第三阶段 时间 2017.05 - 2017.09 2017.09 - 2018.05 平台 博客园 Hexo博客(自建服务器) 方式...

2018-06-09 22:52:38 196

原创 打造有质感的PPT

我即使是死了,钉在在棺材里了,也要在墓里,用这腐朽的声带喊出「对齐」! —— 鲁迅配色与风格(划重点)从性冷淡PPT到质感PPT,其实只差几张图和一手熟练的PS 整体风格还是延续性冷淡风格的,在此基础上进行了改进。 背景颜色从渐变灰变成了带蓝色的渐变(为了搭配封面的色调),比渐变灰要清爽很多。 PPT配色是 7:2:1 = 白:黑/蓝灰:红 主体亮色的灰白作为背景,...

2018-05-06 00:58:27 965

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除