自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 资源 (2)
  • 收藏
  • 关注

原创 Mac环境下打开WebStorm中settings

在用webstorm 开发nodejs时,由于版本不一样,window和Mac打开settings时会有很多不方便,现在就用一招就调出settings窗口:打开到WebStorm界面后使用快捷键 Command+‘,’,直接调出settings窗口  ...

2018-07-28 21:32:23 7258

原创 求助,nodejs 在安装threads_a_gogo时报错

目前用webstrom开发工具,在运行时,报错:安装命令:sudo npm install -g threads_a_gogo,运行出错截图:下图是,run运行出错截图请教各位大神,这个问题如何解决,很急。。。...

2018-07-27 12:01:20 1239

原创 nodejs throw er; // Unhandled 'error' event

在运行nodejs 时,有时候会报错,throw er; // Unhandled 'error' event,说明可能是之前运行的程序占用了现在运行的端口,更改端口即可 

2018-07-27 09:46:52 1363

原创 数据结构和非数据结构详解

在提到数据结构和非数据结构时,好多人都有这样的意识,概念可能说不上来,接下来就来说说结构化数据和非结构化数据的概念以及不同:结构化数据、非结构化数据是对存储形式的一种数据类型分析,有助于企业细分行业案例,帮助存储合作伙伴更好地解决应用实施方案。结构化数据结构化的数据是指可以使用关系型数据库表示和存储,表现为二维形式的数据。一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相...

2018-07-14 09:39:12 2145

原创 用execjs破解百度翻译sign

打开开发者工具:查翻译发送的请求信息,得到其 FormData 看到有个sign,接下来就破解一下,signsign 这个参数,应该如何设置?我们在 js 代码中,发现在某个 index_xxx 开头的 js 代码中发现一段可疑代码。将这段代码在格式化工具中重新排版一下,可以找到sign,是由待翻译的信息再用m函数运行之后得到的,m函数js代码如下:function a(r) {        i...

2018-07-11 16:45:51 3504 2

原创 爬取51job职位信息

今天在爬职位信息的时候,先用的requests模块,后来发现,获取的数据全部是乱码。果断换成selenium+Chrome,成功获取数据,保存MongoDB在前期校验获取成果时,建议用selenium+Chrome,后期测试通过,换成无界面的PhantomJS代码如下:import timefrom selenium import webdriverfrom selenium.webdriver....

2018-07-07 20:00:54 1456

原创 pymongo.errors.DuplicateKeyError: E11000 duplicate key error collection: anjuke.ershoufang index

这个bug忙了我一下午加一个晚上,终于把它ko掉了先附上一段爬取安居客二手房信息的代码import reimport timeimport pymongoimport requestsfrom bson import ObjectIdfrom lxml import etreefrom pprint import pprintheaders = {    "User-Agent": "Mozill...

2018-07-06 23:13:58 4906 1

原创 MongoDB与Redis的区别分析

MongoDB 和 Redis 的区别:简介MongoDB 更类似 MySQL,支持字段索引、游标操作,其优势在于查询功能比较强大,擅长查询 JSON 数据,能存储海量数据,但是不支持事务。MySQL 在大数据量时效率显著下降,MongoDB 更多时候作为关系数据库的一种替代。Redis 是一个开源(BSD许可)的,内存中的数据结构存储系统,它可以用作数据库、缓存和消息中间件。它支持多种类型的数据...

2018-07-04 09:46:31 6889

原创 用Python实现微信撤回消息还原

在使用微信过程中,有时候我们会撤回一些发错或者不该发的一些信息,今天我就用一段代码实现将撤回的消息还原。。。从此再也不怕别人撤回消息,自己不能看的尴尬了import osimport reimport shutilimport timeimport itchatfrom itchat.content import *# 说明:可以撤回的有文本文字、语音、视频、图片、位置、名片、分享、附件# {ms...

2018-07-03 23:18:27 5153 2

原创 安装pyv8 过程出现的问题 src/Exception.h:6:10: fatal error: v8.h: 没有那个文件或目录

src/Exception.h:6:10: fatal error: v8.h: 没有那个文件或目录 error: command 'x86_64-linux-gnu-gcc' fai今天在安装pyv8的时候出现各种坑,最后还是让我解决掉了,下面梳理一下bug,为大家呈上教程首先在安装pyv8之前,要先安装依赖:安装依赖 首先安装依赖:Boost, 这一步网上的大部分教程都差不多,也是必须的; s...

2018-07-03 17:26:19 2691 1

原创 数据库优化方案之查询语句

数据库优化方案,主要的还是要优化查询语句,主要思路就是避免全表查询!!1.对查询进行优化,要尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如:select id from t where num is null最好不要给数据库留NULL,尽可能的使用 ...

2018-07-02 11:05:50 199

原创 聚焦爬虫与通用爬虫详解

根据使用场景,网络爬虫可分为 通用爬虫 和 聚焦爬虫 两种.通用爬虫通用爬虫:搜索引擎用的爬虫系统。搜索引擎和web服务商提供的爬虫。目标:就是尽可能的;把互联网上的所有的网页下载下来,放到本地服务器里形成备分,在对这些网页做相关处理(提取关键字、去掉广告),最后提供一个用户检索接口。抓取流程:首先选取一部分URL,把这些URL放到待爬取队列。从队列取出URL,然后解析DNS得到主机IP,然后保存...

2018-07-01 21:31:45 6832

邮件发送,数据库迁移,蓝图

在开发过程中,很多应用程序都需要通过邮件提醒用户,Flask的扩展包Flask-Mail通过包装了Python内置的smtplib包,可以用在Flask程序中发送邮件。

2018-05-11

Python网络数据采集

针对网络采集出现各种问题的解决,针对网络采集任务提供全面的指导

2018-05-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除