2016年11月_ShirleyPaul

11月 10月 09月 07月 06月 05月

转载 java中调用Python__C中调用Python

转载自：http://blog.sina.com.cn/s/blog_64e467d60100uhls.html http://sourceforge.net/projects/jython/下载jython包，把其中的jython.jar添加到工程目录1.在Java类中直接执行Python语句 view plain import javax.script.*; import org.pyt

2016-11-23 23:04:27 354

原创【Mongodb】记录1_开始MongDB

1.进入mongodb的bin目录执行命令 2.启动服务 mongod –dbpath [mongodb路径]\data –storageEngine =mmapv1 –journal 3.浏览器输入http://localhost:27017/ 出现页面提示 It looks like you are trying to access MongoDB over HTTP on the n

2016-11-14 15:06:28 415

原创【Scrapy】学习记录3_编写简单爬虫

编写简单爬虫爬取自己的csdn博文链接# -*- coding:gb2312 -*- from scrapy.contrib.spiders import CrawlSpider, Rule from scrapy.contrib.linkextractors.sgml import SgmlLinkExtractor from scrapy.selector import Selector #

2016-11-09 17:25:28 305

原创【Scrapy】学习记录2_爬虫Spider

items.py：用来定义需要保存的变量，其中的变量用Field来定义，有点像python的字典 pipelines.py：用来将提取出来的Item进行处理，处理过程按自己需要进行定义spiders：定义自己的爬虫 =========================================== 1.测试示例爬虫直接执行quotesbot示例工程spiders中爬虫toscrap

2016-11-08 15:59:07 1696

原创【WebScraping】并行下载_多线程爬虫&多进程爬虫

当一个线程等待下载时，进程可以切换到其他线程执行，避免浪费cpu时间，即：将下载分发到多个进程和线程中【思路整理】针对待爬取的URL队列（1）若将队列存储在本地内存中，则只能用单独的进程处理该队列，但进程里可以分为多个线程，对该进程的不同部分进行处理，用多线程爬虫实现；（2）若将队列单独存储（MongoDB队列），则不同服务器上的爬虫能协同处理同一个爬虫任务，实现多个进程同时

2016-11-08 14:57:46 1624

原创【Scrapy】学习记录1_一个基本的Scrapy项目

[Scrapy整体架构] =========================================== 引擎(Scrapy Engine)，用来处理整个系统的数据流处理，触发事务。调度器(Scheduler)，用来接受引擎发过来的请求，压入队列中，并在引擎再次请求的时候返回。下载器(Downloader)，用于下载网页内容，并将网页内容返回给蜘蛛。蜘蛛(Spiders)，蜘蛛是主要干活

2016-11-08 10:42:48 645

空空如也

centos7部署Hyperledger Fabric e2e示例遇到的问题

2018-02-23

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

转载 java中调用Python__C中调用Python

原创 【Mongodb】记录1_开始MongDB

原创 【Scrapy】学习记录3_编写简单爬虫

原创 【Scrapy】学习记录2_爬虫Spider

原创 【WebScraping】并行下载_多线程爬虫&多进程爬虫

原创 【Scrapy】学习记录1_一个基本的Scrapy项目