网页爬虫
96掌门师兄
showcode1024
展开
-
网络爬虫
1.如何反爬虫http://robbinfan.com/blog/11/anti-crawler-strategy原创 2016-02-19 14:23:47 · 460 阅读 · 0 评论 -
neocrawler学习心得交流
1.运行抓取微信号步骤因为不会node.js,所以我是在windows使用NTVS调试代码的,一边学习node.js,如果测试的话,不需要启动schedule和crawl;安装好redis,我没有装hbase,不影响代码阅读1.1 启动config node run.js -i abc -a config -p 8888,按照网页添加配置1.2 启动测试node run.js -i原创 2016-02-23 17:13:58 · 1781 阅读 · 0 评论 -
C++调用python(python文件位置) 打包发布
1.读取python文件位置2.C++调用python函数PyArg_ParseTuple和PyArg_Parse3.c++多线程调用python崩溃原创 2015-04-02 11:56:22 · 6763 阅读 · 0 评论 -
证券数据爬取
最近做了一个小工具,在用户授权的情况下,可以爬取用户的证券账户数据1. 券商账户自动登陆,验证码自动识别,自动填充密码2.使用python爬虫,获取平安证券,招商证券,中信证券,华泰,浙商等,几乎所有的券商数据吧,通过分析他们的网络协议,模拟登陆,获取持仓数据等3.爬取东方财富,和讯网等金融咨询信息,爬取搜狐财经,腾讯财经等历史行情,分时数据,证券成分数据等有需要使原创 2016-01-15 15:23:41 · 5969 阅读 · 8 评论