- 博客(4)
- 资源 (7)
- 收藏
- 关注
原创 火车头采集器 采集Ajax页面 一页自动刷新列表的 网站 xpath 标签
对于采用ajax技术的页面,每次刷新或者向后滚动鼠标既可以换到新的列表,而浏览器中地址没有变化。此时采用的方法为Fiddler查看或者类似工具,找到真实的页面地址即可。另外可以在采集中单独添加标签,与标题,内容同等重要,只是主要标签有先后顺序之分,有些内容地址复杂的可用xpath工具自动提取采集到的标签,作为属性之一,在后面的文件命名等极为重要
2017-04-18 14:36:38 9750
原创 火车头采集器 采集https网站 以及网站cookie 避免 蜘蛛 爬虫 程序等
火车头采集器 采集https网站并不是想象中的困难,有时https网站只是用了这个加密协议,但是事实上的数据并没有加密,所以仍然可以采集。如果确实有困难的可以通过,http分析软件来确认地址,如HttpAnalyzerStdV7,分析真实访问地址。网站中的cookie,需要用正式浏览器获得,建议是ie浏览器,软件兼容性好。同时为了避免 蜘蛛 爬虫 程序等,模拟浏览器选择真实的ie,
2017-04-18 14:28:36 15595 1
原创 命令行编译java工程项目 javax.servlet
很久以前的java项目现在需要增加相应的功能。查找到两个需要修改的java文件。修改完毕后使用命令行的方式进行编译。遇到了不少问题。把两个主要问题写在这里供大家参考。一是环境的配置。因项目在服务器上运行,所以相关环境应该是好的,但是编译时总是提示想关jar文件缺失,如 package javax.servlet does not existimport javax.servlet.*;
2017-04-18 12:21:10 772
原创 freebasic 教程 笔记
最近有机会使用freebasic,目前除了vb很少见到相关basic语言的继承者,但是某些特殊场合又需要,所以把最近使用中的问题略作介绍0)资源站 www.freebasic.net1)编译器 FreeBASIC-1.05.0-win322)IDE FBIde0.4.6r43)语法 接近或者替代Qbasic语法先说编译器,毫无疑问以官方为准,主要是官方网站所载,ide有几个,后
2017-04-01 10:57:16 5018
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人