- 博客(6)
- 资源 (107)
- 收藏
- 关注
原创 odoo8编辑视图中sheet边距过宽问题调整
调整odoo页面宽度的好方法: 来自:http://blog.csdn.net/vnsoft/article/details/49334723 [html] view plaincopy template id="assets_backend" name="rhwl assets" inherit_id="web.assets_backend"
2015-10-22 18:18:52 754
转载 网络爬虫道魔的策略
网站的反爬虫 网络爬虫在访问网站并不是一个常规的用户行为,通常都会对网站的带宽和服务器带来一些压力。一些比较健壮的网络爬虫通常会控制对网站的访问频率。 但是大多数网络爬虫可能并不会采取措施,为了防止网络爬虫带来的负面影响,一些的网站会对来访者的访问做限制。 常见的反爬虫措施 网站常用的反爬虫措施有: 1.人工识别、限制IP 当网站运维人员发现网站服务器负载突然增高等异常时,通过
2015-10-20 15:30:13 1307
原创 网络爬虫去重参考
第一种,使用shingling算法 参考: http://liangqingyu.com/blog/2014/12/03/%E7%BB%86%E8%AF%B4%E5%9E%82%E7%9B%B4%E5%9E%8B%E7%BD%91%E7%BB%9C%E7%88%AC%E8%99%AB%EF%BC%88%E5%8D%81%EF%BC%89%E3%80%90%E5%8E%BB%E9%87%8D%E
2015-10-20 15:17:53 2499
原创 scrapy数据抓取框架简介
scrapy框架是个比较简单易用基于python的爬虫框架,http://scrapy-chs.readthedocs.org/zh_CN/latest/ 这个是不错的中文文档 几个比较重要的部分: items.py:用来定义需要保存的变量,其中的变量用Field来定义,有点像python的字典 pipelines.py:用来将提取出来的Item进行处理,处理过程按自己需要进行定
2015-10-20 08:56:30 958
原创 python得爬虫关键词
大数据的数据从哪里来?除了部分企业有能力自己产生大量的数据,大部分时候,是需要靠爬虫来抓取互联网数据来做分析。 网络爬虫是 Python 的传统强势领域,最流行的爬虫框架 Scrapy,HTTP 工具包 urlib2,HTML 解析工具 beautifulsoup,XML 解析器 lxml,等等,都是能够独当一面的类库。 不过,网络爬虫并不仅仅是打开网页,解析 HTML 这么简单。高效的爬虫要
2015-10-10 11:00:15 3269
原创 Getting the department_id through the user on domain filter
Openerp常常需要根据部门进行过滤,那么正解如何呢? 正确的做法如下: [('department_id.member_ids.user_id', 'in', [user.id])] 偶尔在权限规则中也会用到! Openerp的妙处。
2015-10-06 22:31:09 1248
Java Web系统开发
2014-11-04
java核心技术第1卷
2014-11-03
ASN.1 Communication between Heterogeneous Systems
2013-09-16
linux串口编程从驱动到应用
2013-07-23
IGMP协议rfc1112 2236 3376
2013-03-29
一个MFC的界面库,包括大多数常用控件
2013-03-28
LINUX设备驱动程序(第3版中文版)
2013-02-19
深入理解Linux内核中文第三版(高清有目录完整)
2012-12-27
installshield制作安装包详解
2012-08-25
VC绘图参考类和实例
2012-08-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人