newlisp 抓取网页

最新推荐文章于 2015-11-27 16:27:46 发布

小小飞2

最新推荐文章于 2015-11-27 16:27:46 发布

阅读量409

点赞数

本文链接：https://blog.csdn.net/u013364948/article/details/17782681

版权

　　如果是HTTP协议，很简单，直接用get-url函数

　　如果是HTTPS协议，就需要用到curl，可以通过exec的方式调用curl命令登录，当然需要有合法的用户名和密码才行。然后分析返回的结果中的cookie，一般得到session id后发回去，模拟用户访问各个页面，获得页面结果。

　　如果对方网页是gb2312编码, newlisp不能直接分析内容，需要用下面的命令转换成utf-8编码的文件，再读取回来使用。

　　下面是示例代码用于HTTP页面。

　　(define (Reader:filter)

　　(set 'r (get-url (self 1)))

　　(if (file? "page")

　　(delete-file "page"))

　　(if (file? "page2")

　　(delete-file "page2"))

　　(append-file "page" r)

　　(exec "iconv -f GB2312 -t utf-8 page > page2")

　　(set 'r (read-file "page2"))

　　(regex "your search pattern" r)

　　(set 'a $1)

　　(set 'b $2)

　　(list a b))

　　只需要在regex一行换上自己的search pattern就可以搜索网页了。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小小飞2

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

《Hbase原理与实践》读书笔记——1.HBase概述

qq_31957747的博客

10-21

532

1.1 HBase前世今生 Google当年风靡一时的“三篇论文”：GFS -> HDFS , Mapreduce -> hadoop mapreduce , bigTable -> HBase。 HBase在国外起步很早，包括Facebook、Yahoo、Pinterest等大公司都大规模使用HBase作为基础服务。在国内HBase相对起步较晚，但现在各大公司对于HBase的使用已经越来越普遍，包括阿里巴巴、小米、华为、网易、京东、滴滴、中国电信、中国人寿等公司都使用HBase存储海

lisp参考网址

yilu_beiyu的博客

09-14

221

ansi common lisp

参与评论您还未登录，请先登录后发表或查看评论

newLISP 10.5.3 发布，类 Lisp 的脚本语言

weixin_33775572的博客

07-11

181

newLISP 10.5.3 修复了一些 bug ，为 KMEANS 集群分析器增加了一些函数。 newLISP是一个类似Lisp语言的、用于一般用途的脚本语言。它具有 LISP 语言所有的魔力，但更容易学习和使用。 newLISP是友好的，快速和简小的。大部分您需要的功能都将已经内置。下面是一段示例代码： (command-event (fn (s) (local (reque...

newLISP你也行 --- newLISP简介

weixin_34248118的博客

05-31

181

2019独角兽企业重金招聘Python工程师标准>>> ...

newlisp获取git标签名并自动更改版本

monkey_four的专栏

11-27

482

在写web页面时, 经常会有版本更改. 如果有很多页面, 就需要更改多个文件,比较麻烦. 现有一种方法, 可以使用newlisp脚本自动从master分支获取最新版本号, 并自动更改每个页面的版本. 步骤: 1. 将代码merge到发布分支(一般是master分支)后, 在git网页上可以建立标签, 将标签名设置为版本号,如V1.0.0 2. 在编译任何代码之前,先运行newlisp脚本

newLISP® 代码模式

石头

12-10

3052

newLISP 是如何令我惊愕忘形的

weixin_33775582的博客

07-25

175

2019独角兽企业重金招聘Python工程师标准>>> ...

用newLisp开发网站三模板渲染

Dean Chen的专栏

11-19

3720

本节讨论如何使用模板，template是dragonfly用来在后端初始化页面的技术，html文件中用标记嵌入newlisp代码，运行newlisp代码，填充html文件后再返回。dragonfly生成松散的支持MVC模式，model一般都不需要。不过对我来讲已经够用了，一般主要就是用后端渲染完成两件事情：1.权限控制根据用户的权限决定产生哪些html代码2. JSON数据的初始化将数据（通常是J

newlisp中文教程

10-01

newlisp中文教程，作为lisp的后起之秀，newlisp有些理念比较有价值，值得学习，所以分享下，希望对大家有用

monitor_newlisp

06-30

MONITOR_NEWLISP 动机需要一组 newlisp 脚本来监控不占用大量资源的 Linux 系统。这包括： bb-base：newlisp 中的 xymon 基础脚本集。...安装在每个单独的目录中都有描述，请参阅每个目录以获取详细信息。执照

newLISP-开源

04-25

适用于BSD，LINUX，MacOS X，SunOS和Win32的newLISP：小型，快速的350+功能，-C-，MySQL，PostgreSQL，SQLite，ODBC，TCP / IP，UDP，XML，Java接口，字符串处理，正则表达式，数学，财务，统计功能，Win32 DLL

define-ext:用于newLISP的基于插件的外码嵌入器-开源

04-25

====一个newLISP-www.newlisp.org-宏，它使用户可以内联“定义”可调用的外部代码，就像他们“定义” lambda或宏一样。 C，包括汇编语言和普通对象代码插件。对象代码插件没有外部依赖关系。 C和Assembly插件依赖...

newlisp 获取cpu信息

Dean Chen的专栏

09-14

3525

紧跟前文，用newlisp写了一个获取本机cpu信息的小程序，每次都会调用REST API将数据发送给web server.#!/usr/bin/newlisp (load "config.lsp") (define (add-log msg) (append-file "cpu.log" (append "\n" (string (now 480)) " ")) (append-fi

用于去噪幅度dMRI的Matlab工具箱.rar

10-09

1.版本：matlab2014/2019a/2024a 2.附赠案例数据可直接运行matlab程序。 3.代码特点：参数化编程、参数可方便更改、代码编程思路清晰、注释明细。 4.适用对象：计算机，电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。

APP报毒全自动处理系统源码

10-09

APP报毒全自动处理系统源码

智能优化算法-引力搜索优化算法（GSA）（附源码）

10-09

引力搜索优化算法 (Gravitational Search Algorithm, GSA) 是一种基于牛顿万有引力定律的元启发式优化算法，由Rashedi等人于2009年提出。GSA通过模拟天体之间的引力作用来搜索最优解，适用于解决复杂的优化问题。 GSA的工作机制主要包括：初始化：随机生成一组初始解，每个解代表一个“质量”。计算引力：根据每个解的质量和距离，计算它们之间的引力。更新位置：根据引力作用，更新每个解的位置，从而探索解空间。更新质量：根据解的适应度值，更新每个解的质量，以便更好地指导搜索方向。优点包括：全局搜索能力：GSA能够有效地探索解空间的不同区域。鲁棒性强：适用于多种优化问题，包括连续和离散优化。易于实现：算法设计直观，易于编程实现。

基于springboot的餐饮管理系统源码+数据库（Java毕业设计）

最新发布

10-09

基于springboot的餐饮管理系统源码+数据库（Java毕业设计），该项目是个人毕设项目，答辩评审分达到98分，代码都经过调试测试，确保可以运行！欢迎下载使用，可用于小白学习、进阶。该资源主要针对计算机、通信、人工智能、自动化等相关专业的学生、老师或从业者下载使用，亦可作为期末课程设计、课程大作业、毕业设计等。项目整体具有较高的学习借鉴价值！基础能力强的可以在此基础上修改调整，以实现不同的功能。基于springboot的餐饮管理系统源码+数据库（Java毕业设计），该项目是个人毕设项目，答辩评审分达到98分，代码都经过调试测试，确保可以运行！欢迎下载使用，可用于小白学习、进阶。该资源主要针对计算机、通信、人工智能、自动化等相关专业的学生、老师或从业者下载使用，亦可作为期末课程设计、课程大作业、毕业设计等。项目整体具有较高的学习借鉴价值！基础能力强的可以在此基础上修改调整，以实现不同的功能。基于springboot的餐饮管理系统源码+数据库（Java毕业设计），该项目是个人毕设项目，答辩评审分达到98分，代码都经过调试测试，确保可以运行！欢迎下载使用，可用于小白学习、进阶。该

Python中的“异常的引发”：掌握编程中的“艺术”.pdf

10-09

在软件开发过程中，无论是初学者还是资深工程师，都可能遇到各种各样的问题。这些问题如果得不到妥善处理，轻则导致程序运行不稳定，重则引发系统崩溃。而“异常的引发”则是Python提供给我们的一种强有力的工具，它帮助我们在程序执行过程中主动识别并报告错误情况，从而使得我们可以及时采取措施来修复问题或者以一种更加优雅的方式告知用户。

onnx2onnx-0.2.1.tar.gz

10-09

onnx2onnx-0.2.1.tar.gz