草屋主人(孙立)的专栏
我的地盘听我的
条新通知
登录
注册
欢迎
退出
我的博客
配置
写文章
文章管理
博客首页
全站
当前博客
空间
博客
好友
相册
留言
用户操作
[留言]
[发消息]
[加为好友]
订阅我的博客
[编辑]
cao5的公告
<center><object classid="clsid:D27CDB6E-AE6D-11cf-96B8-444553540000" codebase="http://download.macromedia.com/pub/shockwave/cabs/flash/swflash.cab#version=6,0,29,0" width="150" height="150" align="middle"> <param name="movie" value="http://bbs.smgbb.cn/Skins/Default/clock.swf"> <param name="quality" value="high"> <param name="WMODE" value="transparent"> <embed src="http://bbs.smgbb.cn/Skins/Default/clock.swf" width="150" height="150" align="middle" quality="high" pluginspage="http://www.macromedia.com/go/getflashplayer" type="application/x-shockwave-flash" scale="noborder" bgcolor="#E4E8EF"></embed> </object></center><p><center><b><a href="archive/2005/10/24/514748.aspx">个人简历</a></b></center></p>
[编辑]
文章分类
.net
ASP技术
ASP技术
MS-SQL数据库
php技术
PHP技术
VB技术
VB技术
其他
其他
数据库
搜索引擎
搜索引擎
我的生活
[编辑]
论坛
CSDN
草屋blog
[编辑]
网站
源码搜索
草屋音乐搜索
存档
2006年03月(1)
2005年10月(7)
2005年09月(2)
2005年07月(1)
2005年03月(6)
2004年11月(5)
2004年09月(1)
spider对文档内容的分析又一方法
收藏
网页文档内容的分析
一般可以分为内容提取,title标签,keywords等对页面内容的分析。
其实可以在我们的spider的url连接来源的innertext进行分析,我觉得这个准确度还是比较大的
有的html文档根本就不能分析出什么内容,比如一个flash页面,spider是很难分析内容的,如果跟url来源innertext建立关系,那么就可以
这个flash的具体内容了
发表于 @ 2005年10月05日 22:51:00 |
评论(
loading...
)
|
编辑
|
举报
|
收藏
旧一篇:对spider的一个改进!
|
新一篇:完成一个ASP在线查IP来源的程序
查看最新精华文章 请访问博客首页
相关文章
发表评论
表 情:
评论内容:
用 户 名:
登录
注册
匿名评论
验 证 码:
重新获得验证码