爬虫
忘记了四叶草
这个作者很懒,什么都没留下…
展开
-
XPath
一. 什么是xml定义: 可扩展标记性语言特点: xml是具有自描述结构的半结构化数据作用: xml主要设计宗旨是用来传输数据,它还可以作为配置文件.二. xml和html的区别语法要求不同: xml的语法要求更严格.html不区分大小写, xml区分html有时可以省略尾标签,xml不能省略任何标签,严格按照嵌套首尾结构.在html中属性吗可以不带属性值,xml必须带属性...原创 2019-12-20 22:01:04 · 75 阅读 · 0 评论 -
正则
一. 数据的分类1. 结构化数据特点: 数据已行为单位,每一行数据表示一个实体.每一行数据的属性都是一样的.举例:关系型数据库中都 表就是结构化数据.处理方法:sql2. 半结构花数据特点:结构化数据的另一种形式.他并不符合关系型数据的特点,不能用关系型模型来描述.但是这种数据包含相关标记,有用了分割语义元素以及字段进行分层的描述.因此也被成为描述结构举例: xml, htm...原创 2019-12-19 21:41:47 · 68 阅读 · 0 评论 -
爬虫
爬虫第一天爬虫的定义是一种按照一定的规则自动的抓取万维网信息的程序或脚本搜索引擎的定义是指根据一定的策略,运用特定的计算机程序从互联网上采集信息,在对信息进行组织和处理后,为用户提供检索服务,将检索的相关信息展示给用户的系统.欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章...原创 2019-12-17 22:32:52 · 105 阅读 · 0 评论