- 博客(2)
- 收藏
- 关注
原创 xml与xpath
一 . XML 1 定义:可扩展标记语言。 2 特点:xml是具有自描述结构的半结构化数据。 3 作用:xml主要设计宗旨是用来传输数据;还可以作为了一些应用配置文件。 二 . xml和html的区别? 1 .语法要求不同,xml的语法要求更严格。 (1)html不区分大小写 (2)html有时不严格,如果上下文清楚地显示出段落或者标签在何处结束,html可以省略尾标签。但是xml不能省略...
2019-12-02 19:35:51 212
原创 关于爬虫的基本知识
一. 爬虫是什么? 1.爬虫的定义:脚本,程序—>自动抓取万维网上信息的程序。 2、爬虫可以解决的问题: (1)解决冷启动的问题。 (2)搜索引擎的根基。做搜索引擎,必须使用爬虫。 (3)帮助机器学习建立知识图谱。 机器学习最重要的是训练集。训练集可以靠爬虫爬取。 (4)可以制作比较软件。 二. 搜索引擎 1 概念: 搜索引擎就是运行一些策略和算法,从互联网上获取网页信息,并将这些信息做一些...
2019-11-28 21:20:36 533
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人