python
headwind_
不要有了追求速度的激情就忘了该有的踏实
展开
-
利用scrapy框架爬取互动百科的词条--存成json
最近课程作业需要爬取互动百科的词条,花了一周时间先学习了一点scrapy,利用该框架写了一个简单的爬虫 scrapy框架学习:Scrapy入门教程 首先看一下题目的要求: 1.首先实现了一个自动爬取互动百科词条页面的爬虫程序获取百科页面数据。根据互动百科的分类页面来获取对应分类下的所有词条页面。 2.为了构建知识,可以利用百科词条页面结构抽取出了互动百科的中的结构化知识。原创 2017-04-13 00:12:29 · 5191 阅读 · 3 评论 -
Python 将json格式文件转存为RDF格式文件
一、什么是json格式 JSON(JavaScript Object Notation, JS 对象标记) 是一种轻量级的数据交换格式。它基于 ECMAScript 规范的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得 JSON 成为理想的数据交换语言。 易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率。原创 2017-04-19 00:06:29 · 7601 阅读 · 0 评论 -
Python RDF知识库查询
本文知识库查询使用SPARQL; SPARQL (SPARQL Protocol and RDF Query Language),是为RDF开发的一种查询语言和数据获取协议,它是为W3C所开发的RDF数据模型所定义,但是可以用于任何可以用RDF来表示的信息资源。原创 2017-04-19 00:31:40 · 7312 阅读 · 6 评论