本项目主要用到的技术有os、requests、lxml、pandas等,数据库使用的是SQL。
2.1 os模块介绍
Python的标准库中的os模块包含普遍的操作系统功能。即它允许一个程序在编写后不需要任何改动,也不会发生任何问题,就可以在Linux和Windows下运行。
2.2 requests模块介绍
requests模块是一个用于网络请求的模块,主要用来模拟浏览器发请求。其实类似的模块有很多,比如urllib,urllib2,httplib,httplib2,他们基本都提供相似的功能。但是这些模块都复杂而且差不多过时了,requests模块简单强大高效,使得其在众多网络请求模块中脱引而出。
2.3 lxml模块介绍
lxml是xml和HTML的解析器,其主要功能是解析和提取XML和HTML中的数据;lxml和正则一样,也是用C语言实现的,是一款高性能的python HTML、XML解析器,也可以利用XPath语法,来定位特定的元素及节点信息。
2.4 pandas模块介绍
Pandas 是python的⼀个数据分析包,最初由AQR Capital Management于2008年4⽉开发,并于2009年底开源出来,⽬前由专注
于Python数据包开发的PyData开发team继续开发和维护,属于PyData项⽬的⼀部分。Panda