# -*- coding: utf-8 -*-
"""
Created on Mon May 28 20:39:20 2018
@author: Rache
"""
import xml.dom.minidom
dom = xml.dom.minidom.parse("REFIT_BUILDING_SURVEY.xml")
x=dom.getElementsByTagName("title");
root = dom.documentElement #得到xml文档对象
if __name__ == "__main__":
#在XML里找标签为TimeSeriesVariable的类
itemlist = root.getElementsByTagName('TimeSeriesVariable')
for item in itemlist:
#可变,在TimeSeriesVariable中找属性为Surface temperature的项
if item.getAttribute("variableType") == 'Surface temperature':
#同时只考虑那些属性为没有MissingData的项目
if item.getAttribute("hasMissingData") == 'No':
#把id的属性值赋给xx
xx = item.getAttribute("id")
#为保证唯一性加上“,”
String = xx + ','
#打开csv文档,读取
for i in open('REFIT_TIME_SERIES_VALUES.csv','r'):
if String in i:
#目前是打印,可以修改为直接写入新的csv
print (i)
有一个.xml的网页,长这样:
我想要把其中所有''variableType = surface temperate''且''hasMissingData = No''的属性对应的id找出来
再去.csv里面把该id下的所有数据筛选出来
用两个循环嵌套实现的,自己写的可以运行 纪念一下嘻嘻