创新项目实训(八)
前言
我们组打算搭建一个国内旅游比价网站,
而我负责的部份是各大订酒店网站的数据获取及整理
主要参考版上的经验分享+自己的修改理解
小白0经验入门记录、边爬边学习ing
有错误或更好的建议都可以指教讨论
修改sql语句及去那儿搜索
去哪儿
先前简单爬了下去哪儿的所有酒店,发现存入数据库后,
价格为零的数量不少,再看下网站
可以发现价格为零的状况有两种,
1.暂无报价>status =1
2.已售完>status =2
所以要再多获取一个酒店的status
如果无报价就不存进数据库了
sql
之前在存入酒店详细讯息前,因为Hotel_Info没有设主键,
所以增查会较慢,考虑到之后还要获取实时的酒店价格,
所以将该网站的酒店id新赠进数据库并设为主键
去那儿、途牛、飞猪、携程等酒店,就算酒店名相同,
def Insertweb(Hotel_name,Web_name,star,price,score,count,id,pic):
try:
mycursor.execute("replace into hotel_web values ( '%s','%s','%s',%s,%s,%s,%s,'%s')" % (Hotel_name,Web_name,star,price,score,count,id,pic))
mydb.commit()
print('插入数据成功')
except:
mydb.rollback()
print(Hotel_name,Web_name,star,price,score,count,id,pic)
print("插入数据失败")