我想在url中抓取所有的html_代码,并把它们放到db MySQL中。在
但我有错误。
错误1054:未知列'$
我试了很多方法,但还是不能纠正这个错误。
这让我花了很多时间。我只是学着刮胡子。
希望大家都能帮我解决这个问题。谢谢你
蜘蛛_查找.py在from scrapy.spider import BaseSpider
from scrapy.selector import HtmlXPathSelector
from find.items import WebsiteLoader, FindItem
from scrapy.loader import ItemLoader
class FindSpider(BaseSpider):
name = "find"
allowed_domains = ["tratu.soha.vn"]
start_urls = [
"http://tratu.soha.vn/dict/vn_vn/Sang",
]
def parse(self, response):
item = FindItem()
sel = response.xpath('//*')
item['html_code'] = sel.xpath('//*').extract()[0]
#print item['html_code']
print "CODE HEREEEEEEEEEEEEEEEEEEEEEEEEEEEEe"
yield item
在管道.py在
^{pr2}$