我试图从中删除数据邮箱:boxofficemoviemojo.com我把一切都安排好了。但是我收到了一个我无法理解的逻辑错误。基本上我想把前100部电影,然后把数据写到一个csv文件中。在
有很多代码,但这是我正在挣扎的主要部分。代码块如下所示:def grab_yearly_data(self,page,year):
# page is the url that was downloaded, year in this case is 2014.
rank_pattern=r'
([0-9,]*?)'mov_title_pattern=r'(.htm">[A-Z])*?
'#mov_title_pattern=r'.htm">*?' # Testing
self.rank= [g for g in re.findall(rank_pattern,page)]
self.mov_title=[g for g in re.findall(mov_title_pattern,page)]
在自我等级工作完美。然而self.mov_标题无法正确存储数据。我将收到一个列表,其中有102个元素和电影标题。但是我收到102个空字符串:“”。一旦我发现我做错了什么,程序的其余部分就很简单了,我只是在网上找不到问题的答案。我尝试过很多次改变mov_title_模式,但我要么什么都没有收到,要么102个空字符串。请帮助我真的想推进我的项目。在