python元组转换成列表_python-将元组的无序列表转换为pandas DataFrame

我正在使用库usaddress来解析我拥有的一组文件中的地址.我希望我的最终输出是一个数据框,其中列名代表地址的一部分(例如街道,城市,州),行代表我提取的每个地址.例如:

假设我有一个地址列表:

addr = ['123 Pennsylvania Ave NW Washington DC 20008',

'652 Polk St San Francisco, CA 94102',

'3711 Travis St #800 Houston, TX 77002']

然后使用usaddress提取它们

info = [usaddress.parse(loc) for loc in addr]

“ info”是元组列表的列表,看起来像这样:

[[('123', 'AddressNumber'),

('Pennsylvania', 'StreetName'),

('Ave', 'StreetNamePostType'),

('NW', 'StreetNamePostDirectional'),

('Washington', 'PlaceName'),

('DC', 'StateName'),

('20008', 'ZipCode')],

[('652', 'AddressNumber'),

('Polk', 'StreetName'),

('St', 'StreetNamePostType'),

('San', 'PlaceName'),

('Francisco,', 'PlaceName'),

('CA', 'StateName'),

('94102', 'ZipCode')],

[('3711', 'AddressNumber'),

('Travis', 'StreetName'),

('St', 'StreetNamePostType'),

('#', 'OccupancyIdentifier'),

('800', 'OccupancyIdentifier'),

('Houston,', 'PlaceName'),

我希望每个列表(对象“ info”中有3个列表)表示一行,每个元组对的2值表示列,而元组对的1值表示值.注意:内部列表的链接并不总是相同的,因为并非每个地址都具有每一个信息.

任何帮助将非常感激!

谢谢

解决方法:

不知道是否有一个DataFrame构造函数可以完全像现在一样处理信息. (也许from_records或from_items?-仍然不认为该结构是直接兼容的.)

进行一些操作即可获得所需的内容:

cols = [j for _, j in info[0]]

# Could use nested list comprehension here, but this is probably

# more readable.

info2 = []

for row in info:

info2.append([i for i, _ in row])

pd.DataFrame(info2, columns=cols)

AddressNumber StreetName StreetNamePostType StreetNamePostDirectional PlaceName StateName ZipCode

0 123 Pennsylvania Ave NW Washington DC 20008

1 652 Polk St San Francisco, CA 94102

标签:concat,pandas,python-3-x,tuples,python

来源: https://codeday.me/bug/20191110/2014261.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值