python excel超链接_在Python中保留Pandas中的超链接 – Excel到数据帧

我有一个大型excel文件,其中包含几张我需要转换为

HTML的数据.我很高兴尝试Pandas来帮助简化转换,并保持将Excel表格保存为HTML,然后花一整天时间删除所有可怕的MS标签.

我能够读取Excel文件表,然后将它们作为数据框加载.唯一的问题是它正在剥离单元格中的所有超链接.我看了一遍,但找不到保留超链接的答案.这是我第一次使用熊猫,所以它可能只是缺乏经验.下面是我的代码和输出的屏幕截图.谢谢您的帮助.

In [2]: import pandas as pd

In [3]: xls_file = pd.ExcelFile('Desktop/cfec-temp/blackbook/blackbook.xlsx')

In [4]: xls_file

Out[4]:

In [5]: xls_file.sheet_names

Out[5]: ['Sheet1', 'Sheet2', 'Sheet3', 'Sheet4', 'Sheet5', 'Sheet6', 'Sheet7']

In [6]: df = xls_file.parse('Sheet1')

In [7]: df

我要做的是使用openpyxl来获取超链接,然后遍历for循环中的行,创建超链接列表,并在pandas数据帧中添加一个新列:

import openpxyl

import pandas as pd

df = pd.read_excel('file.xlsm')

wb = openpyxl.load_workbook('yourfile.xlsm')

ws = wb.get_sheet_by_name('Sheet1')

print(ws.cell(row=2, column=1).hyperlink.target)

links = []

for i in range(2, ws.max_row + 1): # 2nd arg in range() not inclusive, so add 1

links.append(ws.cell(row=i, column=1).hyperlink.target)

df['link'] = links

与我在other question中回答的相同的第一位代码

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值