首先安装相对应的包
pip install tika
然后就可以用了
from tika import parser
"""
提取word文档里面的内容
"""
def read_doc(file_path):
parsed = parser.from_file(file_path)
text = parsed['content']
return text
首先安装相对应的包
pip install tika
然后就可以用了
from tika import parser
"""
提取word文档里面的内容
"""
def read_doc(file_path):
parsed = parser.from_file(file_path)
text = parsed['content']
return text