数据读取、字符串模糊查找
Python提供了强大的包,直接用于各种数据读取,比如pandas,比如读取excel数据,直接:
import pandas as pd
data = pd.read_excel('sales.xlsx', sheetname='sheet1', header=0)
另外,Python还提供了Fuzzywuzzy,可用于模糊查询和替换。如果提供对应的字符串库,则通过Fuzzywuzzy用于查找和替换给定文本中错误的字符串。比如直接计算两个字符串的编辑距离:
from fuzzywuzzy import fuzz
print fuzz.ratio('Python Package', 'PythonPackage')