注意:本文使用的是jupyter做演示。
1.安装环境:
(1)、jupyter notebook安装
pip install jupyter notebook
jupyter notebook命令在相应的目录下启动即可
(2)、whoosh安装
pip install whoosh
(3)、jieba分词器安装----->目前最火最叼的中文分词器
pip install jieba
2. 准备好数据(我这里使用的是dataFrame,你也可以使用别的结构,但保证里面的key值是固定的)
import pandas as pd
data = [{'T': '1000', 'd1': '国足', 'd2': 1},
{'T': '1100', 'd1': '女足', 'd2': 1},
{'T': '1200', 'd1': '欧洲', 'd2': 2},
{'T': '1400', 'd1': '亚欧', 'd2': 1},
{'T': '1500', 'd1': '欧盟', 'd2': 1},
{'T': '1600', &