错误原因:
范围参数必须是有限的,
而数据中出现NaN或INF值
修改前
plt.hist(np.log(num_tokens), bins = 100)
修改后
import pandas as pd
dataf = pd.DataFrame(np.log(num_tokens))
plt.hist(dataf[np.isfinite(dataf)].values, bins = 100)
参考链接: https://cloud.tencent.com/developer/ask/188856