第一次写博客,记录下毕设进度。
本次项目采用的数据集是大众点评评论。亲们可以自己随意找个数据集复现。数据集格式是csv,直接使用pandas对数据集处理(PS.pandas是啥?边学边弄/(ㄒoㄒ)/~~)
先看下本次项目的流程图把:
- 头文件:
import collections
import jieba
import pandas as pd
import matplotlib.pyplot as plt
from wordcloud import WordCloud
- 数据获取,使用DataFrame读取csv
①载入数据:df = pd.DataFrame(pd.read_csv('xxxxxx',error_bad_lines=False))