前几天做了一个关于词云实现的小项目,其中涉及读取Excel文件中的评论部分并将内容分词,直接读取的内容是字典(series)类型的,但是分词的格式必须要是字符串类型的。
网络上面的教程是用str关键字来转换成字符串,但是转化成字符串的时候会出现内容的丢失,进而显示出省略号。
原代码:
data['内容']
改正之后的代码:
string_data = ''
for i in data['内容']:
string_data += str(i)+'\n'
总之就是一行一行读取文件内容,一行一行的准话成字符串就行了。
前后实现结果的对比:
改正之后:
谢谢观看