已解决FutureWarning: Function get_feature_names is deprecated; get_feature_names is deprecated in 1.0 and will be removed in 1.2. Please use get_feature_names_out instead. warnings.warn(msg, category=FutureWarning)
报错代码
粉丝群里面的一个小伙伴想用sklearn模块做关键字提取的时候,发生了报错(当时他心里瞬间凉了一大截,跑来找我求助,然后顺利帮助他解决了,顺便记录一下希望可以帮助到更多遇到这个bug不会解决的小伙伴),报错代码如下::
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
a = ['一条小团团宣布复播','一条小团团最近怎么了','一条小团团停播文案','小团团突然宣布怀孕一条小团团停播了','一条小团团打的麻将叫什么','一条小团团停播各主播反应','一条小团团自曝曾被榜一','一条小团团停播真实原因','一条小团团停播努力的表情','一条小团团直播纹身事件','一条小团团早期直播视频一条小团团','一条小团团', '一条小团团', '一条小团团', '一条小团团', '一条小团团', '一条小团团', '一条小团团停播', '一条小团团', '一条小团团停播', '一条小团团', '一条小团团', '一条小团团', '一条小团团', '一条小团团', '小团团']
vectorizer = TfidfVectorizer()
X = vectorizer.fit_transform(a)
X.toarray()
X.toarray().sum(axis=0)
data = {'word': vectorizer.get_feature_names(),
'tfidf': X.toarray().sum(axis=0).tolist()}
df = pd.DataFrame(data)
df.sort_values(by="tfidf" , ascending=False, inplace=True)
print(df)
报错信息截图:
报错翻译
报错信息翻译:
未来警告:函数get_feature_names已弃用;get_feature_names在1.0中已弃用,将在1.2中删除。请改用。
警告。警告(消息,类别=未来警告)
报错原因
报错原因:
由于sklearn模块版本更替的原因,get_feature_names函数已弃用,小伙伴按下面的命令修改即可!!!
解决方法
将代码修改为get_feature_names_out函数即可:
data = {'word': vectorizer.get_feature_names_out(),
'tfidf': X.toarray().sum(axis=0).tolist()}
再次运行程序成功:
以上是此问题报错原因的解决方法,欢迎评论区留言讨论是否能解决,如果有用欢迎点赞收藏文章谢谢支持,博主才有动力持续记录遇到的问题!!!
千人全栈VIP答疑群联系博主帮忙解决报错
由于博主时间精力有限,每天私信人数太多,没办法每个粉丝都及时回复,所以优先回复VIP粉丝,可以通过订阅限时9.9付费专栏《100天精通Python从入门到就业》进入千人全栈VIP答疑群,获得优先解答机会(代码指导、远程服务),白嫖80G学习资料大礼包,专栏订阅地址:https://blog.csdn.net/yuan2019035055/category_11466020.html
-
优点:作者优先解答机会(代码指导、远程服务),群里大佬众多可以抱团取暖(大厂内推机会),此专栏文章是专门针对零基础和需要进阶提升的同学所准备的一套完整教学,从0到100的不断进阶深入,后续还有实战项目,轻松应对面试!
-
专栏福利:简历指导、招聘内推、每周送实体书、80G全栈学习视频、300本IT电子书:Python、Java、前端、大数据、数据库、算法、爬虫、数据分析、机器学习、面试题库等等
-
注意:如果希望得到及时回复,订阅专栏后私信博主进千人VIP答疑群