卡布琪诺762-CSDN博客

原创【无标题】

自然语言处理（NLP）在文本分析领域应用广泛，本文以四大名著文本为例，实现分词、词频统计、词性分析、可视化、自定义词典、实体统计等功能，帮助大家快速掌握NLP基础流程。G.add_edges_from([('刘备', '关羽'), ('刘备', '张飞'), ('关羽', '张飞'), ('刘备', '曹操')])- 可视化： matplotlib （绘制饼图、柱状图）、 wordcloud （生成词云）、 networkx （绘制关系图）- 代码生成：输入注释（如“生成快速排序函数”）自动生成代码。

2026-03-11 09:28:39 133

原创用Python 实现高效数据清洗

要么用合理值替换，比如用均值、中位数填充， df['数值列'] = np.where((df['数值列'] < Q1 - 1.5*IQR) | (df['数值列'] > Q3 + 1.5*IQR), df['数值列'].median(), df['数值列'])。脏乱差的数据就像满是杂质的矿石，不经过精细清洗，后续的分析建模只能是空中楼阁。df['日期'] = pd.to_datetime(df['日期'], errors='coerce').dt.strftime('%Y-%m-%d')

2025-06-13 21:36:09 1173 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 【无标题】

原创 用Python 实现高效数据清洗

空空如也

空空如也

原创【无标题】

原创用Python 实现高效数据清洗