文本类人工智能项目-情感分析

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df = pd.read_csv('D:/7.文本类数据处理/aa.csv',encoding='gbk')
df.head(10)
labeltext_a
01.0说 的 就是 你
11.0我 恨 你 不爱 你 了
21.0你 看 我 上线 太 让 我 伤心 了 不行 就 不行
31.0真是 让 人 讨厌
42.0赞 一个 ! 么 么 哒
51.0我 不 想 人家 说 你 闲话
62.0你 真好 我 有 你 谢谢 朋友
71.0可是 你 刚才 就 骗 我 了
81.0儿子 发烧 了 , 没 人 和 我 说话 , 心里 很 不是 滋味儿
91.0我 只是 很 愁
df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1200 entries, 0 to 1199
Data columns (total 2 columns):
label     1150 non-null float64
text_a    1150 non-null object
dtypes: float64(1), object(1)
memory usage: 18.8+ KB
df.isnull().any()



label     True
text_a    True
dtype: bool
df[df.isnull().values==True]


df.dropna(subset=['text_a','label'],axis=0,how='any',inplace=True)


df.isnull().any()

label     False
text_a    False
dtype: bool

df[df.duplicated('text_a')]



df.drop_duplicates(subset='text_a',keep='first',inplace=True)



df.duplicated('text_a').any()
False
plt.boxplot(x=df.label,
	whis=1.5,
	widths=0.7,
	patch_artist=True,
	showmeans=True,
	boxprops={'facecolor':'steelblue'},
	flierprops={'markerfacecolor':'red','markeredgecolor':'red','markersize':4},
	meanprops={'marker':'D','markerfacecolor':'black','markersize':4},
	medianprops={'linestyle':'--','color':'orange'},
	labels=['']
	)
plt.show()

在这里插入图片描述

q1 = df.label.quantile(q=0.25)
q3 = df.label.quantile(q=0.75)
low_whisker = q1-1.5*(q3-q1)
up_whisker = q3+1.5*(q3-q1)
df[df['label']==9.0]
labeltext_a
df.info()
<class 'pandas.core.frame.DataFrame'>
Int64Index: 1052 entries, 0 to 1199
Data columns (total 2 columns):
label     1052 non-null float64
text_a    1052 non-null object
dtypes: float64(1), object(1)
memory usage: 24.7+ KB

plt.rcParams['axes.unicode_minus']=False
df.label.value_counts()
1.0    682
2.0    320
6.0     50
Name: label, dtype: int64
plt.rcParams['font.sans-serif']=['KaiTi']
labels = ['中性','喜欢','悲伤','厌恶','快乐','生气','惊喜','恐惧']
sizes = [8055,1202,816,694,702,985,306,112]
fig,ax = plt.subplots()
ax.pie(sizes,labels=labels,autopct='%1.1f%%',shadow=False,startangle=150)
ax.set_title('bili')
plt.show()

在这里插入图片描述

df.to_csv('C:/aa2.csv',index=False,encoding='utf-8_sig')
  • 4
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值