pandas求协方差、相关系数、显著性检验

这篇博客探讨如何利用pandas库在Python中进行数据分析,包括通过列索引筛选内容,进行情感分析,以及绘制数据图像。作者遇到在画图时因极性取值范围导致的错误,并展示了将日期设为DataFrame的日期类型的过程。此外,还提及了尝试统计不同评分的次数,最终采用众数作为统计结果。
摘要由CSDN通过智能技术生成

通过列索引值筛选内容的写法。

pcfr = pd.read_excel('hair.xlsx')
df = pcfr
# '=='后面替换品牌名字即可
m = df[df['product_title']=='remington ac2015 t|studio salon collection pearl ceramic hair dryer, deep purple']

情感分析函数。

def s_c_f(df):
    
    # 去重
    df.duplicated().value_counts() 
    
    # NaN remove
    df['review_body'].str.split(expand = True)
    
    # date format convert
    '''经常报错,参考这个https://stackoverflow.com/questions/51367393/when-i-use-apply-function-in-pandas-it-shows-typeerror-must-be-string-not-fl
    有时候改了好了,换一个表又不行了'''
    # df['review_date'] = df.review_date.apply(lambda x : parser.parse(str(x)))
    # df['review_date'] = df.review_date.apply(parser.parse)
    df['review_date'] = pd.to_datetime(df['review_date'])
    
    #将date设置为index
    df=df.set_index('review_date')
    
    ## sentiment analysis
    # func for polarity
    def sentiment_calc(text):
        try:
            return TextBlob(text).sentiment.polarity
        except:
            return None
        
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值