卡方检验两分类实现

最新推荐文章于 2021-01-08 13:33:53 发布

dataastron

最新推荐文章于 2021-01-08 13:33:53 发布

阅读量2k

点赞数

分类专栏： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dataastron/article/details/79445434

版权

import jieba
import numpy as np
import xlrd
import re
import json

# 数据加载
# jieba词库设置

#读取文本，读取其中1个
#统计包含a的单词和不包含a的单词
#统计主题
def chisquare(datasetTrue, datasetFlase):
dicta ={}
dictb ={}
for i in datasetTrue:
for word in i:
if word not in dicta:
dicta[word] = 0
else:
dicta[word] = dicta[word] + 1
for i in datasetFlase:
if word in i:
if word not in dictb:
dictb[word] = 0
else:
dictb[word] = dictb[word] + 1

keyset = set()
for i in dicta:
keyset.add(i)
for i in dictb:
keyset

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
卡方检验两分类实现

import jiebaimport numpy as npimport xlrdimport reimport json# 数据加载# jieba词库设置#读取文本，读取其中1个#统计包含a的单词和不包含a的单词#统计主题def chisquare(datasetTrue, datasetFlase): dicta
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。