- 博客(3)
- 资源 (4)
- 收藏
- 关注
原创 自编朴素贝叶斯用于文本分类
python中的sklearn包其实是提供了朴素贝叶斯的函数的,但是为了更好地理解朴素贝叶斯,还是选择了自编一遍。说明:这次的朴素贝叶斯适用于文本分类的检测,所以说明一下本程序的输入输入吧~skf是由交叉验证得到的from sklearn.cross_validation import StratifiedKFold这个sklearn里提供了交叉验证的方法为啥要
2016-12-02 18:00:59 1056
原创 自编卡方检验程序 (python)
由于大作业中需要,本来是想找现成的卡方检验程序的,但是没找过,尴尬,所以一怒之下之前用了一个晚上编出来的(编程水平太渣,据说大神只用一小时.....)这里还是提一下卡方检验的处理步骤吧,虽然我在实验报告里写到了......老师在上课时提供的ppt里这部分的例子很好,放上来:这段程序的用处是对一类文章中出现的词进行卡方检验统计,找到每个类别中CHI值较大的一些作为本类的特
2016-12-02 17:33:46 4200 7
原创 文本分类中语料库的获取——对搜狗语料库进行想要格式的获取
最近一个都在整数据挖掘课程的大作业,终于告一段落,也有时间来更新一些博客。第一次接触文本分类,一个月内学到了太多,期间涉及到的一些处理上的主要部分需要总结一下,以便之后查阅。这次主要总结搜过语料库的获取,因为老师要求20万数据,而我自己只爬了2万多,所以用到了搜狗的语料库,链接推送门点击这里在这个页面中,我选择的是一个月的数据,别小看一个月,我从里面只用了24万,这24万可能在
2016-12-02 17:15:21 20815 28
文本分类实验报告(详尽版本)
2019-01-11
pygame1.9.3版本64位windows
2017-09-13
文本分类实验报告
2016-12-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人