![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据建模
文章平均质量分 85
爱打羽毛球的小怪兽
不断学习,不断努力
展开
-
sklearn的make_classification函数生成随机的n类分类
目录make_classification函数生成随机的n类分类问题的简介示例如下以下内容为官网内容以及个人的总结下面有运行的示例,可以结合示例来对此函数进行了解,如需更多知识可以在中文官网查看sklearn.datasets.make_classification-scikit-learn中文社区make_classification函数生成随机的n类分类问题的简介sklearn.datasets.make_classification(n_samples=100, n_f.原创 2022-05-19 17:05:54 · 3419 阅读 · 2 评论 -
文本数据分析——情感分析
目录python文本分析工具NLTK在python环境下运行以下代码,选择需要的语料库进行下载典型的文本与处理流程为分词编辑结巴分词(中文分词)特殊字符可以使用正则表达式进行分词词形问题、词形归一化词性标注和停用词使用词频表示文本特征来度量文本间的相似性取出词频统计的最多的n个单词编辑文本分类编辑朴素贝叶斯算python文本分析工具NLTKNLP(自然语言处理)领域种最常用的一个python库,NLP是将自然语言(文本)转化为计算...原创 2022-05-14 11:45:12 · 1364 阅读 · 0 评论 -
时间序列数据分析相关知识
字符串和datetime的相互转换 datetime->strstr()可以强制转换datetime.strftime() 需要指定时间表示的形式,必须指定转换成的格式和分隔符str->datetimedatetime.strptime() 需要指定时间表示的形式,必须指定转换成的格式和分隔符dateutil.parser.parser() 可以解析大部分时间表示形式,如果第一个数字在月份范围之间...原创 2022-05-07 16:41:59 · 811 阅读 · 0 评论 -
机器学习笔记
决策树DecisionTreeClassifier:前剪枝(创建时便指定信息熵的临界值)和后剪枝绘制决策树的图,如下朴素贝叶斯算法:GaussianNB()#构造朴素贝叶斯分类器score(传入测试使用的自变量和因变量,一般指定sample_weight=None)来计算准确率对模型进行打分半朴素贝叶斯:为了解决朴素贝叶斯中属性独立性假设在实际中不适用的问题,建立一些属性间的联系,假定属性有一定的相关性,假设每个属性对多依赖一个其他的属性AODE:在ode的基础上原创 2022-03-20 15:59:28 · 1013 阅读 · 0 评论 -
广义线性模型(逻辑回归、泊松回归)
线性回归模型也并不适用于所有情况,有些结果可能包含而元数据(比如正面与反面)或者计数数据,广义线性模型可用于解释这类数据,使用的仍然是自变量的线性组合。目录逻辑回归使用statsmodels使用sklearn泊松回归使用statsmodels负二项回归逻辑回归当响应变量为二元数据时,常用逻辑回归对数据进行建模。以下数据来源于pandas活用所提供的数据,如需要可在此下载https://download.csdn.net/download/qq_57099024..原创 2022-02-05 10:17:39 · 3815 阅读 · 1 评论