机器学习
数学家是我理想
博客:https://wmathor.com
展开
-
TF-IDF
1.What is TF-IDFTF-IDF(Term Frequency-Inverse Document Frequency,词频-逆文件频率)TF-IDF是一种统计方法,用来评估一个词对一个文件集或一个语料库中的其中一份文件的重要程度。该词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降上述那段话的总结就是,一个词在一篇文章中出现次数越多,但...原创 2020-02-23 11:58:01 · 1786 阅读 · 0 评论 -
神经网络算法
人工神经网络概述生物神经元人工神经元人工神经元用于模拟生物神经元,人工神经元可以看做是一个多输入、单输出的信息处理单元,它先对输入变量进行线性组合,然后对组合的结果做非线性变换。因此可以将神经元抽象为一个简单的数学模型,也称为感知器。最简单的人工神经元模型:神经元的工作过程一般是:从各输入端接收输入信号xi根据连接权值wi,求出所有输入的加权和,即net=∑i=1nwixine...原创 2018-10-31 09:03:07 · 2937 阅读 · 0 评论 -
时间序列分析
时间序列时间序列(简称为时序)是指同一现象在不同时间上的相继观测值排列而成的数列,一个按时间顺序排列的数列,形式上由现象所属的时间和现象在不同时间上的观测值两部分组成,排列的时间可以是年份、季度、月份或其他任何时间形式。时间序列分析时间序列分析是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计变化规律,以用于解决实际问题。通常影响时间序列变化的...原创 2018-10-29 21:15:51 · 4986 阅读 · 0 评论 -
回归分析算法
“回归”名词的由来1889年,英国著名统计学家Francils Galton在研究父代与子代身高之间的关系时发现:身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有他们的父母的平均身高高;身材较矮的父母,他们的孩子也较矮,但这些孩子的平均身高却比他们父母的平均身高高。Galton把这种后代的身高向中间值靠近的趋势称为“回归现象”。后来人们把由一个变量的变化去推测另一个变量的变化的方法...原创 2018-10-29 21:21:07 · 6544 阅读 · 1 评论 -
决策树
1.什么是决策树决策树是一种树形结构,为人们提供决策依据,决策树可以用来回答yes和no问题,它通过树形结构将各种情况组合都表示出来,每个分支表示一次选择(选择yes还是no),直到所有选择都进行完毕,最终给出正确答案。第一个例子想象一个母亲要给这个女儿介绍男朋友,于是有了下面的对话: 女儿:多大年纪了? 母亲:26。 女儿:长的帅不帅? 母亲:挺帅的。 女儿:收入高不? 母亲:...原创 2018-10-30 13:03:00 · 1297 阅读 · 0 评论 -
“达观杯”文本智能处理挑战赛
1.比赛地址及数据来源"达观杯"文本智能挑战赛2.代码及解析"""@简介:tfidf特征/ SVM模型@成绩: 0.77"""#导入所需要的软件包import pandas as pdfrom sklearn.svm import LinearSVCfrom sklearn.feature_extraction.text import TfidfVectorizerprin...原创 2018-11-01 19:36:58 · 279 阅读 · 0 评论 -
科赛——【文本情感分类模型搭建 | 预选赛】(Score:0.8624)
预选赛题——文本情感分类模型Data Analysis先来观察下数据,训练集和测试集分别存储在当前目录下的train.csv和20190520_test.csv中train_data = pd.read_csv('train.csv', lineterminator='\n') # 行分隔符 = '\n'test_data = pd.read_csv('20190520_test.csv...原创 2019-05-25 11:41:26 · 1779 阅读 · 6 评论 -
K-Means算法实现(Matlab)
K-Means算法具体内容可以参考我博客的相关文章,这里只使用Matlab对其进行实现,其他内容不多赘述K-Means算法1.生成随机样本点首先利用mvnrnd函数生成3组满足高斯分布的数据,每组数据都是100*2的矩阵,也就相当于生成300个在坐标轴上的样本点%% 第一组数据mu1=[0 0]; %均值S1=[0.1 0 ; 0 0.1]; %协方差data1=mvnrnd(m...原创 2019-09-30 09:12:52 · 11037 阅读 · 3 评论