机器学习
文章平均质量分 60
JasonStudy
不要在欣赏伟人的同时,忘记自己的脚步。时间是线索,脚步是印记。
展开
-
数据分析岗-机器学习相关知识
数据分析岗-机器学习相关知识。解释共线性,共线性即多重共线性,多重共线性判断依据,共线性问题解决方法,解释相关关系。线性回归(Linear Regression)是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。逻辑回归,SVM支持向量机,决策树(信息增益ID3、增益率C4.5、Gini指数Cart树)。简述随机森林,随机森林的优点。GBDT和XGBoost的区别。原创 2018-11-04 15:21:20 · 667 阅读 · 0 评论 -
分类模型的效果评估
对模型进行效果评估,验证模型的性能,混淆矩阵、精准率(Precision)、召回率(Recall)也称查全率、准确率(Accuracy)、F1也称F1_score、Fβ、真正例率TPR、假正例率FPR、ROC、AUC、PR、AUC、宏精准率macro_precison、宏召回率macro_recall、宏F1 macro_F1、微精准率micro_precison、微召回率micro_recall、微F1 micro_F1。结合Sklearn讲解如何绘制ROC曲线、PR曲线。利用Python画ROC曲线。原创 2018-11-17 21:42:13 · 3238 阅读 · 0 评论 -
TensorFlow神经网络中的激活函数
激活函数是人工神经网络的一个极其重要的特征。它决定一个神经元是否应该被激活,激活代表神经元接收的信息与给定的信息有关。激活函数对输入信息进行非线性变换。 然后将变换后的输出信息作为输入信息传给下一层神经元。激活函数的作用当我们不用激活函数时,权重和偏差只会进行线性变换。线性方程很简单,但解决复杂问题的能力有限。没有激活函数的神经网络实质上只是一个线性回归模型。激活函数对输入进行非线性变换...原创 2018-01-18 17:27:00 · 553 阅读 · 0 评论 -
天池精准医疗大赛——人工智能辅助糖尿病遗传风险预测
作为天池上的新手,第一次参加天池阿里云线上的比赛,糖尿病预测,一般的数据挖掘比赛,流程:数据清洗,特征工程(找特征,特征组合),不断的尝试的不同算法,不断调参,也可以考虑将多个模型进行线性组合大赛初赛数据共包含两个文件,训练文件d_train.csv和测试文件d_test.csv,每个文件第一行是字段名,之后每一行代表一个个体。文件共包含42个字段,包含数值型、字符型、日期型等众多数据类型...原创 2018-02-06 21:00:00 · 2227 阅读 · 0 评论 -
数据挖掘特征提取方法-汇集
1.基于树模型提取特征# 使用树模型提取特征import numpy as npfrom sklearn import feature_selectionfrom sklearn.ensemble import GradientBoostingClassifiermatrix = np.array(X)target = np.array(target)temp = featur...原创 2018-07-15 21:20:00 · 2966 阅读 · 0 评论 -
Python实现统计学的各种检验
1.使用python中的Numpy进行t检验http://www.atyun.com/7476.html2.scipy中的卡方检验http://wiki.mbalib.com/wiki/%E5%8D%A1%E6%96%B9%E6%A3%80%E9%AA%8C3.如何检测数据中的特异值?http://www.360doc.com/content/18/0207/12/501539...原创 2018-08-08 09:12:00 · 2492 阅读 · 0 评论 -
数据挖掘博客收集
1.Distance correlation(距离相关系数)https://blog.csdn.net/jiaoaodechunlv/article/details/806555922.Python sklearn.feature_selection.chi2() Exampleshttps://www.programcreek.com/python/example/81276/skl...原创 2018-08-24 09:58:00 · 270 阅读 · 0 评论 -
XGBoost 输出特征重要性以及筛选特征
1.输出XGBoost特征的重要性from matplotlib import pyplotpyplot.bar(range(len(model_XGB.feature_importances_)), model_XGB.feature_importances_)pyplot.show()XGBoost 特征重要性绘图也可以使用XGBoost内置的特征重要性绘图函数# pl...原创 2018-08-26 10:27:00 · 13452 阅读 · 0 评论 -
2018研究生数学建模心路历程
2018研究生数学建模感想及心得体会,记录下心路历程。包括审题选题、代码编程,算法建模,解题思路,数据处理,模型验证。题目恐怖袭击事件的量化分析建模。对未确立作案者的恐怖袭击事件找出可能的作案嫌疑组织或个人。恐怖袭击事件的时空特性、蔓延特性、级别等进行挖掘和建模。初步考虑层次分析法,模糊动态加权评分法,最后考虑使用PCA主成分分析法确立变量的权重,基于密度聚类DBSCAN,ARMA时序模型,以及空间蔓延模型,莫兰指数等,关联规则的挖掘。最终获全国二等奖。原创 2018-11-14 17:24:05 · 12162 阅读 · 18 评论 -
研究生数学建模竞赛准备
研究生数学建模竞赛准备,熟悉一下数学建模的32种基础的常规方法,认真学习和研读一下最近几年的研究生数学建模优秀论文,选择几个感兴趣的问题,仔细看看优秀论文的建模思路和写作思路。编程技术方面选择:Matlab、Lingo:优化问题,线性模型,运筹学问题;Python:数据分析和数据挖掘大数据、神经网络深度学习之类;统计类问题Spss方便。TSP旅行商问题图网络、多目标规划、遗传算法、粒子群算法。组队很关键原创 2019-05-16 17:22:00 · 12753 阅读 · 3 评论