data mining/machine learning
文章平均质量分 63
空城_招Python数据处理
Python数据处理急招人
展开
-
基于财经新闻的LDA主题模型实现:Python
LDA主题模型虽然有时候结果难以解释,但由于其无监督属性还是广泛被用来初步窥看大规模语料(如财经新闻)的主题分布。这篇博客侧重提供一个LDA主题模型python代码的技术实现,不侧重如何分析财经新闻(后面再更)。# -*- coding: utf-8 -*-#import pacakgeimport pandas as pdimport reimport jiebafrom ppr...原创 2020-01-21 23:01:59 · 1425 阅读 · 0 评论 -
python主成分分析实战案例
PCA主成分分析主要用于数据降维。由一系列特征组成的多维向量,其中某些元素本身没有区分性,或者彼此区分不大。此时,如果用它做特征区分,相似元素贡献会比较少。我们目的是找到那些变化大的元素,即方差较大的维,去除那些变化不大的维度。具体理论参考:http://www.ams.org/samplings/feature-column/fcarc-svd案例示例:#-*- coding原创 2015-04-29 14:49:18 · 7715 阅读 · 0 评论 -
【python】Logistics模型预测银行贷款违约
Logistics模型预测贷款违约 logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。 Logistics回归模型中因变量只有1-0,两种取值。模型理论重要参考一、模型输入:二、特征选择:特征选择是模型成功的基础性重要工作。一般特征筛选方法有(1)看模型系数...原创 2016-01-03 15:18:34 · 11221 阅读 · 5 评论