python_ad_pca

最新推荐文章于 2024-06-30 16:17:41 发布

borayolo

最新推荐文章于 2024-06-30 16:17:41 发布

阅读量853

点赞数

分类专栏： python数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_36709248/article/details/71055535

版权

该博客介绍了如何使用Python进行主成分分析（PCA）和决策树分类。首先，通过自定义函数处理数据中的数值和缺失值，然后使用PCA将特征降维到5个主要成分。接着，使用决策树模型进行分类，并通过交叉验证评估模型的精度。最后，通过可视化展示了不同类别样本在PCA降维后的分布情况。

摘要由CSDN通过智能技术生成

#! /usr/bin/env python
#coding=utf-8
import pandas as pd
import numpy as np
from sklearn.decomposition import PCA
from collections import defaultdict
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import cross_val_score
from matplotlib import pyplot as plt
#定义一个函数：1.前几个特征是数值，pandas把他们看成是字符串2.处理缺失值
def convert_number(x):
    try:
        return float(x)
    except ValueError:
        return np.nan
#

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
python_ad_pca

#! /usr/bin/env python#coding=utf-8import pandas as pdimport numpy as np#定义一个函数：1.前几个特征是数值，pandas把他们看成是字符串2.处理缺失值def convert_number(x): try: return float(x) except ValueError:
复制链接

扫一扫

专栏目录

borayolo CSDN认证博客专家 CSDN认证企业博客

码龄8年

14: 原创

209万+: 周排名

111万+: 总排名

16万+: 访问

: 等级

1192: 积分

30: 粉丝

47: 获赞

24: 评论

153: 收藏

私信

关注

热门文章

分类专栏

python数据分析 13篇
sql 1篇
ML 6篇
R数据分析 4篇
SAS 1篇
tensorflow 1篇

最新评论

R语言_ggplot2 分面相关设置（facet）
MULI_SUKE: 请问我不想让数字作为分组的标签该怎么办呢
bert-modeling代码学习
jzh0633: 无语
F tensorflow/python/lib/core/bfloat16.cc:675] Check failed: PyBfloat16_Type.tp_base != nullptr
行者无疆哇: numpy与tensorflow版本不对应造成的
F tensorflow/python/lib/core/bfloat16.cc:675] Check failed: PyBfloat16_Type.tp_base != nullptr
行者无疆哇: 重装numpy可以解决问题[code=python] pip uninstall numpy pip install numpy [/code]
bert-create_pretraining_data代码学习
小菜鸟快飞: 文章很好，很受益，谢谢博主！我这里有一个问题：就是MASK是在tokenizer将输入的英语句子划分成子词后进行MASK对吗？例如：原始输入为：There is a Philosophical man . ；假如tokenizer后为：There is a Phil ##osophical man . 。那么MASK后是哪种情况呢？：1、tokenizer后再做MASK：There is a [MASK] ##osophical man . ；2、先MASK后再进行tokenizer，所以MASK后为：There is a [MASK] man . 按照您理解源码到底是哪一种情况呢？如果按照第一种情况MASK住的不是一个完整的词，这样对训练没有问题吧？O(∩_∩)O谢谢博主了！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。