数据科学导引上机(5)

1源数据

此次用到的是青少年社交网络中常用词数据,借此进行市场调研

使用的方法是K-Means聚类方法,不介绍原理

2 数据探索和预处理

# 数据预处理
import pandas as pd
teenager_sns = pd.read_csv('teenager_sns.csv')
# 查看数据最后20行
teenager_sns.tail(20)
#1.1)观察数据,并查看数据是否存在缺失值?
teenager_sns.info()

#2.1)统计gender存在缺失值的样本数量。
teenager_sns["gender"].value_counts(dropna = False)

#2.2)统计age存在缺失值的样本数量,并给出age变量的整体描述?
print(f'age变量缺失值数目: {teenager_sns["age"].isnull().sum()}')
teenager_sns["age"].describe()

 将不合理的年龄数据(异常值)设置为NaN

import numpy as np

def tag_nan(value):
    if (value >= 13) & (value < 20):
        return value
    else:
        return np.NaN
# 青少年年龄在13~18岁,超过范围的设为NaN
# map映射函数
teenager_sns["age"]  = teenager_sns["
  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
比例导引是一种经典的控制算法,常用于控制系统中的位置、速度、力或其他物理量。在Simulink中,我们可以使用比例导引来设计控制系统,并通过模拟和仿真来验证其性能。 首先,我们需要在Simulink中创建一个控制系统模型,包括所需的输入、输出和反馈信号。然后,我们可以通过添加比例导引控制器来实现所需的控制功能。比例导引控制器通常表示为一个增益,它可以根据输入信号的大小来调节输出信号,并在系统达到稳定状态时保持所需的控制性能。 在Simulink中,我们可以使用图形化的方式来设计比例导引控制器,例如通过添加比例增益块并调节其数值来实现所需的控制效果。同时,我们还可以添加其它控制器来组合成更复杂的控制系统,如PID控制器以及其他高级控制算法。 通过Simulink的仿真功能,我们可以对比例导引控制系统进行验证和调试,观察系统的响应和稳定性,并根据仿真结果来优化控制器的设计。同时,Simulink还提供了丰富的分析工具和可视化功能,帮助我们更直观地了解控制系统的性能表现,并进行系统优化和改进。 总之,比例导引在Simulink中是一种常用且有效的控制算法,它可以帮助我们设计和验证各种控制系统,并通过仿真和分析来进行系统优化和改进。通过Simulink,我们可以快速、方便地实现比例导引控制器,并对其性能进行全面的评估和分析。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值