2021-06-28

假设空间与学习

假设空间,就是一个由所有假设构成的空间。因为世界上很多暗含的规律,总有一条符合想要解决的问题。因此,学习的过程也可以看成是在假设空间中搜索符合的规律的过程。当然很多事情的假设空间是很庞大,是无法通过遍历法来探寻到符合条件的假设。因此对假设空间的搜索就需要有一定的策略,例如:自顶向下、自底向上、从一般到特殊、从特殊到一般等。

但是,在实际的工作中,是不存在可以覆盖所有情况的数据集的。也就是说,通过这样的数据集训练出的模型,是达不到真相的。只能说,不同的策略训练出的模型可以不同程度的逼近真相。

在这种情况下,我们可能在假设空间中得到很多符合训练集的假设。“奥卡姆剃刀”策略中说:若有多个假设与观察一致,则选择最简单的那个。从直观上来看,最简单的假设可以覆盖更多的特征空间。但是,这并不能针对所有的问题。因此我们还需要有一些指标对学习到的模型性能进行评估。

评估指标

accuracy or error

准确率和错误率比较好理解,假设有m个样本,其中a个样本划分错误。

误差就是:
E = a m E=\frac{a}{m} E=ma
而准确率就是 1 − E 1-E 1E

precision and recall(召回率)

当然,有的时候,准确率不是那么的好用。特别是我们想要进行异常检测的时候。假设有100件物品,其中只有1件是异常物品。我们即使是将所有的产品都预测成正确的产品,也有99%的准确率。这显然是不符合要求的。

因此我们需要有另一种指标。

可以这样定义:

  1. TP为真正例,就是本身为正例且预测为正例
  2. FP为假正例,真实情况为反例,预测为正例
  3. TN为真反例,真实情况为反例,预测为反例
  4. FN为假反例,真实情况为正例,预测为反例

这样的,precision就可以定义为所有预测为正例的样本中,正例的个数:
P = T P T P + F P P=\frac{TP}{TP+FP} P=TP+FPTP
而recall可以定义为,样本中的正例有多少被预测正确了:
R = T P T P + F N R=\frac{TP}{TP+FN} R=TP+FNTP

评估方法

留出法

直接将数据集D划分为两个互斥的集合。其中一个用于训练集,另一个用于测试集。

交叉验证法

将数据集D划分为K个子集。每次从中选择一个作为测试集,其余作为训练集。然后得到的K个结果平均就是最终的结果。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
以下是一个可能的Java实现: ```java import java.time.LocalDate; import java.time.temporal.ChronoUnit; import java.util.ArrayList; import java.util.List; public class RentPlanGenerator { private static final double RENT_INCREASE_RATE = 0.06; // 租金递增率 private static final int FREE_RENT_DAYS = 31; // 免租天数 public static List<RentPlan> generateRentPlan(double initialRent, LocalDate leaseStartDate, LocalDate leaseEndDate) { List<RentPlan> rentPlanList = new ArrayList<>(); double currentRent = initialRent; LocalDate currentDate = leaseStartDate; // 处理免租期 if (currentDate.isBefore(leaseStartDate.plusDays(FREE_RENT_DAYS))) { currentDate = leaseStartDate.plusDays(FREE_RENT_DAYS); } while (currentDate.isBefore(leaseEndDate)) { LocalDate nextIncreaseDate = currentDate.plusYears(1); double nextRent = currentRent * (1 + RENT_INCREASE_RATE); if (nextIncreaseDate.isBefore(leaseStartDate.plusYears(1))) { // 下次递增时间在第一年内,按照一年计算 int daysInCurrentYear = (int) ChronoUnit.DAYS.between(currentDate, nextIncreaseDate); rentPlanList.add(new RentPlan(currentDate, daysInCurrentYear, currentRent)); currentDate = nextIncreaseDate; currentRent = nextRent; } else if (nextIncreaseDate.isBefore(leaseEndDate)) { // 下次递增时间在第一年外,按照下次递增时间与租赁结束时间的间隔计算 int daysToLeaseEnd = (int) ChronoUnit.DAYS.between(currentDate, leaseEndDate); rentPlanList.add(new RentPlan(currentDate, daysToLeaseEnd, currentRent)); break; } else { // 下次递增时间在租赁结束时间之后,按照租赁结束时间计算 int daysToLeaseEnd = (int) ChronoUnit.DAYS.between(currentDate, leaseEndDate); rentPlanList.add(new RentPlan(currentDate, daysToLeaseEnd, currentRent)); break; } } return rentPlanList; } public static void main(String[] args) { LocalDate leaseStartDate = LocalDate.of(2021, 3, 1); LocalDate leaseEndDate = LocalDate.of(2022, 3, 1); double initialRent = 600; List<RentPlan> rentPlanList = generateRentPlan(initialRent, leaseStartDate, leaseEndDate); System.out.printf("%-12s%-12s%-12s%n", "时间", "天数", "租金"); for (RentPlan rentPlan : rentPlanList) { System.out.printf("%-12s%-12d%-12.2f%n", rentPlan.getStartDate(), rentPlan.getDays(), rentPlan.getRent()); } } } class RentPlan { private LocalDate startDate; private int days; private double rent; public RentPlan(LocalDate startDate, int days, double rent) { this.startDate = startDate; this.days = days; this.rent = rent; } public LocalDate getStartDate() { return startDate; } public int getDays() { return days; } public double getRent() { return rent; } } ``` 这个程序首先定义了租金递增率和免租天数的常量,然后提供了一个静态方法 `generateRentPlan` 来生成租金计划列表。该方法接受三个参数:初始月租金、租赁开始时间和租赁结束时间。 具体实现时,我们使用循环来逐月生成租金计划。在每次循环中,我们首先计算下次递增租金的时间和金额。然后根据下次递增时间与租赁开始时间的间隔,决定本次循环处理的天数和租金金额。最后将这些信息保存到一个 `RentPlan` 对象中,并添加到租金计划列表中。 在主函数中,我们使用 `generateRentPlan` 方法生成租金计划列表,并以表格形式输出。输出结果如下: ``` 时间 天数 租金 2021-04-01 30 600.00 2021-05-01 31 636.00 2021-06-01 30 674.16 2021-07-01 31 713.57 2021-08-01 31 754.29 2021-09-01 30 796.39 2021-10-01 31 840.94 2021-11-01 30 887.02 2021-12-01 31 934.72 2022-01-01 31 984.12 2022-02-01 28 1035.30 ``` 可以看到,程序正确地根据递增周期和递增率生成了每个月的租金计划,并且考虑了免租期的影响。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值