自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 问答 (1)
  • 收藏
  • 关注

原创 WSL 实现windows和linux交互

Windows Subsystem for Linux(WSL)是一项强大的技术,它消除了 Windows 和 Linux 之间的壁垒,为开发者和系统管理员提供了强大的工具,用于开发、管理和测试应用程序。Windows Subsystem for Linux(WSL)是一项强大的技术,它消除了 Windows 和 Linux 之间的壁垒,为开发者和系统管理员提供了强大的工具,用于开发、管理和测试应用程序。用wsl2的话,只要你是最新版的win10系统,或者win11系统,是可以调用英伟达GPU的。

2024-05-22 23:29:15 363 2

原创 如何才能在CSDN上发布付费内容

通过以上方式,您可以在CSDN平台上赚取一定的收入,但需要持续输出高质量的内容,积累影响力和粉丝基础才能取得更好的效果。5.付费课程:您可以在CSDN平台上发布付费课程,传授专业知识和技能,吸引学员购买课程获取收益。3.写作任务:CSDN平台会不定期发布写作任务,您可以参与任务并按要求完成,获取相应的报酬。

2024-05-22 23:26:52 399 1

原创 简单的金融沙箱

这里的思路是,类似于 CartPole 环境, 4 个历史价格代表金融市场的状态,当给定一个状态时,智能体可以决定是做多还是做空。该类的 主要方法是 .reset() 和 .step(),其中,.step() 方法会检查是否采取了正确的动作,相 应地定义奖励,并检查成功或失败。移动平均线 回归线 回合 总 奖 励 图 9-3:运行于 Finance 环境的 DQLAgent 的平均总奖励 通用 RL 智能体 本节为金融市场环境提供了一个类,该类模拟了 OpenAI Gym 环境的 API。

2024-03-17 18:35:08 1738 1

原创 DQL智能体

1 1 ( , ) max ( , ) t t t t a Q S A R γ Q S a = + + + 这里,St 是步骤(时间)t 的状态,At 是状态 St 采取的动作,Rt+1 是动作 At 的直接奖励, 0 < γ < 1 是折扣因子, m 1 ax ( , ) t a Q S a + 是给定当前策略 Q 的最优动作下的最大延迟奖励。然而,在更有趣或更复杂的设置中(如 CartPole 环境),状态 数量过多,无法通过穷尽的方式写出 Q,因此,Q 通常被理解为一个函数。➌ 探索率的衰减率。

2024-03-17 18:28:44 414 1

原创 神经网络智能体

In [37]: set_seeds(100) agent = NNAgent() In [38]: episodes = 500 In [39]: agent.learn(episodes) episode: 500/500 | score: 11 | max: 44 In [40]: sum(agent.scores) / len(agent.scores) ➊ Out[40]: 13.682212 | 第 9 章 ➊ 所有回合的平均总奖励。简单地说,智能体会避免采取错误的动作,但没有学会赢得比赛。

2024-03-17 18:20:07 787 1

原创 蒙特卡罗智能体

In [24]: if s < 0: a = 0 else: a = 1 In [25]: a Out[25]: 0 接下来可以使用此策略玩一回合 CartPole 游戏。强化学习 | 209 if done: break return treward In [27]: run_episode(env, weights) Out[27]: 41.0 因此,可以应用蒙特卡罗模拟来测试大量不同的权重。下面的代码模拟了大量的权重,检 查它们是成功还是失败,然后选择产生成功的权重。➋ 这些权重的总奖励。

2024-03-17 18:14:18 613 1

原创 OpenAI Gym

在众多环境中,有模拟经典强化学习问题的 CartPole 环境(或游戏),即把一根杆子直立 在推车上,目的是通过左右移动推车来学习平衡杆子的策略。在以下环境中,允许的动作由动作空间来描述,在这种情况下有两个动作空间,分别用 0 (向左推车)和 1(向右推车)来表示。在这种情况下,智能体可以走的步数仅取决于它的幸运 程度,其并未以更新策略的形式进行学习。通过交互获得数据 在监督学习中,假设训练数据集、验证数据集和测试数据集在训练开始之前 已经存在,而在强化学习中,智能体通过与环境交互来生成自己的数据。

2024-03-17 18:05:41 860 1

原创 强化学习的基本概念

环境 环境定义了当前的问题,可以是要玩的计算机游戏或要进行交易的金融市场。动作 智能体可以从一组(有限的)被允许的动作中选择一个动作。在计算机游戏中,被允许 的动作可能是向左或向右移动,而在金融市场中,被允许的动作可能是做多或做空。步骤 给定智能体的动作,环境状态会被更新,这样的更新通常被称为一个步骤。虽然在计算机游戏中,与游戏环境 的实时交互是通过相当短且相同的时间间隔(“游戏时钟”)来模拟的,但诸如与金融市 场环境交互的交易机器人则可以在更长且不同的时间间隔内采取动作。

2024-03-17 17:58:25 416 1

原创 Python进行金融特征的估计和分类,及如何构建深度RNN

这次我们使用 LSTM 层,即使对于相对少量的隐藏单 元和有限的几个训练轮数,样本外的准确率也相当高。➌ 训练标签的组频率。一个主要区别是训 练数据和测试数据必须以序列形式呈现给各自的方法,但是通过应用 TimeseriesGenerator 函数可以轻松实现这一点,该函数使用的生成器对象会将序列数据转换为 Keras 中的 RNN 能处理的数据。为模型创建提供的函数可以使用 SimpleRNN 层或 LSTM 层以及不同 的优化器等,还可以在浅层神经网络和深层神经网络的背景下对估计和分类问题进行建模。

2024-03-17 17:47:38 1861 1

原创 神经网络的优化器简介

Keras 包提供了一系列可与 Sequential 模型结合使用的优化器(optimizer)。不同的优化器 可能会表现出不同的性能,包括训练时间和预测准确率。以下 Python 代码使用不同的优化 器并对其性能进行了基准测试。在所有情况下,都应该使用 Keras 的默认参数化。样本外 性能变化不大。然而,不同优化器的样本内性能差异很大。➋ 使用给定的优化器拟合模型。➌ 评估样本内性能。➍ 评估样本外性能。

2024-03-17 17:33:50 417 1

原创 神经网络装包

避免过拟合的装袋方法已经在第 6 章中使用过,尽管仅用于 scikit-learn 的 MLPClassifier 模型。另外,Keras DNN 分类模型的包装器也会以 scikit-learn 的方式使用装袋,即 KerasClassifier 类。然而, 如前所述,结果是由类不平衡驱动的,正如这里反映的类别 0 的预测频率较高。分布式学习 从某种意义上说,装袋在许多神经网络(或其他模型)之间分配学习任务, 比如,每个神经网络只能看到训练集的某些数据和部分特征。

2024-03-17 17:30:27 409 1

原创 神经网络的正则化

图 7-5 显示了正则化下的训练集准确率和验证集准确率,这两个性能指标比以前看到的要 紧密得多。训练集准确率 验证集准确率 图 7-5:训练集准确率值和验证集准确率值(使用正则化) 当然,暂退和正则化可以一起使用。在这种情况下,训练集准确率和验证集准确率之间 的差异确实是最小的。图 7-6 显示了结合暂退和正则化时的训练集准确率和验证集准确率。训练集准确率 验证集准确率 图 7-6:训练集准确率值和验证集准确率值(同时使用暂退和正则化) 惩罚大权重 正则化通过惩罚神经网络中的大权重来避免过拟合。

2024-03-17 17:26:37 504 1

原创 神经网络的暂退

理想情况下,神经网络的行为应该类似:DNN 中的连接 不应变得太强,以避免过拟合训练数据。从技术上讲,Keras 模型在隐藏层间有额外的层管理暂退,主要参数是层的隐藏单元被丢 弃的速率。但是,两种性能指标之间的差异较小, 这通常是一种理想的情况。训练集准确率 验证集准确率 图 7-4:训练集准确率值和验证集准确率值(使用暂退)密集神经网络 | 181 刻意遗忘 Keras 的 Sequential 模型中的暂退模拟了人类的经历:忘记以前记忆的信息。这是通过在训练期间停用隐藏层的某些隐藏单元来实现的。

2024-03-17 17:23:46 397 1

原创 资本资产定价模型

类似的方法也可以应用于 CAPM 的实际测试。下面的 Python 代码会首先求出给定年份 的每只股票的 beta 系数,然后根据该股票的 beta 系数和市场投资组合的表现,计算其明年104 | 第 4 章 的预期收益率。106 | 第 4 章 2011年 2012年 2013年 2014年 2015年 2016年 2017年 2018年 2019年 图 4-9:单只股票的 CAPM 预期收益率与实际股票收益率 图 4-10 比较了 CAPM 预期股票收益率的平均值与实际收益率的平均值。

2024-03-17 17:14:03 408 1

原创 人工智能、机器学习、神经网络、超级智能和技术奇点

AlphaGo Zero 智能吗?如果没有对智能的具体定义,就很难说清楚。人工智能研究员 Max Tegmark(2017)将智能简明地定义为“完成复杂目标的能力”。 这个定义足够广泛,可以包含更具体的定义。鉴于该定义,AlphaGo Zero 是智能的,因 为它能够完成一个复杂的目标,即在围棋或国际象棋比赛中打败人类玩家或其他人工智能 体。当然,人类和一般的动物也因此被认为是智能的。 注 6: CPU 代表中央处理器,它是所有标准台式机或笔记本计算机中的通用处理器。超级智能 | 37 就本书而言,以下更具

2024-03-17 16:37:43 1697 2

原创 AlphaGO的亲兄弟AlphaZero

直到计算机国际象棋开发人员和国际商业机器公司(IBM)的硬件专家花了 12 年的时 间制造了一台名为“深蓝”的计算机,机器才能够击败当时的人类世界国际象棋冠军 Garry Kasparov。虽然“深蓝”输掉了第一场比赛, 但它赢了剩下 5 场比赛中的 2 场,另外 3 场比赛以双方协议的平局告终。Kasparov 在其书中提到现代智能手机上 的国际象棋应用时,如此说道: 再向前快进 20 年到今天,即 2017 年,你可以为你的手机下载任意数量的免费国 际象棋应用,这些应用可以与任何人类大师相媲美。

2024-03-17 16:28:59 331

原创 AlphaGo的由来

DeepMind 的一个团队使用其 AlphaGo 算法在围棋领域取得了突破性进展(参见 DeepMind 网站中的 AlphaGo 页面),Silver 等人在 2016 年的研究中将情况描述如下: 由于其巨大的搜索空间以及评估棋盘局势和落子的难度,围棋一直被视为人工智 能经典游戏中最具挑战性的游戏。同样,DeepMind 在 2017 年达到了一个非凡的里程碑:一个玩游戏的人工智能体,经过不 到 24 小时的自我游戏和训练,在 3 个经过数百年深入研究的棋盘游戏中达到了高于人类 专家的水平。

2024-03-17 16:24:03 391

原创 请问我在sql中设置变量报错了,看了半天也没看出来错误在哪

sql中设置变量可以采用如下语句的吧:set @day="2019/8/1";select * from table where XXX

2022-01-08 23:47:04 492

华为杯数学建模题:关于空气质量预报的二次建模

建立空气质量预报模型对于减少大气污染对人体健康和环境的危害具有重要作用,如何建立准确的空气质量预报模型,提前获取可能发生的大气污染和采取相关措施具有重要意义。 本文针对WRF-CMAQ模拟体系预测模型进行改进研究,主要解决了在污染物排放不变的情况下,将不同特征的气候条件进行分类并得出不同特征气候条件对污染物浓度的影响程度的问题,针对A、B、C三个监测点建立合适的二次预报数学模型用以预测未来几天6种常规污染物单日浓度值,同时根据相邻区域的污染物浓度相关性,建立四个临近区域内的协同预报模型以提升对观测点污染物浓度预测的准确性。 针对问题一,我们根据《环境空气质量指数(AQI)技术规定(试行)》(HJ633-2012)来计算空气质量指数(AQI)用以判别空气质量等级。首先根据公式1.1计算得到各项污染物的空气质量分指数(IAQI),公式1.1如下: IAQI_P=(IAQI_Hi-IAQI_Lo)/(BP_Hi-BP_Lo )⋅(C_P-BP_Lo )+IAQI_Lo (1.1) 空气质量指数(AQI)取各分指数中的最大值,即 AQI=ma

2024-03-19

基于深度学习的文本大数据辅助量刑规则挖掘

随着大数据时代的到来,人工智能技术在法学领域中得到空前发展,智慧司 法系统和计算法学学科应运而生,文本分析、深度学习等关键技术逐渐被应用到 了传统法律问题中,通过数据化的辅助技术来拓宽法官的裁判思路,有助于提高 司法审判的效率和质量,从而维护我国法律体系的公平和正确性。 目前,把大数据处理技术运用到辅助量刑领域的成果较少,且大多数已有研 究的辅助量刑工具均为传统机器学习方法,包括朴素贝叶斯、决策树、K 近邻算 法等等,但传统机器学习方法在针对大量案件学习过程中存在性能较差,速度较 慢的问题,而深度学习模型则可以有效地提升模型效率与预测的准确性,因此基 于深度学习模型计算机辅助量刑可能会减少一定的量刑偏差;另外,由于司法领 域中存在着大量的裁决案件,文本数据中包含着重要的量刑信息,因此基于深度 学习和文本挖掘技术相结合的辅助量刑工具可能对模型的预测精度有显著的提 升作用。 本案例分析主要分成三部分。第一部分是文本预处理,利用文本挖掘技术对 法律文本进行分词、去除停用词和过滤等操作,并利用词云图和分布图等对数据 进行探索性分析。第二部分,文本向量化,首先通过 TF-IDF 方法构造词向

2024-03-19

大学生数学建模、研究生数学建模大赛的资料(华为杯、美赛等资料)

为在大学生中倡导学习统计、应用统计的良好氛围,促进大学生关注经济社会热点难点问题,适应大数据时代下高校及统计部门对统计人才的培养要求,中国统计教育学会、全国应用统计专业学位研究生教育指导委员会联合举办2021年(第七届)全国大学生统计建模大赛,本届大赛主题为“数据新动能的统计测度研究”,旨在提高大学生数据挖掘、数据分析、运用统计方法及计算机技术处理数据的能力,加强创新思维意识,助力推进统计现代化改革。经过一年的筹备、征集和筛选评议工作,最终选出这26篇优秀论文集结成册,展示当代大学生的统计应用能力和研究水平。

2024-03-19

288页Python核心知识手册

Python 诞生于 1989 年的圣诞期间,由 Guido van Rossum 开发而成,目前 Guido 仍然是Python 的主要开发者,主导着 Python 的发展方向,Python 社区经常称呼他为『仁慈的独裁者』。 Python 是一门面向对象,解释型的高级程序设计语言,它的语法非常简洁、优雅,而这也是 Python的一些设计哲学。Python 自带了很完善的库,涵盖了数据库,网络,文件处理,GUI 等方方面面,通过这些库,我们可以比较快速地解决一些棘手问题,也可以将其作为基础库,开发出一些高级库。 目前 Python 在大部分领域都占有一席之地,比如 Web 开发,机器学习,科学计算等。不少大型网站都是使用 Python 作为后台开发语言的,比如 YouTube、Pinterest、国内的豆瓣和知乎等。 另外,有不少知名的机器学习库也是使用 Python 开发的,比如,scikit-learn 是一个强大的机器学习库,PyTorch 是一个成熟的深度学习库。本书是我学习和使用 Python 的总结。在学习和使用 Python 的过程中,我作了不少笔记。

2024-03-19

Python编程入门教程

本书是一本针对所有层次的 Python 读者而作的 Python 入门书。全书分两部分 :第一部分介绍用 Python 编程所必须了解的基本概念,包括 matplotlib、NumPy 和 Pygal 等强大的 Python 库和工具介绍,以 及列表、字典、if 语句、类、文件与异常、代码测试等内容 ;第二部分将理论付诸实践,讲解如何开发 三个项目,包括简单的 Python 2D 游戏开发,如何利用数据生成交互式的信息图,以及创建和定制简单的 Web 应用,并帮读者解决常见编程问题和困惑。 本书适合对 Python 感兴趣的任何层次的读者阅读。 本书旨在让你尽快学会Python,以便能够编写能正确运行的程序——游戏、数据可视化和 Web应用程序,同时掌握让你终身受益的基本编程知识。本书适合任何年龄的读者阅读,它不要 求你有任何Python编程经验,甚至不要求你有编程经验。如果你想快速掌握基本的编程知识以便 专注于开发感兴趣的项目,并想通过解决有意义的问题来检查你对新学概念的理解程度,那么本 书就是为你编写的。本书还可供初中和高中教师用来通过开发项目向学生介绍编程。

2024-03-19

stata进行计量经济学常用的命令及出来的结果

计量经济学的单位根检验; 动态面板数据模型命令 空间计量模型命令(分区域的空间计量模型、全国层面的空间计量模型) 普通计量模型(单位根检验、静态面板数据模型(门槛效应等)) 静态面板数据命令 门槛效应 生成的空间权重矩阵(东中西部地区的空间权重矩阵) 稳健性检验 中介效应检验

2024-03-19

绿色金融的相关数据展示

表2-1 指标体系表 目标层 二级指标 三级指标 指标含义 绿色金融发展水平 绿色信贷 环保企业贷款额度 非六大污染产业利息占比 节能环保企业每年的贷款额度 非六大污染产业利息/规模以上工业企业利息支出 绿色证券 节能环保企业市值 节能环保企业A股市值 节能环保企业市值占比 节能环保企业A股总市值/A股总市值 绿色投资 节能环保财政支出占比 节能环保财政支出/地方财政总支出 环境污染治理投资占比 环境污染治理投资额/GDP 绿色保险 碳金融 农业保险规模占比 农业保险支出/保险总支出 农业保险赔付比 碳排放贷款强度 农业保险支出/农业保险收入 本外币贷款余额/碳排放量 二、绿色金融发展水平测度 (一)数据预处理 因各个表征指标收集存在量纲上的差异,故为保证后续数据可靠性,需对原始数据进行预处理,消除量纲之间的差异,使各维度指标具有一定标准。因本文选取的都为正向指标,故计算方法如下: (2-1) 其中, 表示t时期i地区的j指标标准化后的值, 表示t使其i地区j指标的原始值。 (二)确定权重方法 常用的指标权重确定方法有多种,大范围上

2024-03-19

绿色金融相关数据来源及指数聚合过程

表2-1 指标体系表 目标层 二级指标 三级指标 指标含义 绿色金融发展水平 绿色信贷 环保企业贷款额度 非六大污染产业利息占比 节能环保企业每年的贷款额度 非六大污染产业利息/规模以上工业企业利息支出 绿色证券 节能环保企业市值 节能环保企业A股市值 节能环保企业市值占比 节能环保企业A股总市值/A股总市值 绿色投资 节能环保财政支出占比 节能环保财政支出/地方财政总支出 环境污染治理投资占比 环境污染治理投资额/GDP 绿色保险 碳金融 农业保险规模占比 农业保险支出/保险总支出 农业保险赔付比 碳排放贷款强度 农业保险支出/农业保险收入 本外币贷款余额/碳排放量 二、绿色金融发展水平测度 (一)数据预处理 因各个表征指标收集存在量纲上的差异,故为保证后续数据可靠性,需对原始数据进行预处理,消除量纲之间的差异,使各维度指标具有一定标准。因本文选取的都为正向指标,故计算方法如下: (2-1) 其中, 表示t时期i地区的j指标标准化后的值, 表示t使其i地区j指标的原始值。 (二)确定权重方法 常用的指标权重确定方法有多种,大范围上

2024-03-18

客户违约预测模型搭建,搭建客户违约预测模型

客户违约预测模型搭建 本节将通过搭建客户违约预测模型来学习决策树模型在金融领域的应用,并会讲解衡量-个模型预测效果优劣的一些方法,最后通过可视化的方式呈现决策树模型。 运行结果见下表。其中共有1000组数据,前400条为违约客户记录,后600条为非违约客户记录。因为 Python在数学建模中无法识别文本内容,所以“性别”和“是否违约”列中的内容已经做了数值化处理。在“性别”列中,0表示男,1表示女:在“是否违约”列中,0表示不违约,1表示违约。我们的目的就是根据这些历史记录搭建决策树模型,来预测之后的客户的违约可能性。 其中“是否违约”列作为目标变量,其余5个列作为特征变量,通过研究一个借款客户的特征变量来判断其是否会违约。为了方便演示,这里只选取了5个特征变量,在商业实战中用到的特征变量会多得多。 接下来进入决策树模型的搭建,这是大部分机器学习模型搭建中的常规步骤。

2024-03-17

机器翻译(洛谷P1540) 问题描述,内存中有M个单元,每个单元能存储一个单词和意译

机器翻译(洛谷P1540) 问题描述,内存中有M个单元,每个单元能存储一个单词和意译。每当将一个新单词存入内存前,如果当前内存中已存入的单词数不超过M一1,会将新单词存入一个未使用的内存单元;若内存中已存入M个单词,会清空最早进入内存的那个单词,腾出单元存放新单词。 假设-篇英语文章的长度为 N 个单词。给定这篇待译文章,翻译软件需要去外存查找多少次词典?假设在翻译开始前,内存中没有任何单词。输入:共两行,每行中两个数之间用一个空格隔开。第1行输入两个正整数M和N,代表内存容量和文章的长度。第2行输入N个非负整数,按照文章的顺序,每个数(大小不超过 1000)代表一个英文单词。文章中两个单词是同一个单词,当且仅当它们对应的非负整数相同。 输出:一个整数,为软件需要查词典的次数.

2024-03-17

松弛-生活需要顺其自然

2010年,梅根·贝洛斯正在普林斯顿大学攻读化学工程博士学位, 她的研究围绕着如何将氨基酸放入蛋白质链中,以产生具有特殊特征的 分子。(“如果你能最大限度地发挥两种蛋白质的结合能,就能成功地 设计出一种生物功能的多肽抑制剂,这样你就能真正抑制疾病的进 展。”)当时她也在为自己的婚礼做准备。在婚礼前,她为安排座位而 苦恼。 现在已经有9个大学朋友坐在一起,贝洛斯正在发愁再让谁加入才 能让这样一个小小的团体凑够10个人一桌。更糟糕的是,她数了数发现 自己有11位亲戚。将谁从尊敬的父母席上分出去呢,她又该怎么向他们 解释呢?还有像她的童年邻居和保姆,或者她父母的同事,他们在婚礼 上根本不认识什么人怎么办? 这个问题似乎和她在实验室里研究的蛋白质问题一样困难,她被问 题打败了。一天晚上,当她盯着座位图时,“我意识到我博士论文中的 氨基酸和蛋白质跟我的婚礼上人们的座位之间确实存在着一对一的关 系。”贝洛斯向她的未婚夫喊了一声,便开始写方程式。氨基酸变成了 客人,结合能变成了相互关系,而分子之间所谓的“紧邻相互作用”就是 邻近的相互作用。她可以利用自己研究中的算法来安排自己的婚礼。

2024-03-14

过度拟合-不要想的太多

当查尔斯·达尔文试图决定是否应该向他的表妹艾玛·韦奇伍德求婚 时,他拿出一支铅笔和一纸张,并衡量了每一个可能的后果。关于结婚 的好处,他列举了孩子、陪伴和“音乐与女性聊天的魅力”等因素。相 反,关于婚姻中的不利因素,他列举了“可怕的时间损失”、没有自由去 他想要去的地方、亲戚的负担、孩子带来的花费和焦虑、担心“也许我 的妻子不喜欢伦敦”,以及花在买书上的钱变得更少等。衡量这一系列 因素使取得胜利的渠道变得十分狭窄,最后,达尔文潦草地用拉丁文写 道:“结婚——结婚——结婚,这被证明了。”达尔文自己用英文重述了 这一数学结论:“这证明结婚是必要的。” 在达尔文所处的时代,优劣对比已经被推崇,而这在一个世纪前已 被本杰明·富兰克林认可。为了克服“令我们困惑的不确定性”,富兰克 林写道: 我的方式是在一张纸的中间画一条线,将其一分为二,一半写上优 势,另一半写劣势。然后在几天的考虑之中,我用不同的方式考虑不同 动机的短期提示,考虑在不同的时间该措施可能带来的利弊。当我把它 们聚集在一个视图时,我努力评估它们各自的权重。我会找到两项看起 来能抵消的因素,然后把它们都划掉.......

2024-03-14

贝叶斯法则-预测未来(不确定性、不全面性)

1969年,J.理查德·戈特三世在普林斯顿攻读天体物理博士学位之 前,他去欧洲旅行了一趟。他看见了柏林墙,那是8年前建成的。站在 墙的影子下,这仿佛是冷战的一个鲜明象征,他开始思索这墙会将东德 和西德地区继续分割多久。 从表面上看,试图做出这种预测有些荒谬。即使撇开地缘政治的不 可预测性不说,这个问题仅在数学上似乎就很可笑:因为它试图从一个 单一数据点进行预测。 但是,尽管这看起来很可笑,但我们总是会根据需要做出这样的预 测。你到了一个外国城市的公共车站,也许其他游客已经站在那里等了 7分钟。下一班车什么时候到?继续等待是否值得?如果是这样的话, 在放弃之前你应该再那等多久? 或者你的一个朋友已经和某人约会了一个月,希望得到你的建议: 邀请他们一起参加即将到来的人的婚礼是否太早?这种关系已经有了一 个良好的开端,但是什么时候开始制订计划比较合适呢?谷歌的研究部主任彼得·诺维德曾进行过一次题为“数据的不合理有 效性”的著名演讲,该演讲深究了“数十亿琐碎的数据点最终如何能被理 解”。媒体不断告诉我们,我们生活在一个“大数据时代”,计算机可以 筛选这数十亿的数据点并发现一些肉眼看不到的细节。

2024-03-14

博弈论-和别人的想法交互

投资者将股票卖给另一个人,一个人相信它会下跌,一个人认为它 会上涨;我想我知道你的想法,但不知道你认为我在想什么;一个经济 泡沫破裂;未来的爱人提供一份礼物,这份礼物既不是表示“我想要做 的不只是朋友”,也不是“我不想超过朋友关系”;一桌食客争论谁应该 请谁以及为什么;有人试图帮忙却无意中有所冒犯;有人努力装酷却引 来旁人窃笑;某人试图从人群中脱出,却失望地发现,人们也都跟着他 出来了。“我爱你”,一个情人对另一个情人说,“我也爱你”,另一个人 回答说,两人都想知道对方到底是想说什么。 计算机科学对此有什么要说的呢? 学生们被教导要把文学情节设想为属于以下几个类别中的一个:人 与自然、人与自己、人与人、人与社会。到目前为止,在本书中,我们 主要考虑了前两类的案例,也就是说,计算机科学一直以来都是我们对 世界基本结构和处理信息的有限能力所产生的问题的指南。最优停止问 题源于时间的不可逆性和不可废止性,从时间有限的供给中探索或利用 困境。松弛和随机性是在解决旅行计划和疫苗等挑战中遇到的不可避免 的复杂性问题的关键和必要策略。

2024-03-14

随机性-何时应用随机?

随机性似乎与理性相反,它是放弃问题的形式,也是最后一招。实 际却远非如此。在计算机科学中,随机性的作用是惊人的且日益重要, 这一点告诉我们,利用机遇可以成为解决最困难问题的一个有效的方 法。事实上,有时没有任何其他方法是有用的。 与标准“确定性”算法不同,我们通常想象的电脑使用,每次都以完 全相同的方式一个步骤紧随另一个之后,而随机算法是使用随机生成的 数字来解决问题。最近,在计算机科学上的研究表明,在某些情况下, 随机算法能够比所有已知的确定性算法更快地生成较难问题的答案。虽 然它们并不能保证每一次都有最优解决方案,但随机算法可以用很少的 时间就得到接近最优化的惊人答案,这都仅仅通过战略性地扔几个硬币 就能确定。 这里有一个深刻的信息是,在某些问题上,随机的方法甚至比最好 的确定性的方法都要优秀。有时候,解决问题的最好办法是依靠运气, 而不是试图完全地分析出答案。 但仅知道随机性有用还不够,你需要知道什么时候该依靠运气,以 什么方式,以及在什么程度上。最近的计算机科学提供了一些答案,尽管故事在几个世纪前就开始了。

2024-03-14

最优停止理论 如何选择停止观望的时机?

最优停止理论 如何选择停止观望的时机? 秘书问题 37%从何而来? 情场上的出手时机 掌握候选对象的完整信息 卖房子的时机 最优停车位置 见好就收的时机 随时准备停止 在所有最优停止问题中,最大的难点不在于选择哪一种可选方案, 而是确定自己需要考虑多少种可选方案。这些问题往往会引发不同的后 果,不仅陷入爱河的人和需要租房的人必须慎重考虑,司机、房主、入 室行窃者等也常常面临同样的抉择。

2024-03-14

Boosting算法(提升法和Gradient Boosting)

Boosting算法是一种集成学习算法,由一系列基本分类器按照不 同的权重组合成为一个强分类器,这些基本分类器之间有依赖关系。 包括Adaboost算法、提升树、GBDT算法。 当Adaboost算法中的基本分类器是cart回归树时,就是提升树, 同时,损失函数变为平方误差损失函数。在Adaboost算法中通过改变 样本的权重来进行每一轮的基本分类器的学习,在提升树算法中,是 通过上一轮学习的残差进行本轮的学习。

2024-03-14

文本挖掘的常用方法及概念

文本挖掘(Text Mining)是抽取有效的、新颖的、有用的、可理 解的、散布在文本文件中的有价值知识,并且利用这些知识更好地组 织信息的过程。 机器学习算法的空间、时间复杂度依赖于输入数据的规模,维度 规约(Dimensionality Reduction)是一种用于降低输入数据维数的 方法。维度规约可以分为两类:  特征选择(Feature Selection),从原始的d维空间中选择 提供信息最多的k维(这k个维属于原始空间的子集)。  特征提取(Feature Extraction),将原始的d维空间映射到 k维空间中(新的k维空间不输入原始空间的子集)。在文本挖掘与文本分类的有关问题中,常采用特征选择方法。原 因是文本的特征一般都是单词(Term),具有语义信息,使用特征选 择找出的k维子集仍然是以单词作为特征,保留了语义信息,而特征提 取则是找k维新空间,将会丧失语义信息。

2024-03-14

Uplift Modeling方法

Uplift Modeling采用随机科学控制,不仅可以衡量事务行为的有 效性,还可以建立预测模型、预测行为的增量响应。它是一种数据挖 掘技术,主要应用于金融服务、电信和零售直销行业,用于追加销 售、交叉销售、客户流失和扣除留置。通常的Propensity Model和Response Model只是给目标用户打了 个分,并没有确保模型的结果可以使得活动的提升最大化,它没有告 诉市场营销人员哪个用户最有可能提升活动响应,因此需要另一个统 计模型来定位那些可以被营销推广活动明显驱动他们偏好响应的用 户,也就是“营销敏感”用户。 Uplift Model的最终目标就是找到最 有可能被营销活动影响的用户,从而提升活动的反响(r(test)- r(control)),提升ROI(投资回收率),提升整体的市场响应率。 下面说明进行Uplift Modeling的方法。

2024-03-14

生存分析知识简介及数个案例分析

生存分析知识简介及数个案例分析 生存分析研究的内容 生存分析对资料的基本要求 生存资料的共同特点 一些相关的基本概念 生存分析的主要方法 生存分析公式模型 生存分析的目的 模拟实验代码实现

2024-03-14

大数据分析工具:Statsmodels与Gensim

大数据分析工具:Statsmodels与Gensim

2024-03-14

大数据分析工具:SciPy

大数据分析工具:SciPy的介绍 第4章 大数据分析工具:SciPy 4.1 SciPy简介 4.2 文件输入和输出:SciPy.io 4.3 特殊函数:SciPy.special 4.4 线性代数操作:SciPy.linalg 4.5 快速傅里叶变换:sipy.fftpack 4.6 优化器:SciPy.optimize 4.7 统计工具:SciPy.stats 4.8 SciPy实例 4.8.1 最小二乘拟合 4.8.2 函数最小值 4.9 本章小结

2024-03-14

异常检测常用的方法及算法

基于统计:基于泊松分布、正态分布找到异常分布点。  基于距离:K-means。  基于密度:KNN、LOF(Local Outlier Factor)、隔离森 林。  一类支持向量机(One-Class SVM)。  隐马尔可夫模型(HMM)。

2024-03-14

蒙特卡罗方法-蒙特·卡罗模拟计算看涨期权实例

蒙特卡罗方法-蒙特·卡罗模拟计算看涨期权实例

2024-03-14

碳排放相关数据-CEADS中国碳核算数据库

碳排放相关数据-CEADS中国碳核算数据库

2024-03-14

十大机器学习算法原理入门简介

十大机器学习算法原理入门简介

2024-03-13

应用统计案例分析报告-银行用户数据分析

应用统计案例分析报告-银行用户数据分析

2024-03-13

计量经济学的某课程论文

计量经济学某课程论文,仅供参考。

2024-03-13

北京大学光华学院组织的数字普惠金融相关数据集

北京大学光华学院组织的数字普惠金融相关数据集,行业权威数据。(之前付费购买的)

2024-03-13

爬虫实操代码,包含如何登录界面、如何自动获取短信验证码并填入、在界面如何获取数据并进行数据处理及写入excel详细操作

由于每天有抄表任务、及将系统网站数据拿出来进行比较以判定生产工作是否正常的需求。故写了这个爬虫代码,在公司内网系统界面自动登录并爬取数据,最后写入excel表格,实现简单的自动化报表功能。

2024-03-13

定时播放音乐及铃声、音乐定时播放器(Python实现)

本程序依赖python运行,通过点击你的腾讯会议的麦克风按钮打开你的麦克风,然后播放音乐,等音乐结束后再点击麦克风按钮关闭你的麦克风。 关于麦克风点击 麦克风通过模拟鼠标的方式进行点击,需要手动更改鼠标点击的位置 关于铃声播放 TimeTable文件是一个文本文件,可以用记事本打开,程序将从中读取定时播放铃声的时间表,按照时间播放铃声。 关于音乐播放 音乐分为15分钟音乐播放和单首音乐播放,音乐播放将从“未放”文件夹抽取一首歌放到“已放”文件夹并播放该歌曲,如果遇到加密格式音乐或者文件属性有问题则放入“异常”文件夹。你只要向“未放”文件夹里面丢歌曲就可以了。 加密格式有:网易云音乐(ncm),QQ音乐(qmc、mflac、mgg),酷狗音乐(kgm),虾米音乐(xm),酷我音乐(kwm)等等。 使用方法: 第一步:修改鼠标点击麦克风按钮的坐标。 第二步:核对/修改时间表。 第三步:运行程序 双击运行“BellPlayer.exe”即程序启动。

2024-03-13

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除