![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
TD_BrainStrom
文章平均质量分 90
Yooooung_Lee
喜欢小仙女
展开
-
以steamDB的好评排名为引 - 详解wilson评分算法
中文互联网上缺少关于二项分布估计的知识,而对二项分布参数如何准确且合理的估计的技巧,实际上在商业数据分析领域用处极多。尤其是在互联网企业,算法排名的依据很大程度要依赖这个统计量。我试图抛砖引玉,以steamDB的评分算法为背景,逐步展开讲解,并试图向你证明,为什么要选择这种方法评估数据。原创 2024-04-30 16:51:04 · 1044 阅读 · 1 评论 -
简单介绍神经网络中不同优化器的数学原理及使用特性【含规律总结】
每种优化器都有其适用的场景,具体的选择需要根据问题的特性和实际实验的结果来决定。原创 2023-09-12 14:56:10 · 498 阅读 · 0 评论 -
人工智能发展前夜,基于控制论的杂谈
《What the Frog's Eye Tells the Frog's Brain?》的个人理解和延申原创 2023-07-18 11:18:21 · 364 阅读 · 0 评论 -
浅谈python语言中的sort()方法和sorted()函数
浅谈python语言中的sort()方法和sorted()函数原创 2023-02-15 16:30:10 · 537 阅读 · 0 评论 -
mysql安装完全排坑指南
mysql入手第一步,安装排坑基本够用指南。原创 2022-08-07 16:13:19 · 1509 阅读 · 0 评论 -
卷积神经网络的实战 - 力战手写mnist数据集
写在前面实战项目全是干货,因此我默认读者掌握了一些神经网络的基本原理,对于过程中的算法推导和一些基本思想我会一笔带过或者以注释的形式体现。希望大家能从这个实战项目上,学习到这类问题的方法和解题思想,按部就班的完成其实这个项目跟下来之后,是可以复用到其他同类型的项目的。LETSGO!仅以此篇,送给海外留学的刘哥,祝勤勉好学,厚积薄发!项目实战运行环境:python3.8.5调包import pandas as pd # pandas数据处理import numpy as np # l原创 2021-11-04 14:23:08 · 834 阅读 · 0 评论 -
统计学中的假设检验思想与参数估计方法python实现(以2010-2014上证指数收益率的均值t检验为例)
书接上回,参数估计是为了用各种方法(靠猜也好,靠科学论证也好),主要任务只有一个,对未知结果的、我们感兴趣的参数进行预测。而预测结果可以是一个值,也可以是一个区间,两种结果分别对应了参数估计的两种方法,点估计和区间估计。假设检验是统计学中“推断统计”双子星中的另一个部分,也是唯二之一。假设检验的着重点在于检验参数的取值是否等于某个目标值。假设检验的过程可以归结为以下三步:设定假设(先根据实际问题的要求提出一个论断,称为原假设或者零假设,用 H0H_0H0 作为代指。又会提出一个与之对立的观点,原创 2021-11-03 11:35:38 · 353 阅读 · 0 评论 -
谈数据治理感想:基于《如何避免数仓模型“烟囱式”建设》博文
原文链接:如何避免数仓模型“烟囱式”建设如果把指标⽐喻成⼀棵树上的果实,那模型就是这棵⼤树的躯⼲,想让果实结得好,必须让树⼲变得粗壮。真实场景举例:⼤多数公司的分析师会结合业务做⼀些数据分析(需要⽤到⼤量的数据),通过报表的⽅式服务于业务部⻔的运营。但是在数据中台构建之前,分析师经常发现⾃⼰没有可以复⽤的数据,不得不使⽤原始数据进⾏清洗、加⼯、计算指标。由于他们⼤多是⾮技术专业出⾝,写的SQL质量⽐较差,甚⾄⻅过5层以上的嵌套。这种SQL对资源消耗⾮常⼤,会造成队列阻塞,影响其他数仓任务,会引起原创 2021-08-17 15:43:03 · 674 阅读 · 0 评论 -
统计学中的参数估计思想与参数估计方法python实现(以2010-2014上证指数收益率的均值区间估计为例)
# 上证指数的参数估计import numpy as npimport pandas as pdfrom scipy import statsfrom matplotlib import pyplot as pltfrom jqdatasdk import *auth('ID','password') # 出于保密目的,这里不填写自己的账号密码了数据获取的方法,有很多的渠道,我这里使用聚宽数据接入所需数据:预备了上证指数SH,深圳指数SZ只是写着玩的,有需要又有兴趣测试的话,可以用下面的原创 2021-06-02 15:37:12 · 804 阅读 · 2 评论 -
初探神经网络(二)单层感知机的Rosenblatt算法原理
本期大量干货,配合线性代数和较扎实的统计知识食用更佳。介绍过了M-P模型,也了解到了M-P模型本质上是对生物上神经元的抽象模型。在上一章,我反复在强调这只是一个生物学的概念,我相信看到这篇文章的人绝大多数并不是生物科技行业的从业人员,爱好数据科学以及以数据科学为业的读者居多。看完了全文除了一些近似抽象化的数学知识,似乎和数据没什么关联。现在的我在学习新知识时,很喜欢结合那些知识总结成册时,当时提出理论的科学家的视角,了解他们是为了解决什么实际需求而进行了相依的研究。我们在课本上往往看到复杂知识点或者概念或原创 2020-07-21 18:17:28 · 2363 阅读 · 0 评论 -
Anaconda python windows环境安装及完全排坑教程
Anaconda是什么?有些新同学希望了解数据科学的内容,通过各方渠道了解到了anaconda这只神兽,但在安装到使用的过程中,往往面临着一个又一个的大坑,所以我趁着重新安装,尽可能的把之前趟过的雷再踩一遍,并且把处理的过程和最后的效果进行记录和展现。仅以此篇,送给我即将读研究生的金融小肥⚪。1.Anaconda3的安装国内网络即可高速下载,anaconda3是相对于其他版本而言的,在百度...原创 2020-07-15 17:42:07 · 7290 阅读 · 1 评论 -
初探神经网络(一)开始于M-P模型
全文内容约4500字,结合理解能力,单遍阅读时间约9分钟。神经网络本质上不是什么新东西。神经网络被归为深度学习的内容之一,其使用和探索从来都不是个新鲜的事儿,包括这么多年的发展和尝试应用,都在不断的对当下算法的局限性进行改进和替代。我本科的专业是应用统计学,从大二开始接触专业课程,第一次听到神经网络,就好像是土生土长的中国人突然从一个国内的香蕉人嘴里听到一句蹩脚英文一样。你心里极度鄙视这种听着唬人的说辞,又得尽力去理解这蹩脚的单词,以防着不要被人用洋文问候了你的家人。你会尝试学习它,学习过程中又会原创 2020-07-15 15:43:42 · 1304 阅读 · 2 评论 -
统计学习方法 - 绪论部分
统计学习方法 - 绪论部分为什么要学习统计学习我们开始吧一份只有一个题目的调查问卷填写问卷的人群能否代表整体意愿呢传统统计大数据时代的统计学为什么要学习统计学习首先,为了知道如何以及何时使用各种分析方法,理解各种分析方法背后的思想很重要。要想掌握更精巧复杂的方法,你必须先理解较简单的方法;其次,当你想准确地评估一种分析方法的效果时,你得知道其运行的多好或者多么不好;第三,这是一个令人兴奋的研究...原创 2019-07-03 22:33:21 · 1753 阅读 · 0 评论