自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 Google colab中如何从kaggle中接入数据?

使用google colab或者其他在线jupyter编辑器进行数据分析和探索时,如何从Kaggle引入数据集呢?

2024-03-18 18:38:36 872

原创 【无废话之没啥用的小技巧】让SQL代码变得优美的三个小操作

TM_DPST_BAL DECIMAL(18,4) -- 定期存款余额,TM_DPST_BAL_SUB_D DECIMAL(18,4) -- 定期存款余额日增量,TM_DPST_BAL_SUB_M DECIMAL(18,4) -- 定期存款余额月增量,TM_DPST_BAL_SUB_Y DECIMAL(18,4) -- 定期存款余额年增量,STRU_CHREM_BAL DECIMAL(18,4) -- 结构性存款余额。

2024-01-29 09:57:24 393 1

原创 花西子体吐槽国产数据服务

数据库越来越慢了,哪里慢了?这么多年都是这个速度好吧?不要睁着眼睛乱说,国货品牌很难的!而且南大通用gaussDB李鬼IDE真的不是那种随便套个皮就做的软件。我用这些用了多少年?他怎么起来我是最知道的,他们就差点把国外的软件原封不动给我用了!真的乱说,这么多年跑个脚本都是10分钟起步,哪里慢了?写个脚本保存个模板缓存里还有备份,很安全的。有时候找找自己的原因好吧,这么多年了技术进没进步,有没有认真工作,好不?这么多年都是这个样子,我真的快疯掉啦…

2023-11-02 09:44:05 91

原创 简单介绍神经网络中不同优化器的数学原理及使用特性【含规律总结】

每种优化器都有其适用的场景,具体的选择需要根据问题的特性和实际实验的结果来决定。

2023-09-12 14:56:10 403

原创 【简单bat】写一个定时关机的批处理程序

感谢我那可爱的GPT助手对代码的优化工作。

2023-08-28 15:14:56 1792 2

原创 【无废话解决bug】python dash库 127.0.0.1 拒绝了我们的连接请求

无废话解决bug “127.0.0.1 拒绝了我们的连接请求--访问本地IP时显示拒绝访问”

2023-07-26 15:56:29 1613

原创 人工智能发展前夜,基于控制论的杂谈

《What the Frog's Eye Tells the Frog's Brain?》的个人理解和延申

2023-07-18 11:18:21 298

原创 应用python的docx模块解析word文件内容

我们初始拿到的是各单位发回的问卷合计约70份,并由不同小组归类整理成不同的分组文件夹。我们要读取全部的文件内容,并将其中各个题目下填写的结果提取出来,最后把数据以结构化的形式整理出来。

2023-05-15 16:15:25 1361

原创 浅谈python语言中的sort()方法和sorted()函数

浅谈python语言中的sort()方法和sorted()函数

2023-02-15 16:30:10 517

原创 mysql安装完全排坑指南

mysql入手第一步,安装排坑基本够用指南。

2022-08-07 16:13:19 1448

原创 卷积神经网络的实战 - 力战手写mnist数据集

写在前面实战项目全是干货,因此我默认读者掌握了一些神经网络的基本原理,对于过程中的算法推导和一些基本思想我会一笔带过或者以注释的形式体现。希望大家能从这个实战项目上,学习到这类问题的方法和解题思想,按部就班的完成其实这个项目跟下来之后,是可以复用到其他同类型的项目的。LETSGO!仅以此篇,送给海外留学的刘哥,祝勤勉好学,厚积薄发!项目实战运行环境:python3.8.5调包import pandas as pd # pandas数据处理import numpy as np # l

2021-11-04 14:23:08 815

原创 统计学中的假设检验思想与参数估计方法python实现(以2010-2014上证指数收益率的均值t检验为例)

书接上回,参数估计是为了用各种方法(靠猜也好,靠科学论证也好),主要任务只有一个,对未知结果的、我们感兴趣的参数进行预测。而预测结果可以是一个值,也可以是一个区间,两种结果分别对应了参数估计的两种方法,点估计和区间估计。假设检验是统计学中“推断统计”双子星中的另一个部分,也是唯二之一。假设检验的着重点在于检验参数的取值是否等于某个目标值。假设检验的过程可以归结为以下三步:设定假设(先根据实际问题的要求提出一个论断,称为原假设或者零假设,用 H0H_0H0​ 作为代指。又会提出一个与之对立的观点,

2021-11-03 11:35:38 323

原创 谈数据治理感想:基于《如何避免数仓模型“烟囱式”建设》博文

原文链接:如何避免数仓模型“烟囱式”建设如果把指标⽐喻成⼀棵树上的果实,那模型就是这棵⼤树的躯⼲,想让果实结得好,必须让树⼲变得粗壮。真实场景举例:⼤多数公司的分析师会结合业务做⼀些数据分析(需要⽤到⼤量的数据),通过报表的⽅式服务于业务部⻔的运营。但是在数据中台构建之前,分析师经常发现⾃⼰没有可以复⽤的数据,不得不使⽤原始数据进⾏清洗、加⼯、计算指标。由于他们⼤多是⾮技术专业出⾝,写的SQL质量⽐较差,甚⾄⻅过5层以上的嵌套。这种SQL对资源消耗⾮常⼤,会造成队列阻塞,影响其他数仓任务,会引起

2021-08-17 15:43:03 593

原创 统计学中的参数估计思想与参数估计方法python实现(以2010-2014上证指数收益率的均值区间估计为例)

# 上证指数的参数估计import numpy as npimport pandas as pdfrom scipy import statsfrom matplotlib import pyplot as pltfrom jqdatasdk import *auth('ID','password') # 出于保密目的,这里不填写自己的账号密码了数据获取的方法,有很多的渠道,我这里使用聚宽数据接入所需数据:预备了上证指数SH,深圳指数SZ只是写着玩的,有需要又有兴趣测试的话,可以用下面的

2021-06-02 15:37:12 744 2

原创 初探神经网络(二)单层感知机的Rosenblatt算法原理

本期大量干货,配合线性代数和较扎实的统计知识食用更佳。介绍过了M-P模型,也了解到了M-P模型本质上是对生物上神经元的抽象模型。在上一章,我反复在强调这只是一个生物学的概念,我相信看到这篇文章的人绝大多数并不是生物科技行业的从业人员,爱好数据科学以及以数据科学为业的读者居多。看完了全文除了一些近似抽象化的数学知识,似乎和数据没什么关联。现在的我在学习新知识时,很喜欢结合那些知识总结成册时,当时提出理论的科学家的视角,了解他们是为了解决什么实际需求而进行了相依的研究。我们在课本上往往看到复杂知识点或者概念或

2020-07-21 18:17:28 2122

原创 Anaconda python windows环境安装及完全排坑教程

Anaconda是什么?有些新同学希望了解数据科学的内容,通过各方渠道了解到了anaconda这只神兽,但在安装到使用的过程中,往往面临着一个又一个的大坑,所以我趁着重新安装,尽可能的把之前趟过的雷再踩一遍,并且把处理的过程和最后的效果进行记录和展现。仅以此篇,送给我即将读研究生的金融小肥⚪。1.Anaconda3的安装国内网络即可高速下载,anaconda3是相对于其他版本而言的,在百度...

2020-07-15 17:42:07 7109 1

原创 初探神经网络(一)开始于M-P模型

​全文内容约4500字,结合理解能力,单遍阅读时间约9分钟。神经网络本质上不是什么新东西。神经网络被归为深度学习的内容之一,其使用和探索从来都不是个新鲜的事儿,包括这么多年的发展和尝试应用,都在不断的对当下算法的局限性进行改进和替代。我本科的专业是应用统计学,从大二开始接触专业课程,第一次听到神经网络,就好像是土生土长的中国人突然从一个国内的香蕉人嘴里听到一句蹩脚英文一样。你心里极度鄙视这种听着唬人的说辞,又得尽力去理解这蹩脚的单词,以防着不要被人用洋文问候了你的家人。你会尝试学习它,学习过程中又会

2020-07-15 15:43:42 1274 2

原创 统计学习方法 - 绪论部分

统计学习方法 - 绪论部分为什么要学习统计学习我们开始吧一份只有一个题目的调查问卷填写问卷的人群能否代表整体意愿呢传统统计大数据时代的统计学为什么要学习统计学习首先,为了知道如何以及何时使用各种分析方法,理解各种分析方法背后的思想很重要。要想掌握更精巧复杂的方法,你必须先理解较简单的方法;其次,当你想准确地评估一种分析方法的效果时,你得知道其运行的多好或者多么不好;第三,这是一个令人兴奋的研究...

2019-07-03 22:33:21 1564

原创 Rstudio MarkDown使用教程

认识MarkDownMarkDown是一种轻量级的【标记语言】,它的优点很多,目前也被越来越多的写作爱好者,撰稿者广泛使用。,Markdown 的语法十分简单。常用的标记符号也不超过十个,对于大学里掌握了多门语言的我们来说,这种不需要思维,仅仅是对需要不同格式的文本前添加一些符号,简直是小case好吗?学习成本也不需要太多,且一旦熟悉这种语法规则,会有一劳永逸的效果。点击查看MarkDow

2018-05-31 10:10:36 88863 11

原创 大学生就业问题的统计研究

最近在写学年论文,哈哈,这个文章被导师修改,觉得有些不妥就基本算是胎死腹中了。但是毕竟是自己的blog,在这里写写感觉也无所谓的哈。但是秉承着对自己博客,对希望学习统计的大伙儿负责的态度。我可以保证研究过程中的思路是无误的。可能研究方法比较单纯,这篇文章的学术性不强,但是希望大家能从这篇文章中学会利用多方法进行数据分析。文章中的内容包括了许多统计学,计量经济学的思想,应用了SPSS,R,EView...

2018-05-21 18:17:42 7153 3

转载 R中的几种统计分布及常用模型 (整理)

搜集自Little_Rookie博客园,以下部分格式和内容有所修正和补充,欢迎转载~李阳  15应用统计学 内蒙古财经大学统计学上分布有很多,在R中基本都有描述。因能力有限,我们就挑选几个常用的、比较重要的简单介绍一下每种分布的定义,公式,以及在R中的展示。统计分布每一种分布有四个函数:d――density(密度函数),p――分布函数,q――分位数函数,r――随机数函数

2017-09-17 13:58:29 16461 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除