自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 收藏
  • 关注

原创 python中文编码(汉字乱码问题解决方案)

Python脚本对英语字母是非常友好的,但对中文就不是了。我们用 Python 输出 "Hello, how are you!",英文没有问题,但是如果你输出中文字符 "你好!" 就有可能会碰到中文编码问题。Python中默认的编码格式是 ASCII 格式,在没修改编码格式时无法正确输出汉字,所以在读取中文时会报错。解决方法为只要在文件开头加入 # -*- coding: UTF-8 -*- 或者 # coding=utf-8 就行了。中文乱码问题在python老版本上比较突出。解决中文乱码问题最简

2021-03-26 15:24:12 993

原创 Anaconda下载和安装指南(超全)

Anaconda指的是一个Python集成开发软件,号称有两千万用户。Anaconda基于云的存储库,可查找并安装超过7,500个数据科学和机器学习模块。Anaconda官网:https://www.anaconda.com/Anaconda使用conda-install命令,您可以开始使用数千个开源模块。因为包含了大量的科学包,Anaconda 的下载文件比较大500 MB左右。不同版本Anaconda大小不一样。如果只需要某些包,或者需要节省带宽或存储空间,也可以使用Miniconda这个较

2021-03-26 15:19:23 2091 1

原创 python官网下载和安装指南

Python可应用于多平台包括windows, Linux 和 Mac OS X。Python最新源码,二进制文档,相关新闻资讯等可以在Python的官网查看到。Python官网链接:https://www.python.org/。(python官网)你可以在此链接下载python软件https://www.python.org/downloads/。目前针对windows系统的最新版为python3.8版本。假设我们用的Windows操作系统,点击Download python 3

2021-03-26 15:16:28 3558 1

原创 中心极限定理_达尔文的进化论正确吗?

一、进化论(Charles Darwin in 1868) 查尔斯·罗伯特·达尔文,英国生物学家,其“进化论”被列为19世纪自然科学的三大发现之一(其他两个是细胞学说、能量守恒转化定律),对人类有杰出的贡献。自然选择理论认为所有生物可能来自初始的一个鼻祖,通过环境隔离变化,衍生出万物。all life had its origin from one simple source,progressing to its highest form---man---自然选择(英语.

2021-03-26 15:13:20 178

原创 T分布在医药领域应用

学生t-分布可简称为t分布。其推导由威廉·戈塞于1908年首先发表,当时他还在都柏林的健力士酿酒厂工作。因为不能以他本人的名义发表,所以论文使用了学生(Student)这一笔名。之后t检验以及相关理论经由罗纳德·费雪的工作发扬光大,而正是他将此分布称为学生分布。要理解此文章,需要理解正太分布的基础知识,否则不能看懂。根据大数定理,样本越多,样本估算参数就越接近总体参数。但实际生活中,因为时间和费用,我们一般用小样本数据代替整体数据。T分布的特征|:T分布属性1:曲线下面总面积为1T分布属..

2021-03-25 18:54:55 1420 1

原创 Python教你找到最心仪的对象

规则单身妹妹到了适婚年龄,要选对象。候选男子100名,都是单身妹妹没有见过的。百人以随机顺序,从单身妹妹面前逐一经过。每当一位男子在单身妹妹面前经过时,单身妹妹要么选他为配偶,要么不选。如果选他,其余那些还没有登场的男子就都遣散回家,选配偶的活动也 over 了。如果不选,当下这名男子就离开,也就是 pass 掉此人,下一人登场。被pass 掉的,单身妹妹不可以反悔再从选。规则是,单身妹妹必须在这百人中选出一人做配偶,也就是说,如果前99人单身妹妹都看不中的话,她必须选择第100名男子为配偶,不管他..

2021-03-25 18:52:45 130

原创 Python basemap模拟导弹发射

今天Toby教你如何用python的basemap包模拟导弹发射在数据可视化过程中,我们常常需要将数据根据其采集的地理位置在地图上显示出来。比如说我们会想要在地图上画出城市,飞机的航线,乃至于军事基地等等。通常来说,一个地理信息系统都会带有这样的功能。今天我们讨论如何在Python上实现,并且使用免费的工具包。matplotlib是Python常用的数据绘制包。它基于numpy的数组运算功能。matplotlib绘图功能强大,可以轻易的画出各种统计图形,比如散点图,条行图,饼图等。matplotli

2021-03-25 18:51:05 799 1

原创 感悟:决定一个系统走势是多因素构成,而非单一因素决定

例如癌症,医生常说抽烟致癌,不要抽烟,但实际生活中抽烟长寿的人不少,我的姨婆九十多岁了,每日抽烟喝酒,身体也不错。决定癌症的因素很多,例如遗传,饮食,起居时间,居住环境,化工污染等等。下图转自一份医学研究,说明没有任何食物百分之百致癌或抑制癌症。什么人容易患癌症?当诸多不利因素累积,超过一定量后,患癌症概率大。我们假设一个数据挖掘的分类器cancer,分类器由六个因素组成,当六个因素得分总和超过3时为癌症,得分总和小于3时为非癌症。1表示是,0表示否。 抽烟=1分,非均衡饮食=1分,喝酒=1分,

2021-03-25 18:48:41 80

原创 孟德尔自由组合定理--计算机模拟

孟德尔(Gregor Johann Mendel)阿基米德会思考如何用这粒豌豆做支点来翘起地球;英国人希望次日醒来能顺着它的茎爬上天空;而游戏玩家们则会把豌豆种在家门口阻挡一大波僵尸的进攻……大约150多年前,有一名修道士却将它玩出了风格,玩出了水平,一不小心就奠定了现代生物学的三大基石之一。孟德尔(Gregor Johann Mendel)他就是“现代遗传学之父”——格雷戈尔·约翰·孟德尔。孟德尔在揭示了由一对遗传因子(或一对等位基因)控制的一对相对性状杂交的遗传规律——分离.

2021-03-25 18:46:35 1312 1

原创 孟德尔分离定律建模

孟德尔(Gregor Johann Mendel)阿基米德会思考如何用这粒豌豆做支点来翘起地球;英国人希望次日醒来能顺着它的茎爬上天空;而游戏玩家们则会把豌豆种在家门口阻挡一大波僵尸的进攻……大约150多年前,有一名修道士却将它玩出了风格,玩出了水平,一不小心就奠定了现代生物学的三大基石之一。孟德尔(Gregor Johann Mendel)他就是“现代遗传学之父”——格雷戈尔·约翰·孟德尔。孟德尔在揭示了由一对遗传因子(或一对等位基因)控制的一对相对性状杂交的遗传规律——分离.

2021-03-25 18:45:12 637

原创 药品质量不合格统计机器人

目录:1.2016年药品质量不合格数据年度分析报告(上)2.2016年药品质量不合格数据年度分析报告(下)3.药品质量不合格统计机器人2016年药品质量不合格数据年度分析报告(上)目录:1.药品质量不合格介绍2.药品质量不合格企业Top203.质量不合格药品品种Top204.药品质量检测不合格项目Top105.质量不合格药品省份分布6.假冒药品分析7.总结1.药品质量不合格介绍政府为了保障公众用药安全,根据法律法规和各省药品抽验计划,各省(市)药品监管

2021-03-25 18:43:37 248

原创 获取天气预报API_统计最容易生病时间段

中医说感冒可分为风热感冒、风寒感冒和暑湿感冒。感冒是因为受寒。这有科学依据或临床试验依据吗?美国科学家富兰克林年轻时就患有严重的呼吸系统疾病。对,就是这个喜欢玩电,差点被电击的疯狂人士。添加图片注释,不超过 140 字(可选)因此,他对普通感冒及其成因非常感兴趣。他通过亲自去寒冷地方试验。驳斥了普遍的观念,即温度变化(尤其是暴露于冷空气中)使人们易于感冒。他认为不流通空气容易含有超标致病微生物,这容易导致呼吸系统疾病。另外他认为温差变化过大,导致人体免疫系统不稳定,容易被体内条件致病微.

2021-03-25 18:41:15 151

原创 乡村医生需要什么,看这张图就够了!

乡村医生需要什么,看这张图就够了!笔者最近在XX市人民政府公开信箱中看到了一位赤脚医生写给政府的公开信,因读后无比感动,索性就摘录了出来:来信内容:我们是70-80年代的赤脚医生,是计划生育的执行人,老百胜口中计划生育的铁杆,走区过县,追拉大肚子,努力限制人口猛增,坚决执行党的计划生育政策,是卫生防疫的尖兵,打育苗 、发糖丸 、打狂犬、 发鼠药到社到户到人,熬大锅汤防止传染病流行等等。我们没有收取任何报酬,为村民防病治病,医猪、 医牛,用的是我们自己栽种和翻山越岭爬坡上坎采来的中草药,无

2021-03-25 18:38:26 104

原创 数学建模_混合赌博模型

赌博和炒股一样,需要学习相关算法。证券交易所和赌场同样都收取交易费,你每一次交易无论输赢,都会被抽层。这就陷入一个别人设计好的大数定理模型,玩的次数越多,你输得概率越大。如何破解证券交易所和赌场设计好的大数定理圈套,需要学习相关算法,让自己输赢不是靠运气5:5开。下面先介绍一部电影《决胜21点》。《决胜21点》讲述了几位数学天才少年凭才智大闹赌城拉斯维加斯的故事。举世闻名的麻省理工,堪称是莘莘学子、科学天才们向往的圣地。作为有幸能到这里读书的新生,本·坎贝尔(吉姆·斯特吉斯饰)自然也有他的.

2021-03-25 11:57:21 1078

原创 PDF文本内容批量提取到Excel

作用:pdf内容批量提取到excel各位亲朋好友,我才上班时候有个鼓噪乏味工作,就是把一个个PDF内容复制粘贴到Excel表格里面,方便以后数据库全文搜索。举个例子,此Excel有两个字段A列是pdf文件名B列用于存放pdf提取的内容当所有PDF内容复制到Excel后,数据库就可以实现全文搜索功能。几十上百个PDF复制粘贴工作也许一天就搞定了,但成千上万个PDF,你是不是要抓狂?为此,我专门用Python开发了PDF批量提取机器人,名字叫pdf_data_extract3

2021-03-23 19:04:05 1982 1

原创 python math数学模块

数学模块math概述math模块包含常见数学函数,但这些函数不能与复数一起使用。 如果需要支持复数,请使用cmath模块中的同名函数。1.math模块基础语法math模块包含平方数,阶乘,正弦,反正弦,余弦,反余弦,指数,对数,正切,反正切的函数,可以处理向量等计算,包含无理数Π,e。下图中就是math模块包含内容。['__doc__', '__loader__', '__name__', '__package__', '__spec__', 'acos', 'acosh', 'asin',

2021-03-23 18:45:19 400

原创 样本标准差分母为何是n-1

大家好,今天给大家介绍标准差。标准差在统计领域是一个重要概念,有些地方晦涩难懂,特别是样本标准差的分母为何是n-1,而不是n或n-2,接下来我会一一介绍并用计算机模拟难点。什么是标准差?下面看两组数[28,29,30,31,32],[10,20,30,40,50],它们的平均数都是30。这两组数是一致的吗?实际上,这两组数离散程度有很大区别。用numpy模块计算,两组数的标准差相差10倍方差是实际值与期望值之差平方的平均值。方差,通俗点讲,就是和中心偏离的程度!用来衡量一批数据的波动

2021-03-23 18:41:15 1803 1

原创 方差分析(python代码实现,超全)

来源英国统计家Fisher为解释实验数据而首先引入方差分析VS t检验方差分析的H0:所有样本的平均数相等,如果H1成了,我们只知道他们(样本平均数)不一样The null hypothesis in a one-way ANOVA is that the means of all the samples arethe same. So if a one-way ANOVA yields a significant result, we only know thatthey are no

2021-03-23 08:39:30 9941 3

原创 KS(Kolmogorov–Smirnov)模型区分能力指标

KS检验将KS检验应用于信用评级模型主要是为了验证模型对违约对象的区分能力,通常是在模型预测全体样本的信用评分后,将全体样本按违约与非违约分为两部分,然后用KS统计量来检验这两组样本信用评分的分布是否有显著差异。两条曲线算的是累计概率计算各阶段的差值最后算差值的最大值KS检验也常用来选择有预测能力的单变量。就是通过某个单变量把样本分成两组,看这两组的样本有关KS指标的大小来决定此变量的预测能力。模型应该要能区别出违约户和正常户之间的差异,违约户的评级分配应当不同于正常户.

2021-03-20 19:19:16 2593 3

原创 天使和恶魔差异只在一念之间

大家好我是持牌照消费金融模型专家,曾任职国内最大医药数据中心数据,和重庆儿科医院,中科院教授保持慢病数据挖掘项目合作!管理过欧美日中印巴西等国外药典数据库,马丁代尔数据库,FDA溶解度数据库,临床试验数据库,WHO药物预警等几十个数据库。今天想聊聊一下医疗问题。首先,我遇到过很多非常专业,充满善意医生,他们给与我和家人很多帮助。他们是医疗体制善意和正能量的中流砥柱。例如钟南山,张文宏临危受命,拯救中国和其他多国人民于疾病之中,乃国之重器。当然还有很多默默奉献,不被人知医生保卫着我们安全,我期待更多类似钟

2021-03-20 19:11:11 123

原创 biopython1_序列操作

目录:1.DNA---RNA---protein互相转换# -*- coding: utf-8 -*- 原创公众号pythonEducation'''实际的生物学上的转录过程是将模板链反向互补(TCAG → CUGA)生成mRNA。但是,在Biopython和生物信息学领域,我们通常会直接利用编码链,因为我们可以通过 T → U的转换获得mRNA。 '''from Bio.Seq import Seqfrom Bio.Alphabet import IUPACfrom

2021-03-20 19:05:12 240 3

原创 次氯酸:利用先天反应

概述:人类病原体正在对上个世纪开发的抗生素产生抗药性,而即使采用最佳实践疗法,过去通常由常规抗生素处理的常见感染现在也可能致命。解决病原体发展风险的一种方法是在病原体成为威胁生命的感染之前使用区域和伤口去污和消毒技术攻击病原体。然而,当前的消毒方法可有助于产生抗药性,证明对组织有毒并破坏环境。我们在这里回顾一种基于次氯酸(HOCl)的新兴技术,重点是新颖,稳定的形式(Brio HOCL TM)可灭活病毒,细菌,内生孢子和真菌,对人体组织安全,对环境无害,不需要处理有毒废物或有害物质,并且能够降低capa

2021-03-20 18:59:31 283

原创 信用评分卡模型解决方案

为合作伙伴建立自定义的信用评分步骤1:数据准备步骤2:建模步骤3:模型评估步骤4:模型部署潜在客户得分的潜在客户评分介绍感谢您抽出宝贵的时间来考虑我们的信用评分和潜在客户评分解决方案。信用评分通过帮助扩大信用市场准入,降低信用价格以及减少拖欠和违约,在经济增长中发挥着至关重要的作用。对于低收入阶层,银行是找不到正确角度的银行。 据估计,全世界大约有17亿成年人没有银行账户。 这就是数据可以发挥主要作用的地方。 替代性信用评分和预测模型是评估未银行账户信用价值的方法。而且,.

2021-03-20 18:51:20 1741 5

原创 巴菲特指数表明美国股市被严重高估

21世纪有三大泡沫:美股,中方,日债。今天我们聊聊美股泡沫。巴菲特指标概述巴菲特指标是美国股票市场总估值与GDP的比率。截至2021年3月4日,我们计算的巴菲特指标为:美国市场总值:$ 47.1T当前季度年度GDP(估计):$ 21.9T巴菲特指标: 47.1T÷21.9T = 215%根据我们的计算,当前的价格比历史平均水平高出73%(或约2.4个标准差),这表明该市场被严重高估了。这些是历史最高水平。但是,由于利率处于历史低位,因此有理由怀疑“这次不同了”可能成立。巴菲特指标

2021-03-20 18:42:48 576

原创 利率模型暗示美国股市是合理价值(仅做参考)

概述美国利率目前接近历史最低点。从广义上讲,这表明对债务产品(例如债券)的投资所获得的回报很少,因此对投资者的要求不高。投资者现在除了将现金投入股票外,与现金几乎没有关系,这推动了股市的上涨。截至2021年3月5日,我们观察到相对于正常利率环境,美国股票市场价值合理。以下是我们的综合图表,显示了S&P500相对于其平均头寸的头寸,并根据平均利率进行了调整。阅读以下详细信息,以了解此模型的输入和限制。理论与数据股市和利率倾向于相互逆向移动有两个核心原因。降低利润。随着市场利率的上升,

2021-03-20 18:40:35 208

原创 洛伦兹曲线(Lorenz curve)-揭秘贫富差异原因

洛伦兹曲线(Lorenz curve)也叫提升图或收益曲线。定义:洛伦兹曲线是一种显示经济体内收入(或财富)分布的方式。在经济学中,洛伦兹曲线是收入或财富分配的图形表示。它是由开发马克斯·劳伦茨在1905年代表不平等的的财富分配。 洛伦兹曲线显示了人口不同部分的收入累计份额。 如果存在完全平等的条件(如果每个人的工资都相同),那么最贫困的20%人口将获得总收入的20%。60%的最贫穷人口将获得60%的收入。曲线是一个图表,显示了最低收入人群x所占的总收入或财富比例,尽管对于有限的人口并不严格如此(

2021-03-20 18:37:17 9282 2

原创 标准误(Standard Error)

1.标准误概念标准误是数据统计的重点概念,且难以理解。百度上文章缺乏详细描述的文章。所以写下此文让读者能够彻彻底底了解标准误概念。标准误全称:样本均值的标准误(Standard Error for the Sample Mean),顾名思义,标准误是用于衡量样本均值和总体均值的差距。2.标准误意义:用于衡量样本均值和总体均值的差距有多大?标准误越小----样本均值和总体均值差距越小标准误越大----样本均值和总体均值差距越大标准误用于预测样本数据准确性 ,标准误越小,样本均值和总

2021-03-20 18:32:48 8678

原创 风控中英文术语手册(银行_消费金融信贷业务)_v3

金融风控术语字典(中英文对照)1、风控系统部分1.Blazeblaze是FICO公司产品,用于规则管理,是模型ABC卡开发的前身。信贷公司开始放贷时,数据量少,申请用户少,难以建立模型。因此前期一般会用到专家经验判断好坏客户,然后通过风控决策管理系统进行高效作业,其中blaze就是一款应用多年,效率较高风控决策管理系统。但blaze属于商业产品,一般多应用于大银行,捷信等大型消费金融公司,收费可高于100万RMB每年,如果需要更多定制业务,收费更高。1.1 A card释义:Applica

2021-03-20 10:18:10 3563 2

原创 企业信用评分卡模型实战(python,附代码)

企业信用评级在全球金融领域有广泛应用。它涉及到公司管理,企业债发行,企业融资,企业上市,企业并购,个人炒股和购买公司债券等多个场景。企业债发行企业主体信用评级越高,意味着该企业抗风险能力、盈利能力越强,发债融资成本越低。作为企业董事会,管理者,决策者应该了解企业主要财务指标,了解自身企业评级。企业发债时都需要评级。国内评级这块主要分为AAA、AA+、AA、AA-、A+。企业评级过低会限制某些工具的发行额度、交易场所可质押性等等如果是评级太低,企业发行债券没人买。目前广大投资者的投资门槛是AA。企业上市

2021-03-05 18:03:26 8315 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除