自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 商业智能报表--杜邦分析仪

商业智能报表–杜邦分析仪(财务指标关系图)财务指标必备知识1)背景杜邦分析方法最早由美国杜邦公司使用,故名杜邦分析法。杜邦分析法利用几种主要的财务比率之间的关系来综合地分析企业的财务状况。杜邦分析法是一种用来评价公司盈利能力和股东权益回报水平,从财务角度评价企业绩效的一种经典方法。其基本思想是将企业净资产收益率逐级分解为多项财务比率乘积,这样有助于深入分析比较企业经营业绩。2)杜邦分析法的特点:杜邦模型最显著的特点是将若千个用以评价企业经营效率和财务状况的比率按其内在联系有机地结合起来,形成一

2021-03-15 10:29:20 351

原创 正则化定义和类别

正则化定义和类别什么是正则化: 在解决回归过拟合中,我们选择正则化,但对于其他机器学习算法如分类算法来说也会出现这种问题,数据提供的特征有那些影响模型复杂度或者这个特征的数据点异常比较多,所以算法在学习的时候尽量减少这个特征的影响,就是正则化L2正则化:作用可以使其中一些W的都很小都接近于0,削落某个特征的影响优点:越小的参数水明越简单越简单的模型与不容易产生过拟合RIdge回归:L1正则化作用:可以使的其中的一些W为0,删除这个特征影响。Lasso回归岭回归是在结构风险最小化的正则

2021-03-15 10:08:44 375

原创 欠拟合和过拟合定义和解决办法

欠拟合和过拟合定义和解决办法定义:过拟合:一个假定在训练集数据上能够获得比其他假设更好的拟合,但在测试集上却不能很好的拟合数据,此时认为这个假设出现过拟合的现象(模型过于复杂)欠拟和:假定在训练集上不能获得更好的拟合并且在测试集上也不能很好的拟合数据此时认为这个假设出现欠拟合的现象(模型过于简单)解决办法:欠拟合原因以及解决办法学习到数据的特征过少解决办法1)添加其他特征项,有时候我们模型出现欠拟合的时候是因为特征项不够导致的,可以添加其他特征项来很好地解决。例如,“组合”、“泛化”、“

2021-03-15 09:58:55 689

原创 聚类算法

什么是聚类?介绍一下聚类算法聚类我的理解是就好比喻物以类聚,人以群分,某一种东西或者物体有某种相关联的性质聚在一起,聚类算法可以建立在无特征无标记的数据上一种非监督的学习方法,聚类根据自身的距离,特性,相似度分成诺干组,分划的组内是内部距离最小外部距离最大。kmeans算法的原理kmeans算法接受输入量k,然后将n个对象划分为k个聚类获得的聚类满足:同一聚类中的对象相似度较高,然而聚类中的对象相似度较小,聚类相似度是利用各聚类中的均值所得一个中心对象来进行计算你之前的项目如何使用聚类(kmeans

2021-03-15 09:42:56 104

原创 机器学习算法优缺点总结

机器学习算法优缺点总结:无监督学习算法:聚类算法:K-MeansK-Means中心思想:事先确定常数K,常数K意味着最终的聚类类别数,首先随机选定初始点为质心,并通过计算每一个样本与质心之间的相似度,将样本点归到最相似的类中,接着,重新计算每个类的质心,重复这样的过程,直到质心不再改变,最终就确定了每个样本所属的类别以及每个类的质心。优点:算法原理简单、处理速度较快当聚类是密集的,且类与类之间区别明显时,效果较好缺点:在K-Means算法中,K是事先给定的,比较难确定对孤立点

2021-03-15 09:26:19 704

原创 安装虚拟环境—手把手教学

创建自己的虚拟环境相信很多人学习了很久Python,还不会安装虚拟环境,这里手把手教会你创建自己的虚拟环境,步骤如下:选择一个途径:如:以我的F盘为例新建文件夹并命名。(如:myproject)输入virtualenv .venv创建虚拟环境(.venv中的"."代表创建的是一个隐藏文件)创建完成后打开myproject,出现一个关于.venv的文件夹,表示环境创建成功双击进入.venv 里面的Scripts文件夹输入activate 点击回车激活并进入虚拟

2021-03-06 09:29:26 2536 29

原创 linux基础小知识(git)操作流程

linux基础小知识git在本地操作的流程进入到项目的根目录, 然后使用 git init 命令 初始化整个项目开始开发每一个小功能, 在每一小功能开发完成之后, 需要先提交到 暂存区, 命令git add . : 点 表示 所有 更改的 文件git add a.txt : 只提交 a.txt 文件如果 想把 修改的 文件 从 暂存区 撤销, 那么 可以使用 git status 这个命令 查看 系统给你的提示, 会提示你, 撤销的命令是git reset HEAD a.txt

2021-03-05 17:47:17 205 1

原创 项目协同开发流程步骤

项目协同开发流程步骤适用于公司团队的项目操作:经理在本地 开发 核心的代码经理在 码云 或者 github 创建一个 仓库, 这个仓库 包含 master和develop 分支经理 在本地 创建 并切换 到 develop分支 , 命令 git checkout -b develop经理先把 线上的 develop的文件先 pull 到 自己的 develop分支, 命令 git pull origin develop经理把 自己在 develop 上的核心代码上传到 线上的 develop

2021-03-05 17:37:10 1056

原创 探索性数据分析(EDA)

探索性数据分析(EDA)举例:泰坦尼克仅供展示图用定义:是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法各种杂乱的 “脏数据” ,往往不知所措,不知道从哪里开始了解目前拿到手上的数据时候,探索性数据分析就非常有效。安装3个包:**Pandas_Profiling** ,**Sweetviz**,**pandasGUI**第一:Pandas_Profiling生成了一个快

2021-03-05 16:20:43 817 3

原创 人脸检测之——学习

人脸检测之——学习此代码根据haa特征检测人脸import cv2#检测#识别def detect(img, cascade): #进行人脸的多尺度检测 rects = cascade.detectMultiScale(img, scaleFactor=1.2, minNeighbors=3,flags=cv2.CASCADE_DO_CANNY_PRUNING, minSize=(3, 3)) if len(rects) == 0: return []

2021-03-05 16:05:16 1143 5

原创 linux基础小知识(三)

linux基础小知识(三)用户管理的命令whoami: 查看当前的登录用户useradd: 添加用户格式 useradd 用户名: 会自动在/home目录下面创建一个同名的文件夹,如果用这个用户登录,默认的进入系统的路径就是/home/用户名有一些参数只需要了解-d : 指定一个路径作为 这个用户的 家目录, 一般不会添加这个参数-m: 老版本需要加入这个参数,表示在/home目录下面创建一个同名的家目录. 老版本中如果不加,就不会创建家目录-s: 表示当前用户登录系统

2021-03-04 01:04:01 522 2

原创 linux基础小知识(二)

linux基础(二)1,命令模式常用的一些操作vim的三个模式: 格式vim 文件名命令模式: 使用vim 文件名, 默认进入的就是命令模式. 不能直接去写数据,只能通过命令对文件内容进行增删改查插入模式(编辑模式): 相当于在编辑器中对文件内容进行修改.进入到插入模式的方法由命令模式进入插入模式: 点击 i 键由编辑模式进入插入模式: 先点击 ESC 键 进入 命令模式, 然后点击 i 键进入 插入模式编辑模式(末行模式): 表示当操作完文件之后,需要对

2021-03-04 00:57:45 361 2

原创 用户流失预警项目

用户流失预警项目(一)用到的算法有:随机森林,集成学习梯度提升决策树,决策树,逻辑回归,xgboost五种优化方法:利用网格搜索GridSearchCV()工具优化模型的参数1 字段说明:‘State’: 所在州‘Account Length’: 账号长度‘Area Code’: 区域号码‘Phone’: 电话号码“Int’l Plan”: 是否开通国际套餐‘VMail Plan’: 是否开通语音邮箱‘VMail Message’: 是否开通语音邮箱消息套餐‘Day Mins’

2021-03-04 00:33:41 918 5

原创 Python初学者零碎基础笔记(四)对字符串s排重 相关题目[⾯试题]

[⾯试题]对字符串s排重 相关题目对字符串s排重 但是不影响字符的顺序例:s = 'hello bye 123 see you’方法一:普通做法s = 'hello bye 123 see you's1=(set(s))s2=list(s1)s2.sort(key=s.index)print(''.join(s2))>>>helo by123su方法一:简便做法s = 'hello bye 123 see you'print(''.join(sorted(set(

2020-10-11 16:38:16 2021 6

原创 Python初学者零碎基础笔记(三)全局变量与局部变量,闭包变量的区分用法

全局变量与局部变量,闭包变量的区分先扩展:) 内建作用域:系统的函数和变量,在所有的文件中都可以使用例:print(max(1,2,344,55)) # max属于内建作用域)全局作用域:在一个代码文件中,变量(必须在函数外定义) 从定义开 始到本文件结束)闭包作用域:嵌套函数中,外部函数里 变量从定义开始到函数结束)局部作用域: 在一个函数里,变量从定义开始到函数结束)内建作用域 > 全局作用域 >闭包作用域>局部作用域6 .)

2020-10-11 15:51:51 747 13

原创 mysql数据库初学者简单操作

mysql数据库操作mysql操作步骤:在cmd中链接mysql服务器:mysql -u root -pentry password: 输入密码当进入到mysql服务器中,可以查看有哪些数据库show databases;创建数据库: create database 数据库的名字;进入数据库: use 数据库的名字;查询当前是在哪个数据库: select database();创建表结构-create table 表名( 字段1 字段类型 [约束条件], 字段2 字

2020-10-11 10:10:31 1834 9

原创 Python初学者零碎基础笔记(二)

Python初学者零碎基础笔记字符串内置函数:capitalize():将字符串的第一个字符换成大写name='xiao ming'names=name.capitalize()print(names)>>>Xiao mingtitle():每个单词的首字母换成大写name='xiao ming'names=name.title()print(names)>>>Xiao Mingistitle():判断语句,判断每个单词的首字母

2020-10-09 20:44:51 680 9

原创 Python初学者零碎基础笔记(一)

Python初学者零碎基础笔记一行代码输入多个参数方法1.) a,b,c=map(类型,input(“请输入”).split())#默认空格分隔,若要转其他类型,把类型换成需要的如-----转整型:map(int,input(“请输入”).split())a,b,c=map(int,input("请输入").split())print(a+b+c,type(a),type(b),type(c))>>>请输入1 2 3>>>>6 <cla

2020-10-09 11:48:25 4853 35

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除