机器学习实战
文章平均质量分 90
从实战入手,系统学习统计学知识。
日常敲代码
这个作者很懒,什么都没留下…
展开
-
五、统计学
统计学:矩估计、极大似然估计统计学习:线性回归、逻辑回归、模型调优原创 2022-04-21 16:29:40 · 1246 阅读 · 0 评论 -
五、逻辑回归
以案例为例,引入逻辑回归分析流程,包括逻辑回归建模、模型评估。原创 2021-12-24 19:14:50 · 1405 阅读 · 0 评论 -
五、线性回归建模及检验★
线性回归在第四章中,已经完成回归分析之线性回归模型构建。接下来是模型诊断。当Y服从正态分布时,模型表现指标会好。如R2R^2R2(精确度)、β(稳定性)。模型要求:精确度R2R^2R2变化不大且稳定性β长期保持在一个水平上。要保持模型精确和稳定,就要进行模型检验,使模型满足假设。多元回归假设:Y的平均值能够准确地被由X组成的线性函数建模出来的。(回归均值)解释变量X和随机扰动项ϵ\epsilonϵ不存在线性关系。(回归公式:Y=βX+ϵY = \beta X+\epsilonY=原创 2021-12-06 19:44:10 · 3933 阅读 · 0 评论 -
四、案例:北京二手房价影响因素分析
作业要求:因变量分析:单位面积房价分析自变量分析:1>自变量自身分布情况2>自变量对因变量影响分析建立房价预测模型1>线性回归模型2>对因变量取对数的线性模型3>考虑交互项的对数线性预测房价步骤一:数据情况import pandas as pd import numpy as npimport mathimport matplotlibimport matplotlib.pyplot as pltimport seaborn as snsi原创 2021-11-29 21:49:40 · 5178 阅读 · 3 评论 -
四、假设检验
假设检验与单样本T检验两样本T检验方差分析(分类变量+连续变量)相关分析(两连续变量关系检验)卡方检验(两分类变量关系)原创 2021-11-28 21:17:21 · 551 阅读 · 0 评论 -
四、回归分析之线性回归模型构建
回归分析线性回归1.线性回归:y=β0+β1x1+ϵ,β0截距,β1斜率y = \beta_0 + \beta_1x_1 +\epsilon , \beta_0截距, \beta_1斜率y=β0+β1x1+ϵ,β0截距,β1斜率2 线性回归的估计残差:点到线的竖直距离残差平方和:L=∑(yi−y^)2=∑(yi−(β0+β1x1))2L = \sum{(y_i - \hat{y})^2} = \sum{(y_i - (\beta_0 + \beta_1x_1))^2}L=∑(y原创 2021-11-28 20:18:41 · 5673 阅读 · 0 评论 -
四、假设检验之参数估计(一)
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar原创 2021-10-23 16:16:10 · 816 阅读 · 0 评论 -
二、数据清洗和整理
数据整合:表的连接数据导入import pandas as pdimport os os.chdir(r"E:\数据与脚本\5Preprocessing")sale=pd.read_csv(r"sale.csv",encoding="gbk") # 有英文,所以改为gbksale连接数据库import sqlite3 # 可以连接大部分数据库con = sqlite3.connect(':memory:') # 数据库连接sale.to_sql('sale', con) #原创 2021-08-27 20:31:57 · 376 阅读 · 0 评论 -
二、描述性统计分析及可视化
目录描述性统计分析概述示例描述统计总结一个分类变量一个连续变量两个分类变量分类变量和连续变量汇总表:两个分类变量+一个连续变量描述性统计分析概述python原始的数据类型:字符型、逻辑型、数值型、复数型。从统计方面来看,数据分为三种类型:名义型、等级型、连续型名义变量:性别、民族等,没有顺序之分,名义变量不一定是字符类型等级变量:有顺序之分,可以是字符也可是数值型,差值没有意义。连续变量:只能是数值型,连续变量的差值是有意义的。注:连续变量可以当作等级变量用,等级变量也可以当成连续变原创 2021-08-27 19:56:54 · 4771 阅读 · 0 评论 -
一、数据科学工具库
数据科学数据-信息-知识—决策和执行原创 2021-08-23 11:06:33 · 196 阅读 · 0 评论