数据科学
sabcasjkd
是只小猴子
展开
-
Pandas常用操作整理
【代码】Pandas常用操作整理。原创 2023-08-24 17:24:32 · 168 阅读 · 0 评论 -
[机器学习-笔记07] 支持向量机
1. 原理 直觉解释:SVM需要尝试找到满足红点和绿点分别到边界线的最小距离的最大值的那条边界。 2. Python案例实现 2.1 数据 案例中使用的数据结构如下(只展示了部分样本): 2.2 实现 代码部分与[机器学习-笔记06]逻辑回归的案例代码部分类似,主要在模型拟合那部分有所改动,因此相似的代码就省略了。 from sklearn.svm import SVC # 拟合模型 classifier = SVC(kernel = 'linear', random_state = 0) class原创 2021-04-19 15:22:27 · 145 阅读 · 0 评论 -
[机器学习-笔记06]逻辑回归
1.原理 假设函数 Sigmoid函数图像: 决策界限 代价函数 整合后的代价函数: 2. Python案例实现 2.1 数据 数据格式如下(只展示了部分样本): 2.2 实现原创 2021-04-19 14:41:56 · 250 阅读 · 0 评论 -
[机器学习-笔记05] 回归模型表现评估
1. R2 剩余平方和 共平方和 R2 2. 广义R2 随着新自变量的加入R2不会下降 [注1] 特征过多会造成模型过拟合。 广义R2 随着自变量个数的升高,Adj R^2会受到惩罚。原创 2021-04-18 20:44:43 · 164 阅读 · 0 评论 -
[数据可视化-笔记05] Python&Leather多图Grid
实现 data1 = [(1, 3),(2, 5),(3, 3),(5, 2)] data2 = [(3, 4),(5, 6),(7, 10),(8, 2)] chart1 = leather.Chart('Dots') chart1.add_dots(data1, fill_color="blue") chart2 = leather.Chart('Lines') chart2.add_line(data2, stroke_color="red") grid = leather.Grid() g.原创 2021-04-18 19:16:59 · 76 阅读 · 0 评论 -
[数据可视化-笔记04] Python&Leather画柱状图
API如下: add_columns(data, x=None, y=None, name=None, fill_color=None) 实现: import leather # 数据 data1 = [['A',2],['B',3],['C',1],['D',4],['E',5],['F',2]] # 可视化 chart = leather.Chart("My Column Chart") chart.add_columns(data1, fill_color="red") chart.add_y原创 2021-04-18 19:03:51 · 93 阅读 · 0 评论 -
[数据可视化-笔记03] Python&Leather画条形图
API如下: add_bars(data, x=None, y=None, name=None, fill_color=None) 实现: import leather # 数据 data1 = [[2,'A'],[3,'B'],[1,'C'],[4,'D']] # 可视化 chart = leather.Chart("My Bar Chart") chart.add_bars(data1, fill_color="blue") chart.add_x_scale(0,5) # 显示图像 chart原创 2021-04-18 18:59:02 · 97 阅读 · 0 评论 -
[机器学习-笔记04] 多项式回归
1. 原理 多项式回归方程: 应用情境: 2. Python案例实现 2.1 数据 共10条数据,如下: 2.2 实现 import numpy as np import pandas as pd from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression from sklearn.preprocessing import PolynomialFeatu原创 2021-04-18 18:36:35 · 115 阅读 · 0 评论 -
[机器学习-笔记03] 多元线性回归
1. 多元线性回归原理 多元线性回归的方程如下: 使用多元线性回归时需满足的假设: 线性、同方差性、多元正态分布、误差独立、无多重共线性 虚拟变量: 可以看下这篇对虚拟变量的直观介绍:什么是虚拟变量?怎么设置才正确? 虚拟变量陷阱: 所谓的“虚拟变量陷阱”就是当一个定性变量含有m个类别时,模型引入m个虚拟变量,造成了虚拟变量之间产生完全多重共线性,无法估计回归参数。 下图例子中若同时加入New York和California的虚拟变量则会使得D2=1-D1成立,从而造成多重共线性,掉入虚拟变量陷进。 因原创 2021-04-18 17:54:31 · 414 阅读 · 0 评论 -
[数据可视化-笔记02] Python&Leather画折线图
API如下: add_line(data, x=None, y=None, name=None, stroke_color=None, width=None) 实现: import leather # 数据 data1 = [[1.5,2],[2,3.5],[3,2.5],[4,4.8],[5,1.2]] data2 = [[1.5,2],[2.3,4],[3,3],[4,2.3],[5,0.9]] # 可视化 chart = leather.Chart("My Line Chart") chart原创 2021-04-17 20:42:56 · 100 阅读 · 0 评论 -
[数据可视化-笔记01] Python&Leather画点图
API如下: add_dots(data, x=None, y=None, name=None, fill_color=None, radius=None) 实现: import leather # 数据 data1 = [[1.5,2],[2,3.5],[1.8,2.5],[3.3,4.8],[0.9,1.2]] data2 = [[2.6,2],[2.4,1.3],[4.8,2.5],[1.1,2.3],[4.8,0.9]] # 可视化 chart = leather.Chart("My Cha原创 2021-04-17 20:28:40 · 151 阅读 · 0 评论 -
[机器学习-笔记02] 简单线性回归
1. 简单线性回归原理 简单(一元)线性回归的方程如下: 二维平面表示: b0和b1的含义: 模型拟合: 2. Python案例实现 2.1 数据 我们用到的数据如下: 2.2 实现 # Simple Linear Regression # Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd # Importing the dataset dataset原创 2021-04-17 11:37:54 · 220 阅读 · 1 评论