自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 数据分析的Python快速先导课 五 分别基于统计学习和机器学习做数据分析

统计学习和机器学习两个学科都是数据分析的理论工具,利用好比知道原理更重要。什么时候用,结论准不准,写代码时如何避免坑,都是学习数据分析的重点。统计学回归模型回归线的拟合度优度评价R2:[0,1],越大越好。算完优度评价之后一定要讨论假设。残差项的非相关性评价Durbin-watson(autocorrelation)值,判断是否自相关。皮尔森值,对回归分析的前提假定的检验是否确实存在线性关系:F统计量p值<0.05 或0.01;研究步骤:业务理解数据导入数据理解数据

2023-02-13 19:53:51 107

原创 python批量获取学术论文标题和作者

推荐想快速从谷歌学术镜像获取论文信息的同学使用。

2023-02-13 19:39:37 425

原创 关于resnet网络结构上的问题

这是一张resnet经典图f(x)是x经历过卷积的,维度可能已经发生了变化,那么这两个对象怎么相加呢?好多博客都在侧重于讲为什么会多出来一个x。终于被我找到这个添加链接描述总结来说就是确实会出现维度不一样的情况,甚至军机的通道数也可以是人为规定的,可能会出现不一样的情况。因此在相加的之前还是需要把维度和通道调成一致才可以。博客里有一个补零的方法可以调维度,1*1卷积可以调通道数。因为进行形变了,所以上面的经典图里,淡紫色到淡绿色那里用一条虚线来表示。...

2021-01-28 20:54:26 381

原创 tensorflow自学过程记录

阅读材料:tensorflow基本总结关于会话的理解eval函数用于计算精确度写法。需要有输出,否则可以用runeval函数的运行有前提,需要在一个会话里eval和run的不同点eval和run的官方描述翻译

2021-01-25 22:24:48 89

原创 艰辛的tensorflow装机过程

(1)关于Batch、Epoch和Iteration解释地最详细的博客https://blog.csdn.net/jindaxiaoooo/article/details/108072294?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522161145991716780274158673%2522%252C%2522scm%2522%253A%252220140713.130102334…%2522%257D&request_id=1

2021-01-24 14:17:15 84

原创 数据分析的Python快速先导课 四 画图功能大全

介绍Pandaspandas仍然想解决python里面列表和元组的问题,也在尝试解决字典在大数据应用中速度过慢的问题。有两个改进,一个是DataFrame,还有一个是针对dic的series的改进。与numpy不同的是,pandas在数据格式的定义上采用显示索引(explict index,与之对应的是implict index),显示行和列的名称。...

2020-08-04 12:02:08 428 1

原创 数据分析的Python快速先导课 三

这里写自定义目录标题数据分析的Python快速先导课 三第三方包数组计算浅拷贝和深拷贝数组变换ndarray的运算数组的切开数组的合并ndarray的安全函数ndarray的排序数据分析的Python快速先导课 三python里面没有数组(矩阵)的概念,只有列表和元组。这就增加了时间和空间代价。这个问题由第三方包来弥补。第三方包目前有numpy(由C实现的)和array能弥补上面的问题。array比较少用,最常用的是numpy的ndarray模块。N维数组是通过Python的numpy的扩展模块

2020-08-03 11:48:24 136

原创 数据分析的Python快速先导课 二

Python龙门阵Python龙门阵Python的包文件读写异常处理面向对象编程交换多个变量的值Jupyter智能插件其他Python龙门阵梳理性总结。Python的包Python由module组成,module是PY文件,文件由语句组成,语句由对象和函数构成。小问题找函数,大问题找包。全新体验认准python.org。:)下载包 ,Python自己用pypi.org服务器,pip用conda服务器。因此有些时候语句不一样。导入包:导入用import语句,有三种写法。A.0 查看已经安装

2020-08-02 16:52:58 131

原创 数据分析的Python快速先导课 一

适合有一点Python基础的,想要做数据分析的人用作知识回顾式搭建和基础知识查询。Python龙门阵快速复习持续修正名词analyticalanalytic 学问analytics 工具合集python 解释性语言 写一批翻译一批 Java 写一行翻译一行解释器/翻译器 C编译的CPython Java编译的JPython包的管理器(package installer for Python) pip conda 两者都是服务器 conda上面的包的来源更多。p.

2020-08-01 11:59:40 167

原创 模型评估方法

import pandas as pdimport numpy as npimport matplotlib.pyplot as pltdf = pd.read_csv(’/resources/jupyter/DA001/DA001-004/clean_df.csv’)#df.head()from sklearn.linear_model import LinearRegression...

2020-06-03 19:55:54 169

原创 数据科学导论-第一章 相关阅读资料补充

1.1大数据的提出背景•大数据是个既冷又热的领域大数据“热”的“冷”思考•大数据的奥妙不在于“数据”,更不在于“大”关于数据:通过数据寻找结论。寻找的过程形成了这门科学。关于大:大数据其实已运行差不多15年,起初进入市场时,“大”是其销售重点,供应商需要面对很多挑战,不停扩容并对这些容量进行运行。当时一切都以大为主题。而现在更讲究如何运用这些数据,这些数据全不全,有没有的统计价值。...

2020-06-03 19:55:32 204

原创 批量计算和流量计算

收集,不定期更新1、概念性知识https://blog.csdn.net/Jack__iT/java/article/details/103266486比较全的知识点串接2、基础案例

2020-04-19 12:44:04 199

原创 数据处理第一步:清洗和提炼

数据清洗的概念和方法总结部分代码练习1.数据清洗的概念和方法总结2.部分代码练习其中包含:2.1识别和处理缺失值2.2数据标准化2.3数据归一化2.4查看数据分布的分箱和指标变量数据清洗的目的:将数据转化为一种方便分析的格式首先导入数据!pip install pandas==0.25.0import pandas as pd#添加库df = pd.read_csv...

2020-03-21 18:33:30 780

原创 【数据分析】基于Python对数据做模型分析

1、准备工作这里用到pandas和numpy库import pandas as pdimport numpy as np引入自带的数据集合df = pd.resd_csv(“/resources/jupyter/DA001/DA001-003/clean_df.csv”)df.head()#查看前5行输出:将个体特征模式可视化#先引入包!pip install seabor...

2020-02-12 15:12:04 1805

原创 【数据分析】基于jupyter的数据集获取方法

首先说明,这个内容不能说完全原创,结合了其他学习平台学习的思路,加上一点自己的理解。就是记录下来方便自己之后查阅。1. 数据采集2. 认识数据集数据集有csv json xlsx等格式,可以储存在本地或者服务器上。在分析数据之前需要将数据集导入到Jupyter中。本次利用Pandas库(能够规范数据框架)对csv格式的汽车数据集进行试验。1.1数据库引入和查看#数据库引入import ...

2020-02-11 17:04:46 8289

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除