data analysis
志yu
慕尼黑工大机器人硕士 方向机器视觉
展开
-
Markdown中输入数学公式及LaTex常用数学符号整理
1 Markdown 中使用LaTex基础语法2 常用数学表达命令2.1 指数和下标2.2 平方根和n次方根2.3 上下水平线2.4 上下大括号2.5 向量2.6 其他3 矩阵编辑3.1 带括号的矩阵 \left \right3.2 带括号的矩阵 \bmatrix \Bmatrix3.3 带括号的矩阵 \vmatrix \Vmatrix3.4 带省略号的矩阵3....转载 2018-12-03 10:35:02 · 765 阅读 · 0 评论 -
dataprocessing series2
1.将时间序列转换为监督数据关键函数df.shift()建议参考blog实际上df.shift()函数可以将当前列的值拷贝并按照输入的参数(表示step)来填充NaNfrom pandas import DataFramedf = DataFrame()df['t'] = [x for x in range(10)]print(df)from pandas import ...原创 2019-03-11 16:38:16 · 245 阅读 · 0 评论 -
pandas_ load_data 处理环节
1. astypeastype参考 进行强制转换2. df.__delitem__df.__delitem__是删除列名称3.df.columns 修改列label>>> df2.columnsIndex(['name', 'max_speed', 'rank'], dtype='object')>>&am原创 2019-03-10 16:19:04 · 1679 阅读 · 0 评论 -
pandas 基础设置(pd.values) data_preprocessing(缺失值)
本文是在做毕业设计 预处理部分的实践 参考pandas官方文档df.values#例子1>>> df2 = pd.DataFrame([('parrot', 24.0, 'second'),... ('lion', 80.5, 1),... ('monkey', np.na原创 2019-03-10 15:13:13 · 9873 阅读 · 0 评论 -
数据分析与挖掘建模实战-单因子探索分析与可视化
理论铺垫:集中趋势(数据聚拢的衡量)均值:连续值的 中位数:异样值 衡量集中趋势 分位数:和其他几个值综合使用 众数:离散值Q1 = (n+1) * 0.25Q2 = (n+1) * 0.5Q3 = (n + 1) * 0.75离中趋势σ=1N∑i=1N(xi−μ)2\sigma = \sqrt{\frac{1}{N}\sum_{i=1}^{N}(x_{i} ...转载 2019-01-05 23:03:27 · 356 阅读 · 0 评论 -
数据分析与建模挖掘- 数据获取
数据获取手段数据仓库检测与抓取填写 日志 埋点计算数据仓库分析仅靠运行的数据库无法完成 数据更改 减少冗余需要把用户的操作过程如实记录 并长期保留将所有业务数据经汇总处理 构成数据仓库(DW)全部事实记录(全面 完备的 尽可能详细的)部分维度与数据的整理(数据集市 DM)(方便以不同维度抽取和整理)不可能全部抽取DB VS DWD...转载 2019-01-05 21:47:27 · 752 阅读 · 0 评论 -
jupyter notebook自动补齐功能安装重建
1.进入想要安装的环境2.安装nbextensionspip install jupyter_contrib_nbextensions -i https://pypi.mirrors.ustc.edu.cn/simplejupyter contrib nbextension install --user3.安装nbextension_configuratorpip install -...转载 2019-01-05 20:35:54 · 805 阅读 · 1 评论 -
使用conda配置管理 安装tensorflow scrapy
管理指令常用指令:# 检查当前环境conda info -e# 创建新的环境并指定python版本conda create -n env_name python=2.7# 切换环境activate env_name# 退出环境deacticate env_name# 移除环境conda remove -n env_name --all管理安装包# 安装包cond...转载 2019-01-05 20:32:17 · 235 阅读 · 0 评论 -
matplotlib画图- 时间序列折线图
今天做了一下毕设的图(关于结果比较的 时间序列图)首先我说明 找了半天的博客 没有找到好的方法做x轴为datetime,很麻烦 所以我打算做int32类型的,但发现没法转换 结果采用特殊方法解决的1.数据集查看int64有个问题:就是在x轴的时候会出现0.52.将year转换为indexa = data.set_index(['YEAR'])a.indexInt64Inde...原创 2019-03-17 16:23:24 · 9954 阅读 · 1 评论