- 博客(7)
- 收藏
- 关注
原创 Windows系统,Anaconda安装Tensorflow
TensorFlow是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。安装 TensorFlow 方式有很多种,下面使用 Anaconda 在 windows10 安装 TensorFlow (CPU版)。安装Tensorflow在 Anaconda Prompt 窗口输入:conda create -n tensorflow python=...
2019-05-21 13:25:08
126
转载 适用于初学者----------数据预处理的大部分方法及技术
数据预处理的主要步骤分为:数据清理、数据集成、数据规约和数据变换。数据清理数据清理(data cleaning) 的主要思想是通过填补缺失值、光滑噪声数据,平滑或删除离群点,并解决数据的不一致性来“清理“数据。如果用户认为数据时脏乱的,他们不太会相信基于这些数据的挖掘结果,即输出的结果是不可靠的。1、缺失值的处理删除变量:若变量的缺失率较高(大于80%),覆盖率较低,且重要性较低,...
2019-03-14 10:54:49
1856
原创 R语言模型打包及基于Opencpu搭建restful api
setwd('C:\\打包')library(devtools)print(has_devel())# 创建包的文件夹create('./xulingyan')# dir.create('./ment')# 删除文件,当recursive为FALSE时只能删除空文件夹,为TRUE可以删除非空文件夹unlink('./package', recursive = TRUE)...
2019-03-12 16:59:44
756
原创 Top-N分析
查询最大的几个值的 Top-N 分析:SELECT [column_list], ROWNUM FROM (SELECT [column_list] FROM table ORDER BY Top-N_column)WHERE ROWNUM <= N;注意: 对 ROWNUM 只能使用 < 或 <=, 而用 =, &...
2019-03-12 16:35:31
332
原创 叉集
使用CROSS JOIN 子句使连接的表产生叉集select a_num,b_numfrom table1cross join table2叉集和笛卡尔集是相同的。
2019-03-12 15:46:56
638
原创 利用Python进行数据初步处理
import pandas as pddf = pd.read_csv('路径/文件名') # 读取数据# 查看数据信息print(df.info())print(df.describe())print(df.head()) #查看表头print(df.shape) #查看行列print(df.dtypes) #查看数据类型print(df["x-bo...
2019-03-06 15:59:03
265
原创 You are using pip version 8.1.2, however version 19.0.3 is available. You should consider upgrading
解决问题:原本想用pyecharts画图,但是之前都是用R的ggplot2,没有安装pyecharts模块在安装pyecharts时报错:按照提示,博主进行pip升级升级过程:1、conda install pip2、再次conda install pip3、python -m pip install --upgrade pip再次安装pye...
2019-03-06 15:06:18
6976
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人