自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Reikooo

May the light be with you

  • 博客(10)
  • 收藏
  • 关注

原创 Surprise库的安装及示例

Surprise 这个库在今年9月14号又发布了新版本,与上版本有些差别,由于国庆假期回家,用家里的小电脑遇见了几个坑,就想着记录下来,方便以后查阅,首先,家里电脑么得 Surprise_(:з」∠)_。。。安装吧,打开cmd,敲:conda install -c conda-forge scikit-surprise即可以避开缺少c++环境的坑,然后,评估标准 R...

2019-10-05 21:37:48 3424 1

转载 error: Microsoft Visual C++ 14.0 is required.

https://blog.csdn.net/weixin_42057852/article/details/80857948

2019-02-18 18:22:00 248

原创 TypeError: only size-1 arrays can be converted to Python scalars

遇到Bug及解决办法_(:з」∠)_

2019-02-14 11:54:49 18625 3

转载 Python2 urllib2 与 Python3 urllib.request API对照

原文地址:Python2 urllib2 与 Python3 urllib.request API对照Python2 Python3 urllib2.urlopen() urllib.request.urlopen() urllib2.install_opener() urllib.request.install_opener() urllib2.build_op...

2018-12-29 16:16:53 1530

原创 MySQL_lead()函数_判断同一id同一列两行是否相等

假设有一个客户之前下了订单,想看看这次订单距离下一次下单时间相差多少天,这类问题可以通过 lead 函数来求解,Lag和Lead函数可以在同一次查询中取出同一字段的前N行的数据(Lag)和后N行的数据(Lead)作为独立的列。实际应用当中,相比于 left join 等自连接方式的sql更加简洁。 函数语法:lag(exp_str,offset,defval) over(partiti...

2018-11-07 11:55:18 10233

原创 机器学习 - 特征工程 - 构造多项式特征Polynomial Features

简介:特征工程包括特征构建和特征挑选,个人对特征构建的兴趣要大一些,因为在实际项目当中我们往往会发现创造有用的特征比苦苦改进算法的回报率会高很多. 这篇博客想作为构造多项式特征的一个笔记,构建多项式特征是常见的构建新特征的方法之一. 在统计模型当中被广泛用于探索复合变量对y的影响,在机器学习项目当中并不像统计模型那样频繁使用,但我们依然可以用来探索一些我们认为可能会有帮助的变量. 定义:...

2018-10-17 16:28:34 6094

原创 Python3实现Json文件读写至DataFrame

收到格式类似下图的一份数据,需求是将 json 转化为 dataframe,因为文件包含多个 json 文件,想到的解决思路是循环读取每一行成为 json,再将它转换成 dataframe,建立一个空的 dataframe,再将数据一行一行的填进去,另外可以看一下整个过程所需的时间,以下是代码:import pandas as pdimport json import time...

2018-10-10 17:01:54 4078

原创 类别变量的数值转换_独热编码_one-hot

在数据准备阶段如果含有类别变量,可以对它进行 one-hot 编译,将它转换成数值再进行后续分析考虑放入模型等.举个例子,假如 Rank 包含A,B,C三个值:RankABCAAB解决的办法就是向数据集中再加入三个属性,在此命名为Rank_A,Rank_B,Rank_C,如果Rank的值为A,那么这三个属性依次为(1,0,0),Rank值为B,则为(0,1,0),C为(0...

2018-08-31 15:55:44 2678 1

翻译 数据预处理 _ sklearn.preprocessing中的scale和standardscaler

Sklearn的 Preprocessing模块提供了常见的将原始特征向量转换为更适合下行估计器表示的函数和类. 一般而言,学习算法受益于数据集的标准化,如果数据集当中存在异常值,一些robust scaler和 transformer会更加适用. 在同一个数据集上不同的 scaler, transformer 和normalizer 的表现可以在以下网页上查看:http://scikit-l...

2018-08-22 16:17:47 4957 4

原创 ValueError: Input contains NaN, infinity or a value too large for dtype('float32')

背景:在训练模型 fit(x_train,y_train) 时遇到报错 ValueError: Input contains NaN, infinity or a value too large for dtype('float32')  解决:from sklearn.preprocessing import Imputerdf = Imputer().fit_transfo...

2018-07-20 16:30:47 14373 7

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除