JR_lu的博客

machine learning 初学者

机器学习在电能需求预测中的应用

问题:电力公司会提前一天或者几天跟发电厂购买电量,买多了势必会造成不必要的浪费,而买少了临时向发电厂买电代价是比平时高得多的,如何根据以往的数据对未来的电量需求做出精准的预测,是电力公司非常重视的一个问题。解决方案:通过历年来该地区的实际电量需求数据和该地区的天气数据进行建模,建立一个回归模型,预...

2017-04-07 14:56:35

阅读数 3006

评论数 4

用机器学习对CTR预估建模(一)

题目网址:https://www.kaggle.com/c/avazu-ctr-prediction数据集介绍:train - Training set. 10 days of click-through data, ordered chronologically. Non-clicks and ...

2017-02-02 18:04:15

阅读数 7856

评论数 8

c++调用python脚本遇到的那些坑

问题一:一开始我是在qt上编写程序的,qt是32bit,但Python是64bit,在*.pro文件中配置了: INCLUDEPATH += C:/Python27/include/ LIBS += C:/Python27/libs/python27_d.lib 还是报错,究极原因是bit位数一...

2017-01-06 21:41:22

阅读数 7379

评论数 6

leetcode--字符串循环左移

// convert_test.cpp : 定义控制台应用程序的入口点。 //字符串循环左移问题#include "stdafx.h" #include<iostream> using namespace std;// 问题:给定一个字符串S[0...N-1],...

2016-12-11 21:31:01

阅读数 884

评论数 0

leetcode--一个for循环找出数组最大和次最大值

//给定一个数组,找出数组中最大值和次最大值。要求在一个for循环里实现#include "stdafx.h" #include<iostream> using namespace std; void select_max(const int*a, int size...

2016-12-09 10:59:24

阅读数 3849

评论数 0

leetcode--压缩空格问题

// test1.cpp : 定义控制台应用程序的入口点。 //题目:给定某字符串S,该字符串中有若干个空格,删除这些空格并返回修改后的字符串。要求:时间复杂度为O(N), //空间复杂度为O(1)。 注:有可能两个单词间有若干个空格!#include "stdafx.h" #...

2016-12-09 10:19:51

阅读数 459

评论数 0

data_analysis(二)时间戳、日期等各种日期型python相互转换

1.将字符串的时间转换为时间戳 方法: a = "2013-10-10 23:40:00" 将其转换为时间数组 import time timeArray = time.strptime(a, "...

2016-11-10 10:21:56

阅读数 293

评论数 0

Data_analysis(一)Kaggle上对StandarBank推荐产品的NAN数据进行fill

Kaggle上的一个比赛,https://www.kaggle.com/c/santander-product-recommendation 下面是一位大兄弟写的kernel,对数据进行清洗和nan填充 https://www.kaggle.com/apryor6/santander-pro...

2016-11-07 21:51:42

阅读数 1120

评论数 0

机器学习(十二)决策树

直接上链接http://www.cnblogs.com/leoo2sk/archive/2010/09/19/decision-tree.html

2016-11-02 10:26:21

阅读数 320

评论数 0

机器学习(十一)使用sklearn对kaggle的Titanic进行建模

转自寒老师的七月算法ML课程 数据集下载地址:https://www.kaggle.com/c/titanic# -*- coding: utf-8 -*- """ Created on Tue Nov 01 09:04:12 2016@author: Sirius...

2016-11-01 16:21:11

阅读数 1402

评论数 1

机器学习(十)使用sklearn库对时间特征进行处理

转自寒老师的七月算法ML课程,加了一点自己理解# -*- coding: utf-8 -*- """ Created on Mon Oct 31 20:27:11 2016@author: Sirius特征工程之时间型特征处理 """im...

2016-10-31 22:10:55

阅读数 5711

评论数 0

机器学习(九)使用sklearn库进行数据分析_——文本特征处理

# -*- coding: utf-8 -*- """ Created on Wed Oct 26 21:35:31 2016@author: sirius test word2word """ from sklearn.feature_...

2016-10-27 17:00:00

阅读数 728

评论数 0

机器学习(八)使用sklearn库进行数据分析_——特征处理之过滤、包裹、嵌入型

# -*- coding: utf-8 -*- """ Created on Thu Oct 27 10:53:56 2016@author: siriusfeature chioce """""" ----...

2016-10-27 16:57:03

阅读数 941

评论数 0

机器学习(七)使用pandas库进行数据分析_——统计信息和离散化

在特征工程中,对于数值型数据(比如年龄为25岁、31岁。。,商店某个时间段的销量为20W件等等), 通常要对这些数值型数据进行统计分析,比如求取它们的最大最小值、期望方差等,pandas库在数据分析中非常好用。 对 数值型数据进行离散化,也用到pandas的cut函数,具体操作如...

2016-10-26 16:30:57

阅读数 1972

评论数 0

机器学习(六)使用sklearn库的model存储

# -*- coding: utf-8 -*- """ Created on Tue Oct 25 21:39:04 2016@author: Administrator model说明,normalization """from skl...

2016-10-26 10:43:14

阅读数 1827

评论数 0

机器学习(五)使用sklearn库的cross validation

# -*- coding: utf-8 -*- """ Created on Tue Oct 25 20:10:51 2016@author: SIrius test sklearn """import numpy as np from ...

2016-10-26 10:06:05

阅读数 767

评论数 0

机器学习(四)使用sklearn库的练习normalization和model的一些参数

“`-- coding: utf-8 --“”” Created on Tue Oct 25 21:39:04 2016@author: Administrator model说明,normalization “”” import numpy as np from sklearn imp...

2016-10-25 22:09:03

阅读数 1094

评论数 0

机器学习(三)使用sklearn库的datasets练习LinearRegression

# -*- coding: utf-8 -*- """ Created on Tue Oct 25 20:42:24 2016@author:Sirius LinearRegression """from sklearn import d...

2016-10-25 21:00:50

阅读数 502

评论数 0

机器学习(二)使用sklearn库的datasets练习KNN分类

# -*- coding: utf-8 -*- """ Created on Tue Oct 25 20:10:51 2016@author: SIrius test sklearn """import numpy as np from ...

2016-10-25 20:38:16

阅读数 699

评论数 0

机器学习(一)概率论基础

**1. 期望** 定义: 期望有两种形式,离散型: 和连续型: 期望的意思就是概率加权下的“平均值”。性质: 补充一点: 随机事件是随机变量取某一特定值时的情况,有两个重要性质: 独立性: 互斥性: 2.方差定义: n个样本的分布规律偏离于平均值的程度 ...

2016-10-24 11:11:51

阅读数 514

评论数 1

提示
确定要删除当前文章?
取消 删除