自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

转载 数据仓库学习笔记 --- 拉链表详解

定义:拉链表 - 维护历史状态,以及最新状态数据的一种表,拉链表根据拉链粒度的不同,实际上相当于快照,只不过做了优化,去除了一部分不变的记录而已,通过拉链表可以很方便的还原出拉链时点的客户记录。拉链表通常是对账户信息的历史变动进行处理保留的结果。需求:1. 数据量比较大;2. 表中的部分字段会被update,如用户的地址,产品的描述信息,订单的状态等等;3. 需要查看某一...

2019-10-17 15:14:12 461

原创 Kaggle选手调查问卷分析(用户画像分析)

        Kaggle是众所周知的数据竞赛平台,为社区用户举办了一次问卷调查,调查内容涉及人工智能领域的不同维度,收集到16000份关于从业者的人员属性、工作背景,学习特征和技能特征等方面的信息,帮助打算进入人工智能领域的有识之士更好的了解行业现状,做到有的放矢,不走弯路。        数据来源::https://pan.baidu.com/s/1o7BFzFO用户画像分析一 ...

2018-09-12 22:37:27 3925 2

原创 利用时间序列ARMA模型和LSTM算法分析并预测pm2.5值

数据来源于 UC Irvine Machine Learning Repository网站中的Beijing PM2.5 Data Data Set,数据文件类型为CSV。一、利用ARMA模型数据平稳性分析还是以天为单位分析这五年之内的pm2.5值,并绘制曲线ARIMA 模型对时间序列的要求是平稳型,观察图标能看出其没有固定的上升或下降的趋势,粗略判断是平稳序列。不进行差分操作...

2018-09-07 19:14:06 13590 2

转载 机器学习算法简述 与 代码实现

机器学习(一)——K-近邻(KNN)算法机器学习(二)——K-均值聚类(K-means)算法机器学习(三)—支持向量机机器学习(四)—决策树机器学习(五)—朴素贝叶斯机器学习(六)— logistic回归机器学习(七)—回归机器学习(八)—Apriori算法 各种算法的优缺点及适用范围  优点 缺点 适用数据类型 KNN 精度高、...

2018-09-06 16:36:30 671

转载 基于内容推荐算法详解

Collaborative Filtering Recommendations (协同过滤,简称CF) 是目前最流行的推荐方法,在研究界和工业界得到大量使用。但是,工业界真正使用的系统一般都不会只有CF推荐算法,Content-based Recommendations (CB) 基本也会是其中的一部分。“基于物品的协同过滤算法:理论说明,代码实现及应用http://blog.csdn.net...

2018-09-06 11:56:02 569

原创 北京PM2.5情况分析(2010-2014)

利用网上搜集到的CSV数据,对北京市2010年至2014年的PM2.5情况进行分析。数据获取数据来源于 UC Irvine Machine Learning Repository网站中的Beijing PM2.5 Data Data Set,数据文件类型为CSV。数据清洗预览:数据共43824条,13个维度,其中部分字段代表含义如下TEMP:温度PRES:大气压力c...

2018-08-26 11:55:42 12575 15

转载 enumurate()

python其实提供了内置的enumerate函数可以同时获得索引和值,可以这样实现:[python] view plain copyfor index, key in enumerate(sequence):        process(index, key)  如果你想对sequence中的元素作逆置后处理,可以:

2017-12-18 20:55:22 304

转载 Python函数式编程之map()

Python中map()、filter()、reduce()这三个都是应用于序列的内置函数。 格式: map(func, seq1[, seq2,…]) 第一个参数接受一个函数名,后面的参数接受一个或多个可迭代的序列,返回的是一个集合。 Python函数编程中的map()函数是将func作用于seq中的每一个元素,并将所有的调用的结果作为一个list返回。如果func为None

2017-12-17 20:13:13 294

转载 collections.defaultdict() 与 dict的使用和区别

import collectionss = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]# defaultdictd = collections.defaultdict(list)for k, v in s:    d[k].append(v)# Use dict a

2017-12-17 12:45:02 889

转载 Python的zip函数

zip函数接受任意多个(包括0个和1个)序列作为参数,返回一个tuple列表。具体意思不好用文字来表述,直接看示例:1.示例1:x = [1, 2, 3]y = [4, 5, 6]z = [7, 8, 9]xyz = zip(x, y, z)print xyz运行的结果是:[(1, 4, 7), (2, 5, 8), (3, 6, 9)]

2017-12-17 12:43:18 235 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除