自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (2)
  • 收藏
  • 关注

转载 Python:操作dict时避免出现KeyError的几种方法

在读取dict的key和value时,如果key不存在,就会触发KeyError错误,如:Pythont = { 'a': '1', 'b': '2', 'c': '3',}print(t['d'])就会出现:KeyError: 'd'第一种解决方法首先测试key是否存在,然后才进行下一步操作,如:Py

2017-06-06 20:29:07 138952 9

转载 python解决字典中的值是列表问题的方法

问题:查找一些英文词在哪些小句中出现了,当然是用python来实现,当然是用字典,但是怎么让一个key对应一个 类型为列表的value,直接用列表的append()是不行的,比如dic[key].append(value),因为解释器并不知道 dic[key]的类型,当时赶时间,用了一个折衷的方案,就是先用value连成一个str,最后用str.split()作一个转换,生成一个列表.  

2017-06-06 19:38:24 15765

转载 机器学习简易入门(四)- logistic回归

摘要:使用logistic回归来预测某个人的入学申请是否会被接受声明:(本文的内容非原创,但经过本人翻译和总结而来,转载请注明出处)本文内容来源:https://www.dataquest.io/mission/59/logistic-regression 原始数据展示这是一份美国入学申请的录取记录表,admit – 是否录取,1代表录取,0代表否定;gpa

2017-06-03 16:37:29 608

转载 特殊矩阵(8):Vandermonde 矩阵

原文地址本文的阅读等级:初级法国数学家范德蒙(Alexandre-Théophile Vandermonde) 是行列式的奠基者之一,他在十八世纪提出行列式专有符号,将行列式应用于解线性方程组,并且对行列式理论进行了开创性的研究。两百多年后,他的名字因为一个特殊矩阵而经常被提及。Vandermonde 矩阵具有以下形式:,其中是一个阶矩阵,各元为。同样地,也

2017-06-02 15:59:17 25511 1

转载 Kaggle实战(二)

原文地址上一篇都是针对小数据集的,入门不建议从大数据集开始,可以不用考虑机器内存,不用out-of-core的online learning,不用考虑分布式,可以专注模型本身。接下来我做了两个广告CTR预估相关的比赛,不过比赛当时都已经closed了,还好,我们还可以提交结果看看close时能排到的位置。比赛实战6. Display Advertising ChallengeP

2017-06-02 11:37:09 2855 2

转载 Python的字符串

原文地址Python有内置的字符串类型, 内置的字符串是序列(Sequence), 是不可变的序列,  所以不可变序列通用的方法对其都适用.  对Python2, 内置的字符串类型有str和unicode, Python2'abc' 是str, u'中国123'  是unicode# Python2.7>>> type('abc')'str'>>>>

2017-06-02 10:39:02 401

转载 Python SciPy Sparse模块学习笔记

原文地址1. sparse模块的官方document地址:http://docs.scipy.org/doc/scipy/reference/sparse.html 2. sparse matrix的存储形式有很多种,见此帖子http://blog.csdn.net/anshan1984/article/details/8580952不同的存储形式在sparse模块中对应如下:

2017-06-02 10:34:02 2422

转载 广告点击率预估是怎么回事?

原文地址点击率预估是广告技术的核心算法之一,它是很多广告算法工程师喜爱的战场。一直想介绍一下点击率预估,但是涉及公式和模型理论太多,怕说不清楚,读者也不明白。所以,这段时间花了一些时间整理点击率预估的知识,希望在尽量不使用数据公式的情况下,把大道理讲清楚,给一些不愿意看公式的同学一个Cook Book。点击率预测是什么?点击率预测是对每次广告的点击情况做出预测,可以

2017-06-02 10:12:25 12033

转载 使用sklearn优雅地进行数据挖掘

原文地址1.1 数据挖掘的步骤  数据挖掘通常包括数据采集,数据分析,特征工程,训练模型,模型评估等步骤。使用sklearn工具可以方便地进行特征工程和模型训练工作,在《使用sklearn做单机特征工程》中,我们最后留下了一些疑问:特征处理类都有三个方法fit、transform和fit_transform,fit方法居然和模型训练方法fit同名(不光同名,参数列表都一样),这难道

2017-06-01 20:49:02 419

转载 [scikit-learn] 特征二值化编码函数的一些坑

1. 前言这几天埋头撰写『优雅高效地数据挖掘——基于Python的sklearn_pandas库』 一文,其中有一部分涉及如何批量并行地进行特征二值化,在此过程中发现了 scikit-learn (以下简称 sklearn)中,二值化函数存在一些坑,跟 sklearn_pandas 的作者在 github 上交流过,在此总结一下,做个记录所涉及到的几种 sklearn 的二值化

2017-06-01 12:58:10 1247 1

空手道俱乐部数据集karate.pairs

社会网络分析中社区发现经典数据集, Zachary's karate club network ,karate.pairs格式。

2017-07-26

多媒体 ps课程设计

《多媒体技术》课程设计——婚纱后期处理 (一)主题为《一生有你》在版式设计上要有独到的见解,融入柔美的人物写真和特效字。在图像的设计中,体现含蓄、羞涩的人物性格。 (二)为新娘制作带有书画效果的艺术相框,并在卷轴中融入花鸟写意画、书法和篆字的效果。

2015-04-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除