- 博客(10)
- 资源 (2)
- 收藏
- 关注
转载 Python:操作dict时避免出现KeyError的几种方法
在读取dict的key和value时,如果key不存在,就会触发KeyError错误,如:Pythont = { 'a': '1', 'b': '2', 'c': '3',}print(t['d'])就会出现:KeyError: 'd'第一种解决方法首先测试key是否存在,然后才进行下一步操作,如:Py
2017-06-06 20:29:07 138961 9
转载 python解决字典中的值是列表问题的方法
问题:查找一些英文词在哪些小句中出现了,当然是用python来实现,当然是用字典,但是怎么让一个key对应一个 类型为列表的value,直接用列表的append()是不行的,比如dic[key].append(value),因为解释器并不知道 dic[key]的类型,当时赶时间,用了一个折衷的方案,就是先用value连成一个str,最后用str.split()作一个转换,生成一个列表.
2017-06-06 19:38:24 15765
转载 机器学习简易入门(四)- logistic回归
摘要:使用logistic回归来预测某个人的入学申请是否会被接受声明:(本文的内容非原创,但经过本人翻译和总结而来,转载请注明出处)本文内容来源:https://www.dataquest.io/mission/59/logistic-regression 原始数据展示这是一份美国入学申请的录取记录表,admit – 是否录取,1代表录取,0代表否定;gpa
2017-06-03 16:37:29 608
转载 特殊矩阵(8):Vandermonde 矩阵
原文地址本文的阅读等级:初级法国数学家范德蒙(Alexandre-Théophile Vandermonde) 是行列式的奠基者之一,他在十八世纪提出行列式专有符号,将行列式应用于解线性方程组,并且对行列式理论进行了开创性的研究。两百多年后,他的名字因为一个特殊矩阵而经常被提及。Vandermonde 矩阵具有以下形式:,其中是一个阶矩阵,各元为。同样地,也
2017-06-02 15:59:17 25550 1
转载 Kaggle实战(二)
原文地址上一篇都是针对小数据集的,入门不建议从大数据集开始,可以不用考虑机器内存,不用out-of-core的online learning,不用考虑分布式,可以专注模型本身。接下来我做了两个广告CTR预估相关的比赛,不过比赛当时都已经closed了,还好,我们还可以提交结果看看close时能排到的位置。比赛实战6. Display Advertising ChallengeP
2017-06-02 11:37:09 2857 2
转载 Python的字符串
原文地址Python有内置的字符串类型, 内置的字符串是序列(Sequence), 是不可变的序列, 所以不可变序列通用的方法对其都适用. 对Python2, 内置的字符串类型有str和unicode, Python2'abc' 是str, u'中国123' 是unicode# Python2.7>>> type('abc')'str'>>>>
2017-06-02 10:39:02 401
转载 Python SciPy Sparse模块学习笔记
原文地址1. sparse模块的官方document地址:http://docs.scipy.org/doc/scipy/reference/sparse.html 2. sparse matrix的存储形式有很多种,见此帖子http://blog.csdn.net/anshan1984/article/details/8580952不同的存储形式在sparse模块中对应如下:
2017-06-02 10:34:02 2422
转载 广告点击率预估是怎么回事?
原文地址点击率预估是广告技术的核心算法之一,它是很多广告算法工程师喜爱的战场。一直想介绍一下点击率预估,但是涉及公式和模型理论太多,怕说不清楚,读者也不明白。所以,这段时间花了一些时间整理点击率预估的知识,希望在尽量不使用数据公式的情况下,把大道理讲清楚,给一些不愿意看公式的同学一个Cook Book。点击率预测是什么?点击率预测是对每次广告的点击情况做出预测,可以
2017-06-02 10:12:25 12034
转载 使用sklearn优雅地进行数据挖掘
原文地址1.1 数据挖掘的步骤 数据挖掘通常包括数据采集,数据分析,特征工程,训练模型,模型评估等步骤。使用sklearn工具可以方便地进行特征工程和模型训练工作,在《使用sklearn做单机特征工程》中,我们最后留下了一些疑问:特征处理类都有三个方法fit、transform和fit_transform,fit方法居然和模型训练方法fit同名(不光同名,参数列表都一样),这难道
2017-06-01 20:49:02 419
转载 [scikit-learn] 特征二值化编码函数的一些坑
1. 前言这几天埋头撰写『优雅高效地数据挖掘——基于Python的sklearn_pandas库』 一文,其中有一部分涉及如何批量并行地进行特征二值化,在此过程中发现了 scikit-learn (以下简称 sklearn)中,二值化函数存在一些坑,跟 sklearn_pandas 的作者在 github 上交流过,在此总结一下,做个记录所涉及到的几种 sklearn 的二值化
2017-06-01 12:58:10 1247 1
多媒体 ps课程设计
2015-04-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人