主要变量为分类变量的建模实例——入金分析

#修正中文字体 from matplotlib.font_manager import FontProperties myfont=FontProperties(fname=r'C:\Windows\Fonts\simhei.ttf',size=14) sns.set(font=myfon...

2018-03-22 17:50:50

阅读数 798

评论数 1

百度百科爬虫爬人物信息

百度百科爬虫爬人物信息,主要是政治人物的部分信息。 部分代码适应性不高,需进一步修改。 并未设置自动化爬虫,只是对字段进行分类处理。 from bs4 import BeautifulSoup import pandas as pd import requests impor...

2017-10-31 10:30:47

阅读数 584

评论数 0

关于相似地址识别的Python代码

工作需要,利用中国省、市、乡等基本行政规划以及基本的地址分词字符如街、道之类的,以正则表达式分词的方式做了一个相似地址的判断程序。该程序首先利用正则表达式对地址进行分词,将部分常见的无法用于区分的字段删除,如街、道、号等,将分词后的结果放到gensim进行文本相似度判断。 大致的判断结果如下: ...

2017-10-13 10:21:37

阅读数 1099

评论数 0

Pandas对数据框首列为被预测变量,其他列为自变量求WOE矩阵及IV值

import pandas as pd import os import datetime import numpy as np import csv import math import matplotlib.pyplot as plt class Woefordf(object): o...

2017-09-11 14:47:47

阅读数 1767

评论数 1

Python制作的Tries树查找地址中包含的省份

class Trie: root={} END='/' def add_province(self,word): node=self.root for c in word: if c=='省': node[self.END]='省' elif c=='自': ...

2017-08-31 14:42:57

阅读数 265

评论数 0

如何用Python Pandas以及正则表达式提取地址中的省份

如题。 假设数据在data数据框中,列名为"地址"。 #筛选含省份的字段 data[data['地址'].str.match('.+省']['地址'].str.extract('(.+[省])',expand=True) #去掉省份前特殊字符的样本 data1=dat...

2017-08-25 13:52:12

阅读数 5866

评论数 0

机器学习相关知识

机器学习总结 机器学习相关知识 写在前面的话 保持怀疑的态度(在全新的数据集上测试分类器)天下没有免费的午餐(没有适用的最好学习方法,具体问题具体对待)正确对待缺失值,不同参数的设置可能会对结果产生不同的影响不同算法都有对应的假设数据挖掘的结果总会误导人,保持求真的态度 ...

2017-06-16 11:50:42

阅读数 183

评论数 0

详解ROC/AUC计算过程

详解ROC/AUC计算过程 标签: ROCAUC机器学习python 2016-07-22 22:55 3585人阅读 评论(0) 收藏 举报  分类: Machine Learning(25)  Python(27)  版权声明:本文为博主原创文章,...

2017-06-14 11:20:14

阅读数 742

评论数 0

从神经网络说起:深度学习初学者不可不知的25个术语和概念

从神经网络说起:深度学习初学者不可不知的25个术语和概念(上)  关键词:大数据 神经网络 来源:网络整理 作者:IOTER 2017-06-11 05:54 人工智能,深度学习和机器学习,不论你现在是否能够理解这些概念,你都应该学习。否则三年内,你就会像灭绝的恐龙...

2017-06-12 12:38:35

阅读数 1888

评论数 0

TensorFlow 深度学习笔记 TensorFlow实现与优化深度神经网络

TensorFlow 深度学习笔记 TensorFlow实现与优化深度神经网络 转载请注明作者:梦里风林 Github工程地址:https://github.com/ahangchen/GDLnotes 欢迎star,有问题可以到Issue区讨论 官方教程地址 视频/...

2017-06-12 10:33:20

阅读数 279

评论数 0

通过PyTorch实现对抗自编码器

通过PyTorch实现对抗自编码器 By 黄小天2017年4月26日 13:52 「大多数人类和动物学习是无监督学习。如果智能是一块蛋糕,无监督学习是蛋糕的坯子,有监督学习是蛋糕上的糖衣,而强化学习则是蛋糕上的樱桃。我们知道如何做糖衣和樱桃,但我们不知道如何做蛋糕。」 ...

2017-06-09 10:27:55

阅读数 1392

评论数 0

变分自编码(VAE)及代码解读

版权声明:本文为博主原创文章,未经博主允许不得转载。 这几天在看GAN模型的时候,顺便关注了另外一种生成模型——VAE。其实这种生成模型在早几年就有了,而且有了一些应用。著名黑客George Hotz在其开源的自主驾驶项目中就应用到了VAE模型。这其中的具体应用在我上一篇转载的博客com...

2017-06-09 10:22:46

阅读数 1110

评论数 0

数据不够大,别玩深度学习?正反双方撕起来了

数据不够大,别玩深度学习?正反双方撕起来了 2017-06-07 13:06 李林 问耕 发自 凹非寺 量子位 报道 | 公众号 QbitAI 争论,随时可能爆发。 比方当你看到一篇名为《数据不够大,别玩深度学习》(Don’t use deep learning ...

2017-06-09 10:06:14

阅读数 720

评论数 0

用python实现简单的遗传算法

今天整理之前写的代码,发现在做数模期间写的用Python实现的遗传算法,感觉还是挺有意思的,就拿出来分享一下。 首先遗传算法是一种优化算法,通过模拟基因的优胜劣汰,进行计算(具体的算法思路什么的就不赘述了)。大致过程分为初始化编码、个体评价、选择,交叉,变异。 以目标式子 y = 10...

2017-05-24 16:01:27

阅读数 563

评论数 2

如何计算两个文档的相似度

http://www.52nlp.cn/%E5%A6%82%E4%BD%95%E8%AE%A1%E7%AE%97%E4%B8%A4%E4%B8%AA%E6%96%87%E6%A1%A3%E7%9A%84%E7%9B%B8%E4%BC%BC%E5%BA%A6%E4%B8%80 前几天,...

2017-05-22 16:10:42

阅读数 840

评论数 0

机器学习中用来防止过拟合的方法有哪些?

http://www.leiphone.com/news/201705/eMzzUpdhsG71kFlg.html 机器学习中用来防止过拟合的方法有哪些? 本文作者:qqfly 编辑:贾智龙 2017-05-16 15:48 导语:给《机器视觉与应用...

2017-05-19 10:50:18

阅读数 2166

评论数 0

机器学习:你需要多少训练数据?

http://www.tuicool.com/articles/AFRvArf 训练数据的特性和数量是决定一个模型性能好坏的最主要因素。一旦你对一个模型输入比较全面的训练数据,通常针对这些训练数据,模型也会产生相应的结果。但是,问题是你需要多少训练数据合适呢?这恰恰取决于你正在执行的任务、最...

2017-05-19 10:37:54

阅读数 339

评论数 0

机器学习算法一览

http://www.dataguru.cn/article-8752-1.html 机器学习算法一览 2016-1-12 21:42|发布者: 炼数成金_小数|查看: 16625|评论: 0|原作者: 寒小阳 |来自: CSDN 摘要: 按照不同的分类标...

2017-05-18 17:08:30

阅读数 470

评论数 0

LearningNotes 变分自编码(VariationalAutoEncoder VAE)

http://www.it165.net/pro/html/201612/78028.html LearningNotes 变分自编码(VariationalAutoEncoder VAE) 作者:  发布日期:2016-12-22 20:36:23 我来说两句(0) ...

2017-05-18 13:48:22

阅读数 1301

评论数 0

VAE(4)——实现

本文收录在无痛的机器学习第一季。 终于到了实现的地方。前面干燥乏味的公式推导和理论阐述已经让很多人昏昏欲睡了,下面我们要提起精神,来看看这个模型的一个比较不错的实现——GitHub - cdoersch/vae_tutorial: Caffe code to accompany my T...

2017-01-20 17:22:44

阅读数 3533

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭