自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

王十二的

数据分析入门选手

  • 博客(21)
  • 资源 (1)
  • 收藏
  • 关注

原创 【资源】2018年,你最需要的机器学习资料整理分享

2017年是机器学习大爆发的一年,互联网巨头公司纷纷提出“ALL IN AI”理念。2018年之初,分享收集的机器学习最权威的资料,新年祝大家沉迷学习不能自拔。机器学习01.机器学习 斯坦福大学吴恩达老师的Machine Learning应该是最适合机器学习入门的课程了。从2012年开课到今年,这个课程在斯坦福大学已经被挤爆了,也是Coursera平台上最为热门的课程。 吴恩达老师的讲课内容非常

2018-01-02 16:27:35 4910

原创 深度学习入门:Tensorflow实战Digit Recognizer

Tensorflow是当前GitHub上最活跃的机器学习项目,本文是Tensorflow实战Digit Recognizer系列文章的第一篇,介绍如何在MNIST数据集上快速跑出一个模型。

2017-12-23 15:58:35 673

原创 Porto竞赛第一名解决方法

Porto竞赛结束后,很多参赛的选手都分享了自己的解决方案。借鉴大神们的经验,为以后的竞赛中能够取得好的成绩增加一点自信。

2017-12-06 22:44:37 1016

原创 Kaggle入门系列:(二)机器学习环境搭建

想要参加Kaggle,首先要搭建好我们的机器学习环境。

2017-09-17 19:44:13 2652 1

原创 Kaggle入门系列:(三)Titanic竞赛初试身手

本篇文章针对刚刚接触Kaggle的同学,介绍参加Kaggle数据分析竞赛的完整流程,最快速度完成一个比赛。

2017-09-17 19:28:20 3402 1

原创 Kaggle入门系列:(一)Kaggle简介

Kaggle平台入门系列文章,第一篇。

2017-09-17 16:56:01 9424

原创 Python房价可视化分析的思路及实战

作者利用网络爬虫抓取了安居客、房天下和58同城这几个网站上房价的数据,利用数据分析对文山市的房价情况进行的简单的分析。

2016-11-28 22:32:07 14683 24

原创 文山市房价分析(一)数据收集

一、数据来源数据来源关系到分析结果的准确性和权威性,因此数据源主要从以下四个网站抓取:搜房网安居客58同城赶集网搜房网和安居客分别是中国站长之家的房产类网站排名的1和2,58同城和赶集网是运营比较好的综合性服务网站。二、主要抓取的数据网站上的数据是比较复杂的,主要抓取新房、二手房和出租房的主要信息。2.1新房 小区 房价(元/平方米) 出售数量 2.2二手房

2016-11-09 23:41:38 820

原创 Spring框架设计模式分析

在Java web的开发过程中,目前企业级应用程序采用较多的开发框架是SSH(Spring+SpringMVC+Hibernate,用SpringMVC来代替Struts)。本文通过阅读Spring的官方手册和源代码来分析Spring创建者的设计理念,主要梳理在使用Spring的过程中遇到的设计模式,以及Spring框架中各个核心组件之间的协同方式。1.Spring框架简介Spring框架是目前最流

2016-06-28 08:59:48 9783 1

原创 edx安装

前言edx是由于技术准备不足,为了避免出现各种问题,在这里我选择了安装Devstack版本的edx。根据官方的开发文档进行安装。安装环境为Ubuntu14.04,thinkpad T430。概述edX Developer Stack 就是通常我们所说的Devstack,是为本地开发所设计的一个Vagrant实例。Devstack:和产品(edx Product Stack)对系统的要求一

2015-06-02 20:09:21 1031

原创 R语言数据导入

在CRAN网站上有一篇专门关于R语言数据的帮助文档,叫R-data.pdf的,具体的网址百度下吧。    借用文档的第一段:    Readingdata into a statistical system for analysis and exporting the results to someother systemfor report writing can be frustrat

2015-04-26 09:46:57 1297

转载 mysql启动报错

mysql启动报错的元婴

2014-09-08 18:45:06 1302

转载 php常见错误以及解决方案

精典错误  /libxmlrpc/encoding.c:101:undefined reference to 'libiconv_close'  collect2: ld returned 1 exit status  make:*** [sapi/fpm/php-fpm] Error 1  解决方法:  #make ZEND_EXTRA_LIBS='-liconv'  错

2014-09-08 18:43:37 615

原创 bin/nutch crawl错误解决办法

今天继续看Nutch的搭建问题,yiqian

2014-08-21 21:39:37 2012

原创 python字符串查找

python字符串查找有四种方法:1.find 2.index 3.rfind 4.rindex1.find():查找字符串,若找到返回从0开始的下标,找不到返回-1 info = 'abca' print info.find('a')##从下标0开始,查找在字符串里第一个出现的子串,返回结果:02.index():python 的index方法是在字符串里查找子串第一次出现的位置

2014-08-20 20:16:11 1330

原创 Ubuntu12.04安装jdk开发环境

本文在ubuntu linux下安装jdk开发环境1.下载jdk-7u51-linux-i586.tar.gz 这里比较简单,直接百度下载最新的就可以 还是给个地址吧,有可能有更新。 http://download.oracle.com/otn-pub/java/jdk/7/jdk-7-linux-i586.tar.gz 2.第二步解压安装 sudo mkdir /usr/

2014-08-20 20:14:40 413

原创 初识Heritrix

一、       Heritrix简介Heritrix 是一个由 java 开发的、开源的网络爬虫,用户可以使用它来从网上抓取想要的资源。其最出色之处在于它良好的可扩展性,方便用户实现自己的抓取逻辑。二、Heritrix安装(Eclipse)首先要去官网下载最新版本的heritrix。下载地址为:http://sourceforge.net/project/showfiles.php?

2014-08-20 20:11:14 555

原创 PHP添加扩展模块(centos)

php默认的安装有几个模块需要自己添加,网上说的较多的是重新编译,我们这里使用扩展的方式来完成。1.安装php-mysql模块 yum install php-mysql 重启php2.添加mb_strlen()函数支持 yum install php-mbstring 重启php

2014-08-08 20:33:50 606

原创 contos安装lnmp

1.登陆系统后使用yum安装MySQL,PHP,nginx, yum install mysql mysql-server nginx php php-fpm2.安装软件信息查看 rpm -ql XX(soft address) rpm -q XX(soft version)3.配置nginx (1)启动nginx service nginx restart

2014-08-08 20:31:33 836

转载 用Python 做文本挖掘的流程

收集数据数据集。如果是已经被人做成数据集了,这就省去了很多麻烦事抓取。这个是 Python 做得最好的事情,优秀的包有很多,比如 scrapy,beautifulsoup 等等。预处理1.去掉抓来的数据中不需要的部分,比如 HTML TAG,只保留文本。结合 beautifulsoup 和正则表达式就可以了。pattern.web 也有相关功能。2.处理编码问题。没

2014-06-07 20:53:29 3722 1

原创 Sql 链接查询

对于sql语句来说,最重要的一个语句就是select语句,今天遇到3个表的多对多链接查询。1.student(表1) {studentid,name}2.grade(表2){studentid,courseid}3.course(表3){courseid,grade}开始使用的事简单的select name,grade fromstudent,grade,course where

2014-05-12 22:45:32 479

nutch-2.2.1

nutch是一个极为出色的网络爬虫。 最新的nutch源码包。

2014-08-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除