- 博客(21)
- 资源 (1)
- 收藏
- 关注
原创 【资源】2018年,你最需要的机器学习资料整理分享
2017年是机器学习大爆发的一年,互联网巨头公司纷纷提出“ALL IN AI”理念。2018年之初,分享收集的机器学习最权威的资料,新年祝大家沉迷学习不能自拔。机器学习01.机器学习 斯坦福大学吴恩达老师的Machine Learning应该是最适合机器学习入门的课程了。从2012年开课到今年,这个课程在斯坦福大学已经被挤爆了,也是Coursera平台上最为热门的课程。 吴恩达老师的讲课内容非常
2018-01-02 16:27:35 4910
原创 深度学习入门:Tensorflow实战Digit Recognizer
Tensorflow是当前GitHub上最活跃的机器学习项目,本文是Tensorflow实战Digit Recognizer系列文章的第一篇,介绍如何在MNIST数据集上快速跑出一个模型。
2017-12-23 15:58:35 673
原创 Porto竞赛第一名解决方法
Porto竞赛结束后,很多参赛的选手都分享了自己的解决方案。借鉴大神们的经验,为以后的竞赛中能够取得好的成绩增加一点自信。
2017-12-06 22:44:37 1016
原创 Kaggle入门系列:(三)Titanic竞赛初试身手
本篇文章针对刚刚接触Kaggle的同学,介绍参加Kaggle数据分析竞赛的完整流程,最快速度完成一个比赛。
2017-09-17 19:28:20 3402 1
原创 Python房价可视化分析的思路及实战
作者利用网络爬虫抓取了安居客、房天下和58同城这几个网站上房价的数据,利用数据分析对文山市的房价情况进行的简单的分析。
2016-11-28 22:32:07 14683 24
原创 文山市房价分析(一)数据收集
一、数据来源数据来源关系到分析结果的准确性和权威性,因此数据源主要从以下四个网站抓取:搜房网安居客58同城赶集网搜房网和安居客分别是中国站长之家的房产类网站排名的1和2,58同城和赶集网是运营比较好的综合性服务网站。二、主要抓取的数据网站上的数据是比较复杂的,主要抓取新房、二手房和出租房的主要信息。2.1新房 小区 房价(元/平方米) 出售数量 2.2二手房
2016-11-09 23:41:38 820
原创 Spring框架设计模式分析
在Java web的开发过程中,目前企业级应用程序采用较多的开发框架是SSH(Spring+SpringMVC+Hibernate,用SpringMVC来代替Struts)。本文通过阅读Spring的官方手册和源代码来分析Spring创建者的设计理念,主要梳理在使用Spring的过程中遇到的设计模式,以及Spring框架中各个核心组件之间的协同方式。1.Spring框架简介Spring框架是目前最流
2016-06-28 08:59:48 9783 1
原创 edx安装
前言edx是由于技术准备不足,为了避免出现各种问题,在这里我选择了安装Devstack版本的edx。根据官方的开发文档进行安装。安装环境为Ubuntu14.04,thinkpad T430。概述edX Developer Stack 就是通常我们所说的Devstack,是为本地开发所设计的一个Vagrant实例。Devstack:和产品(edx Product Stack)对系统的要求一
2015-06-02 20:09:21 1031
原创 R语言数据导入
在CRAN网站上有一篇专门关于R语言数据的帮助文档,叫R-data.pdf的,具体的网址百度下吧。 借用文档的第一段: Readingdata into a statistical system for analysis and exporting the results to someother systemfor report writing can be frustrat
2015-04-26 09:46:57 1297
转载 php常见错误以及解决方案
精典错误 /libxmlrpc/encoding.c:101:undefined reference to 'libiconv_close' collect2: ld returned 1 exit status make:*** [sapi/fpm/php-fpm] Error 1 解决方法: #make ZEND_EXTRA_LIBS='-liconv' 错
2014-09-08 18:43:37 615
原创 python字符串查找
python字符串查找有四种方法:1.find 2.index 3.rfind 4.rindex1.find():查找字符串,若找到返回从0开始的下标,找不到返回-1 info = 'abca' print info.find('a')##从下标0开始,查找在字符串里第一个出现的子串,返回结果:02.index():python 的index方法是在字符串里查找子串第一次出现的位置
2014-08-20 20:16:11 1330
原创 Ubuntu12.04安装jdk开发环境
本文在ubuntu linux下安装jdk开发环境1.下载jdk-7u51-linux-i586.tar.gz 这里比较简单,直接百度下载最新的就可以 还是给个地址吧,有可能有更新。 http://download.oracle.com/otn-pub/java/jdk/7/jdk-7-linux-i586.tar.gz 2.第二步解压安装 sudo mkdir /usr/
2014-08-20 20:14:40 413
原创 初识Heritrix
一、 Heritrix简介Heritrix 是一个由 java 开发的、开源的网络爬虫,用户可以使用它来从网上抓取想要的资源。其最出色之处在于它良好的可扩展性,方便用户实现自己的抓取逻辑。二、Heritrix安装(Eclipse)首先要去官网下载最新版本的heritrix。下载地址为:http://sourceforge.net/project/showfiles.php?
2014-08-20 20:11:14 555
原创 PHP添加扩展模块(centos)
php默认的安装有几个模块需要自己添加,网上说的较多的是重新编译,我们这里使用扩展的方式来完成。1.安装php-mysql模块 yum install php-mysql 重启php2.添加mb_strlen()函数支持 yum install php-mbstring 重启php
2014-08-08 20:33:50 606
原创 contos安装lnmp
1.登陆系统后使用yum安装MySQL,PHP,nginx, yum install mysql mysql-server nginx php php-fpm2.安装软件信息查看 rpm -ql XX(soft address) rpm -q XX(soft version)3.配置nginx (1)启动nginx service nginx restart
2014-08-08 20:31:33 836
转载 用Python 做文本挖掘的流程
收集数据数据集。如果是已经被人做成数据集了,这就省去了很多麻烦事抓取。这个是 Python 做得最好的事情,优秀的包有很多,比如 scrapy,beautifulsoup 等等。预处理1.去掉抓来的数据中不需要的部分,比如 HTML TAG,只保留文本。结合 beautifulsoup 和正则表达式就可以了。pattern.web 也有相关功能。2.处理编码问题。没
2014-06-07 20:53:29 3722 1
原创 Sql 链接查询
对于sql语句来说,最重要的一个语句就是select语句,今天遇到3个表的多对多链接查询。1.student(表1) {studentid,name}2.grade(表2){studentid,courseid}3.course(表3){courseid,grade}开始使用的事简单的select name,grade fromstudent,grade,course where
2014-05-12 22:45:32 479
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人