自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

steady_pace的专栏

厚积薄发~

  • 博客(13)
  • 资源 (1)
  • 收藏
  • 关注

原创 数据结构学习规划~

1: 2:

2015-09-30 19:12:55 474

原创 数据结构初语~

别人帖子的精华数据结构的本质就在于:如何将现实世界中各种各样的数据放入到内存中,并且如何在内存中操作这些数据,如何评价这些存储方案和操作方法。 方案1:基于物理存储方案的数据操作。(物理存储只有两种:连续的和不连 续的存储) 方案2: 是不是只有物理存储结构(方案)就可以了呢?在第1条中说过,现实当中的数据是有各种各样的结构的。而我们强调了物理放置方案只有2种:连续

2015-09-30 19:12:08 443

转载 Linear regression(线性回归)

在实际生活中,我们常常需要根据已知的某些知识来预测未知的知识。例如我们可能需要根据房子的住宿面积来预测房子的销售价格,在这个问题中,已知的知识就是房子的住宿面积,未知的知识就是房子的销售价格。对于supervised learning来说,首先会拥有一个训练数据集training data。我们的任务就是从training data中学习到一个尽可能好的模型,可以对现实世界进行相关预测。

2015-09-18 14:52:13 583

原创 BAE(疑惑)

同样的程序,在本机上跑的好好的。部署到BAE python-worker服务后,出现问题。比如:同样一个url, 在本地返回改地址的HTML网页时,length 为 98551可是部署到BAE python-worker上后,length 只有28831。 为什么啊?烦请版主大人帮忙看一下,调了好几天了,闹心 代码如下:(python)-- coding:utf-8 --import time

2015-09-10 16:44:37 494

原创 机器学习实战——第一章

机器学习能让我们从数据集得到启发搜素引擎,邮件过滤系统,推荐系统,数据挖掘(啤酒和尿布) 机器学习在我们生活中随处可见。机器学习是必学的。即使想做其他方向的研究,ML也是基础1:机器学习专业术语 训练集,测试集,目标变量(如:鸟的类别)。 知识表示(如:可以采用规则集的形式,也可以采用概率的形式)。采用何种方式表示知识也很重要2:机器学习的主要任务(重要知识点) :分类,回

2015-09-09 21:57:04 486

原创 爬虫 crawl

1:明白爬虫的本质,最最核心,简单的逻辑原理 抓网页,解析网页。。。在此基础上,可以通过各种技术提升性能。(如:集群,多线程。采用框架等)通过http请求,返回的整个html网页就是个字符串,就是个字符串,就是个字符串!!!!!(解决了我长时间的困惑) 然后,针对这个字符串进行正则表达式的模式匹配。所谓的javascript技术,css等,也就是在字符串中以某种模式存在。不用去烦心这个。

2015-09-09 18:05:45 1196

原创 hadoop搭建环境(1)

Linux的使用搭建hadoop环境host网络模式,主机能上网,虚拟机也是不能上网的。net模式,桥接模式虚拟机安装。在虚拟机中进行linux系统安装很简单。(下载虚拟机软件,安装分分钟的事-》只要下好了,下对了linux版本,安装linux系统,分分钟的事。) ps:linux镜像文件.iso,有时候分为多个部分,所有要把所有部分下完。如:linux cento ***1of2,linux c

2015-09-09 18:00:57 405

原创 bae python-worker 爬虫 接下来工作

继续解决 html 返回值的问题。争取爬虫可以跑的通

2015-09-09 17:55:57 908

原创 BAE python-worker 服务

1:python-worker 可以通过新建 requirements.txt,然后添加你需要的任何 包。如:MySQL-python 2: python-worker 的main.py可以引用其他文件3:编码还是使用utf8吧。4:如,re,urllib,urllib2,这些模块可以直接import,因为已经内置了5:常出现的错误 a: 因为我是在notepad+

2015-09-09 17:54:18 1373

原创 BAE 上部署python-worker 爬虫遇到的问题

BAE上部署了python-worker类型,想部署个爬虫在上面呢。可是偏偏就是不成功。代码在本地是可以正确的爬取页面,解析页面后,提取想要的内容的。部署到BAE后,发现,页面可以抓取到,可是返回的html的长度不对:如:某个网页本来是98541,可是在BAE中抓取后,html长度就变成了28831re,正则表达式抽取模块是对的,可以按照模式正常抽取。说明解析这部分,是正确的数据库操作部分也是:可以

2015-09-09 17:34:51 1748

原创 BAE 使用2

BAE开发过程遇到的问题。教训:当用别人的框架或者平台的时候,当遇到什么问题的时候,一定首先去参考阅读,官方文档。而不是到互联网上海搜一番。 其次,遇到问题,要冷静,理清楚,在纸上写出来可能会出问题的点。一个个排查。 切忌,不要烦躁,烦躁没用的。一旦 烦躁的时候就要出去走走了喔,散散心,不要傻傻的呆在电脑前死磕~1:BAE连接mysql整体思路简单,就是要获得 host,ip,user,pwd,这

2015-09-09 17:16:19 526

原创 BAE (使用1)

使用百度云服务BAE,强烈感受到,技术变化的速度之快。关于BAE的技术贴,都已经过时了。所以,在使用别人的平台时,最靠谱的方法是,要透过官网,找到最新的平台文档。

2015-09-06 10:51:23 624

原创 欢迎使用CSDN-markdown编辑器

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2015-09-06 10:46:11 309

微信公众平台token

微信公众平台token,如果有需要,可以下载看看。

2015-10-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除