自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 收藏
  • 关注

转载 如何获取安卓用户的app使用频率

清晨的雾霾轻了些,但天空还是灰蒙蒙的,就像赶早班人们的心情。9点,准时赶到办公室,保洁的阿姨刚刚收拾完工具。与往常一样,径直走到自己工位,手机在机箱上轻轻一按,伴随着主板风扇的转动声,电脑系统和一个苦逼程序猿的日常一齐被START。然而,一个程序猿的日常总是充满诱惑和挑战的!显示器上的四个色块还没有散去,便听见一个清脆甜美却又略带忧郁的声音说:“如果我能知道每个安卓用户手机

2016-01-19 09:03:28 4427

转载 扒一扒Android应用的续命大法

如果你是一名Android用户,请掏出你的手机,进入应用程序管理,杀掉所有应用,然后去泡杯茶,回来再看看你的手机。如果你是一名iOS用户,请你直接去泡茶,然后回来围观前面那位Android用户。你会神奇地发现,刚刚杀掉的应用很多都自己复活了,一个个的还活蹦乱跳的,时不时给你推送几条消息。那么,问题就来了,这些应用使了什么手段学会了续命大法,能让自己死而复生呢?今天就扒一扒Android应用

2016-01-19 09:00:23 893

转载 python matplotlib中文显示问题

python中的matplotlib仅支持Unicode编码,默认是不显示中文的,如果让其默认显示中文,有下面2种方法:第一种方法:1、在python的安装目录中找到配置文件: %Python_Home%\Lib\site-packages\matplotlib\mpl-data\matplotlibrc    (如,我的是在C:\Python34\Lib\site-packa

2016-01-19 08:51:38 6459

转载 使用python pylab库 画线

pylab 提供了比较强大的画图功能,但是函数和参数都比较多,很容易搞混。我们平常使用最多的应该是画线了。下面,简单的对一些常用的划线函数进行了封装,方便使用。# -*- coding: utf-8 -*-import pylabimport randomclass MiniPlotTool : ''' A mini tool to draw lines using p

2016-01-18 10:05:35 4032

转载 【Python】Matplotlib绘图库初探

Matplotlib是Python的2D&3D绘图库,产生各种已经拷贝格式和交互幻剑中跨平台形式的印刷质量图标。Matplot语法与Matlab相似,绘图绘图功能强大,而且十分容易上手。“个人永远不能超过集体的力量”(Ken Blanchard)。Python强大的原因之一就在于其开源,有很多优秀的程序员为其提供了丰富的类库。Matplotlib就是其中之一,但他的创始人John D.

2016-01-17 10:53:29 602

转载 一篇文章读懂用户体验(上)

小开场不知道大家有没有这种经验,逛街逛到一半,突然着急地想上厕所,然后就开始狂奔搜寻,结果是越来越急。突然,你看到前方出现一间肯德基,是不是有种释,放,的,感,觉?这个时候你当然直奔肯德基,的厕所。但,结果,你发现厕所门牌是这样的:或者这样:理智告诉你,先好好判断究竟哪边才是你要去的,也就是说,你硬生生又得憋回去一下。这就是一个用户体验问题,关于交互的线索不清晰的问题(以后

2016-01-15 13:49:29 1744

转载 如何从0到1搭建电商促销系统

目录:1、三种优惠类型    1)代金券   2)满减或满赠   3)活动价2、发放优惠3、使用优惠     1)优惠展示   2)选择使用   3)使用规则   4)逆向订单的优惠处理4、总结及建议无论是电商还是O2O都在通过促销、补贴吸引客户,代金券、支付红包、下单立减、包邮、活动价各种玩法层出不穷,而这些玩法都需要在系统中抽象成

2016-01-14 11:01:13 2306

转载 [Python]网络爬虫(七):Python中的正则表达式教程

一、 正则表达式基础1.1.概念介绍正则表达式是用于处理字符串的强大工具,它并不是Python的一部分。其他编程语言中也有正则表达式的概念,区别只在于不同的编程语言实现支持的语法数量不同。它拥有自己独特的语法以及一个独立的处理引擎,在提供了正则表达式的语言里,正则表达式的语法都是一样的。下图展示了使用正则表达式进行匹配的流程:正则表达式的大致匹配过程是:

2016-01-12 15:09:09 380

转载 基于用户的协同过滤推荐算法原理和实现

在推荐系统众多方法中,基于用户的协同过滤推荐算法是最早诞生的,原理也较为简单。该算法1992年提出并用于邮件过滤系统,两年后1994年被 GroupLens 用于新闻过滤。一直到2000年,该算法都是推荐系统领域最著名的算法。      本文简单介绍基于用户的协同过滤算法思想以及原理,最后基于该算法实现园友的推荐,即根据你关注的人,为你推荐博客园中其他你有可能感兴趣的人。基本思想 

2016-01-12 10:54:03 656

转载 [Python]网络爬虫(六):一个简单的百度贴吧的小爬虫

# -*- coding: utf-8 -*-#---------------------------------------# 程序:百度贴吧爬虫# 版本:0.1# 作者:why# 日期:2013-05-14# 语言:Python 2.7# 操作:输入带分页的地址,去掉最后面的数字,设置一下起始页数和终点页数。# 功能:下载对应页码内的所有页面并存储为

2016-01-11 23:02:24 521

转载 urllib2自定义opener详解

urllib2.urlopen()函数不支持验证、cookie或者其它HTTP高级功能。要支持这些功能,必须使用build_opener()函数创建自定义Opener对象。build_opener([handler1 [ handler2, ... ]])参数handler是Handler实例,常用的有HTTPBasicAuthHandler、HTTPCookieProcessor、Pro

2016-01-11 22:02:19 312

转载 [Python]网络爬虫(五):urllib2的使用细节与抓站技巧

前面说到了urllib2的简单入门,下面整理了一部分urllib2的使用细节。1.Proxy 的设置urllib2 默认会使用环境变量 http_proxy 来设置 HTTP Proxy。如果想在程序中明确控制 Proxy 而不受环境变量的影响,可以使用代理。新建test14来实现一个简单的代理Demo:import urllib2enable_proxy = Tr

2016-01-11 17:15:48 333

转载 Python]网络爬虫(四):Opener与Handler的介绍和实例应用

在开始后面的内容之前,先来解释一下urllib2中的两个个方法:info and geturl urlopen返回的应答对象response(或者HTTPError实例)有两个很有用的方法info()和geturl()1.geturl():这个返回获取的真实的URL,这个很有用,因为urlopen(或者opener对象使用的)或许会有重定向。获取的URL或许跟请求URL不同。以

2016-01-11 16:59:13 411

转载 [Python]网络爬虫(三):异常的处理和HTTP状态码的分类

先来说一说HTTP的异常处理问题。当urlopen不能够处理一个response时,产生urlError。不过通常的Python APIs异常如ValueError,TypeError等也会同时产生。HTTPError是urlError的子类,通常在特定HTTP URLs中产生。 1.URLError通常,URLError在没有网络连接(没有路由到特定服务器),或者服务器不

2016-01-11 16:21:25 310

转载 [Python]网络爬虫(二):利用urllib2通过指定的URL抓取网页内容

版本号:Python2.7.5,Python3改动较大,各位另寻教程。所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。 类似于使用程序模拟IE浏览器的功能,把URL作为HTTP请求的内容发送到服务器端, 然后读取服务器端的响应资源。在Python中,我们使用urllib2这个组件来抓取网页。urllib2是Python的一个获取URLs(Uni

2016-01-11 15:48:55 402

转载 Amazon的推荐系统

现在的推荐系统特别火啊。做得最好的应该是Amazon了。上面是Amazon的图书推荐。用的就是著名的协同过滤(Collaborative filtering)算法。  我们用一个简单的例子来说明。 下面是一个用户购买的书籍的表格。 上面的1表示购买,0表示没有购买。 那么我们怎么来给小明推荐书籍呢? 先来看看Amazon之前的传统的协同过

2016-01-11 15:27:13 4876

转载 随机音乐播放的算法

在浏览Spotify官方博客时被一篇介绍音乐随机播放算法的博客吸引,随后对这个问题小小研究了一下。随机播放音乐,这个功能太普通以至于以前从未考虑过其背后实现逻辑。Random还是shuffle我们经常使用的随机播放功能,在外国同行口中并不是叫Random播放,而是叫Shuffle,洗牌的意思。为什么不是Random?来看两个例子。在Spotify成立之初,他们使用一种叫「Fis

2016-01-11 13:56:33 9280 1

转载 秒杀系统架构分析与实战

1.秒杀业务分析正常电子商务流程(1)查询商品;(2)创建订单;(3)扣减库存;(4)更新订单;(5)付款;(6)卖家发货秒杀业务的特性(1)低廉价格;(2)大幅推广;(3)瞬时售空;(4)一般是定时上架;(5)时间短、瞬时并发量高;2.秒杀技术挑战假设某网站秒杀活动只推出一件商品,预计会吸引1万人参加活动,也就说最大并发请求数是10000,秒杀系统需要面对的技

2016-01-08 09:34:26 589

转载 基于用户投票的排名算法(六):贝叶斯平均

上一篇介绍了"威尔逊区间",它解决了投票人数过少、导致结果不可信的问题。举例来说,如果只有 2 个人投票,"威尔逊区间"的下限值会将赞成票的比例大幅拉低。这样做固然保证了排名的可信性,但也带来了另一个问题:排行榜前列总是那些票数最多的项目,新项目或者冷门的项目,很难有出头机会,排名可能会长期靠后。以IMDB为例,它是世界最大的电影数据库,观众可以对每部电影投票,最低为1分,最高为10分。

2016-01-07 15:26:02 1794

转载 基于用户投票的排名算法(五):威尔逊区间

迄今为止,这个系列都在讨论,如何给出"某个时段"的排名,比如"过去 24 小时最热门的文章"。但是,很多场合需要的是"所有时段"的排名,比如"最受用户好评的产品"。这时,时间因素就不需要考虑了。这个系列的最后两篇,就研究不考虑时间因素的情况下,如何给出排名。得分 = 赞成票 - 反对票假定有两个项目,项目A是60张赞成票,40张反对票,项目B是550张赞成票,450张反对票。请问,

2016-01-07 15:12:12 938

转载 基于用户投票的排名算法(四):牛顿冷却定律

这个系列的前三篇,介绍了 Hacker News,Reddit 和 Stack Overflow 的排名算法。今天,讨论一个更一般的数学模型。这个系列的每篇文章,都是可以分开读的。但是,为了保证所有人都在同一页上,我再说一下,到目前为止,我们用不同方法,企图解决的都是同一个问题:根据用户的投票,决定最近一段时间内的"热文排名"。你可能会觉得,这是一个全新的课题,伴随着互联网而产生,需要

2016-01-07 14:50:20 6471

转载 基于用户投票的排名算法(三):Stack Overflow

Reddit 排名算法的特点是,用户可以投赞成票,也可以投反对票。也就是说,除了时间因素以外,只要考虑两个变量就够了。但是,还有一些特定用途的网站,必须考虑更多的因素。世界排名第一的程序员问答社区 Stack Overflow,就是这样一个网站。你在上面提出各种关于编程的问题,等待别人回答。访问者可以对你的问题进行投票(赞成票或反对票),表示这个问题是不是有价值。一旦有人回

2016-01-07 14:07:43 1513

转载 基于用户投票的排名算法(二):Reddit

Hacker News 排名算法的特点是用户只能投赞成票,但是很多网站还允许用户投反对票。就是说,除了好评以外,你还可以给某篇文章差评。Reddit 是美国最大的网上社区,它的每个帖子前面都有向上和向下的箭头,分别表示"赞成"和"反对"。用户点击进行投票,Reddit 根据投票结果,计算出最新的"热点文章排行榜"。怎样才能将赞成票和反对票结合起来,计算出一段时间内最受欢迎的文章呢?如果

2016-01-07 13:53:29 773

转载 基于用户投票的排名算法(一):Delicious和Hacker News

互联网的出现,意味着"信息大爆炸"。用户担心的,不再是信息太少,而是信息太多。如何从大量信息之中,快速有效地找出最重要的内容,成了互联网的一大核心问题。各种各样的排名算法,是目前过滤信息的主要手段之一。对信息进行排名,意味着将信息按照重要性依次排列,并且及时进行更新。排列的依据,可以基于信息本身的特征,也可以基于用户的投票,即让用户决定,什么样的信息可以排在第一位。下面,我将整理和

2016-01-07 13:34:08 2009

转载 app推送功能

相信大家对推送这项技术并不陌生。如果没听说过,那么作为一个充满好奇心的孩子,你一定想过这个问题:睡觉前我明明关闭了淘宝、网易新闻等 app,为什么第二天他们又自动出现在我手机的通知栏上呢?这其实就是推送系统干的好事:在你睡觉的时候,服务器悄悄的向你的手机推送了一个消息,然后唤醒了你已经关闭的 app。事实上,无论你愿意与否,现在大多数 ‘有节操’ 的 app,都已经内置了推送系统,并时刻准备着登上

2016-01-07 13:12:57 738

原创 需求管理的方法整理

在一款产品的生命周期中,需求始终贯穿其中,产品围绕需求而生,因需求而美。下面是本人对于需求管理的个人方法整理:【需求收集】需求的收集分为两个阶段。第一阶段在产品还未成型时,因为一个核心的理念展开了需求的前期收集,比如一个产品想要满足人们的某种欲望,那么之后的需求收集就都会围绕着这个目的展开,而需求的意义就在于通过某种方式满足这个目的。此阶段的需求主要来源于竞品分析、访谈

2016-01-07 11:09:12 5757

原创 python知识-python操作MySQL数据库

python DB APIpython访问数据库的统一接口规范DB API-连接数据库对象connection创建方法:MySQLdb.Connect(参数)connection对象支持的方法

2016-01-05 22:42:09 355

原创 python知识-错误和异常

1.常见错误:1)NameError2)SyntaxError3)IOError4)ZeroDivisionError5)ValueError2.使用try-except处理异常try:    try_suiteexcept Exception [e]:    exception_blocka.tyr用来捕获try_suite中的错误,并将错误交

2016-01-05 14:33:37 605

转载 如何解决产品游记撰写门槛过高问题

既然是UGC社区的问题,来聊聊用户对于社区的需求。粗粗看了一下,我发现,马斯洛需求层次理论只有第三层提到了社交的需求,除了最下面的两个层次是用来保证活下去之外,最高的三个层次其实是在寻求一种认同感。社交网络的本质就是寻求认同。其表现形式非常之多,评论、转发、加V、关注、等级等等等,无不是寻求认同的方式。个人觉得,我们发明“赞”, “最右”很大程度上只是为了降低评论的门槛。回到旅游产

2016-01-04 13:57:22 1121

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除