自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

求知:数据科学家之路

爱学习爱女神

  • 博客(11)
  • 收藏
  • 关注

原创 计划 | 写个包 | 基础统计学知识

用R语言写一个囊括大部分基础统计学知识的包,源于学习中经常出现不知道或找不到等问题,有了包就方便快捷。这也算是flag了,下次来记录报告进展。 1、2017/4/30 立flag,已经完成可达矩阵

2017-04-30 20:34:53 294

原创 R 语言 | 计算可达矩阵

在微博有位朋友问我可达矩阵的计算,于是发了点时间用R语言写出来了。问题如下: 计算过程: 注意:是矩阵的乘法。代码如下:A <- matrix(c(0,0,0,0,0,0,0,1,0,0,1,1,0,0,0,0,0,0,0,0,0,0,1,1,0),nrow=5)A1 <- A+diag(5)repeat{ B <- A1 * A1; if(identical(B,A1)) {pri

2017-04-30 18:05:14 4336 4

原创 linux | 下载文件

在阿里云服务器下载tar.gz文件,常用命令为 :wget先切换到指定目录,然后下载,这里以下载hadoop为例。wget http://apache.fayea.com/hadoop/common/hadoop-2.7.3/hadoop-2.7.3.tar.gz

2017-04-30 09:13:39 597

原创 python 爬虫 | 检查网站情况

这里的笔记来源于对《用python写网络爬虫》的总结,写作以记录。 版本:python2.71、网站大小估计 在谷歌或百度中输入site:域名 例如 显示这个网站有1亿0720万个网页。2、识别网站所用的技术 在爬去网站之前,了解网站使用的技术,会对爬去数据有一定的印象。这里使用builtwith模块来探测网上搭建的技术。import builtwithbuiltwith.pa

2017-04-29 16:14:07 1386

原创 python | gtts 将文字转化为语音内容

在学习july的课程: 聊天机器人 ,介绍了一个python: gtts,可以将文字转化为语音,尝试后发现效果还可以。需要在VPN下使用。例子:from gtts import gTTSimport ostts = gTTS(text='您好,您吃早饭了吗?需要我给你推荐些吃的吗?', lang='zh-tw')tts.save("hello.mp3")os.system("mpg321 h

2017-04-16 16:12:17 7542 2

原创 python | 打开浏览器webbrowser

如何用python打开浏览器并播放视频或音乐呢?这里用python的内建函数webbrowser来打开链接,并播放。例子:import webbrowserimport time time.sleep(10)total_breaks = 3break_count = 0print("This program started on " + time.ctime())while(break_c

2017-04-11 19:55:34 3861

转载 算法效果AB测试中的PV-UV不对称性

本文系转载,源地址http://www.cnblogs.com/bqzhao/p/3259380.html算法效果的AB测试,是指在相同的应用场景下,对比不同算法的效果。通常的做法是,按照PV或UV随机分配流量到算法上,计算算法的CTR或转化率进行对比。为了表述简单,我们假设参与对比的算法有两个,比较的指标是CTR。这里面的关键细节有两个:1. 如何划分浏览?2. 如何计算CTR。下面从这两个角度

2017-04-10 11:14:25 4450

原创 看到的,很深刻

请注意你的思想,因为你的思想会决定你的言语;请注意你的言语,因为你的言语会决定你的行为;请注意你的行为,因为你的行为会决定你的习惯;请注意你的习惯,因为你的习惯会决定你的命运。

2017-04-05 10:07:55 393

原创 计划

目前在北京实习,做AB测试算法工程师,工作之余也需要学习、提升自身的技能。每天7点半起床,8点40多到公司,9点至9点半正式上班打卡时间,中午12点到1点为吃饭时间,然后6点到6点半为下班打卡时间。基本上是8点后回去,回去后就想埋头睡觉。这大概是在北京工作的朋友共同的状态吧,也许是我瞎猜的,勿怪喔勿喷喔。算上去,上班之余的空闲时间很少,可能在早晨和晚上下班后可在公司干点事了。实习阶段要快点适应,同

2017-04-05 09:16:01 396

原创 python | 学习总结 urllib.request

在anaconda3下,用urllib.request包来获取数据例子:计算行数、列数__author__ = 'zhangx'import urllib.requestimport sys#读数据target_url = ("https://archive.ics.uci.edu/ml/machine-learning-databases/undocumented/connectioni

2017-04-03 17:36:41 778 1

原创 python | isinstance 判断数据类型

判断数据类型函数:isinstance格式:isinstance(object, classinfo) 判读object是否为classinfo类型,classinfo可以为: tuple,dict,int,float,list例子来解释:判断整数a1 =323if isinstance(a1,int): print (True)else: print (False)判断

2017-04-03 13:12:21 2030

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除