自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(90)
  • 收藏
  • 关注

原创 2019 Flags

立flag而做不到常常会被笑话, 但是还是要写下来, 原因有三:自我的经验来看有目标时候做事效率是要比无目标高很多的.在年初写下新年的目标, 也是为了督促和提醒自己更多精力放在重要的事情上面.正确的立flag和完成也是锻炼自己的执行力和成熟的方式.最重要的事情:在信仰上进步和认真: 2018年发现自己对圣经真理和教义有疏忽, 这是很需要改正的.结婚: 这是第二重要的, 和未婚妻组...

2019-12-27 10:03:38 215 1

原创 Learning to Rank 笔记

最近公司业务需要,作了很少的研究。对于一类问题,尤其是模型问题,我觉得最重要是要明白input, model和output. 看了这篇觉得这个日本小哥讲的很好https://mlexplained.com/2019/05/27/learning-to-rank-explained-with-code/最开始LTR用在信息检索,就是根据搜索词找出搜索内容,并且order要最好,就是用户最有可能需要...

2019-09-25 09:46:23 278

原创 introduction dask

OverviewDASK provides multi-core and distributed parallel execution on larger-than-memory datasets.We can think of Dask at a high and a low levelHigh level collections: DASK provides high-level...

2019-07-16 03:44:54 259

原创 Go语言极简入门教程: Go Notes

Go touringGo buildhttps://stackoverflow.com/questions/7970390/what-should-be-the-values-of-gopath-and-gorootGOPATH is discussed in the cmd/go documentation:GOROOT is discussed in the install...

2019-05-05 01:22:56 390

转载 程序员职场收藏:很有帮助的三篇文章

https://www.1point3acres.com/bbs/thread-507474-1-1.html?from=groupmessage&isappinstalled=0https://mp.weixin.qq.com/s?__biz=MzIzOTU0NTQ0MA==&mid=2247489943&idx=1&sn=d0aac843e9856d5ff23...

2019-04-28 03:29:32 262

翻译 pandas怎么过滤not in

https://stackoverflow.com/questions/27965295/dropping-rows-from-dataframe-based-on-a-not-in-condition

2019-04-17 07:29:41 2755

翻译 【给自己挖坑,翻译Queue】:解释了困扰很久的并发线程的讲解

http://masnun.rocks/2016/10/06/async-python-the-different-forms-of-concurrency/

2019-04-12 13:11:34 175

原创 讲解Joblib: running Python functions as pipeline jobs

https://joblib.readthedocs.io/en/latest/index.html稍微看了一下, 是一个小清新的工具。第一个是cache拒绝重复计算,私心觉得可以通过逻辑来避免,第二个是并行计算,把multiprocessing, multithreading几个backend做了一个整合。还可以帮你自动选择,比之前无脑multiprocessing可能优秀一些。不过在机器学习...

2019-04-11 01:23:00 327

原创 职场感受:

做好细节。今天pm开10个会,我应该用最简单的语言使他明白。在最简单的地方出错其实是很影响印象的。学习到一个方法,当情况很多的时候,比如一些数据问题,最好做成文档用来展示,一来别人也方便,清楚和节省时间,二来也避免自己以为能讲清楚其实没有。还是细节吧。...

2019-04-02 07:07:04 2192

原创 《返璞归真》“Mere Christianity ”——记录C.S. Lewis 用的比喻

这是门训的作业, 记录一下:比喻评论第一章:在现代社会谈论宗教好像让时钟倒转, 但是倒转未必是错误, 错误的时钟可能是需要倒转的好的比喻第二章:上帝更容易实现完美的顺服受苦死亡,就是说"他有优势", 好像站在岸上的人有优势拯救落水者比喻是对称的, 只是不赞同这句话, 因为耶稣神人二性,当他受苦和祷告,十分痛苦, 比如客西玛尼园的经历第二章:上帝不是因为我们好而...

2019-03-13 09:19:23 1021

原创 工具记录:最近学习机器学习加速工具

dask: 一开始是作为并行计算pandas dataframe使用的, 后来发现还很强大, 支持scikit, tpot等机器学习相关. 轻量化, 基于py社区(与之对应的是spark, 虽然有py版本, 但是本质是一个大而全的整个系统)numba:加速数学运算, 尤其原生计算和numpy计算, 特别支持挺多计算函数(random等)petastorm: uber支持的创建dataset的...

2019-03-03 08:28:04 321

原创 基督教会史Church History in Plain Language 读书笔记

读书感受:近乎一口气(两天大概十几个小时)读完这本500页左右的大部头, 真的很爽. 发现历史时间长的话真的让人通透, 很感谢雪莱把宏达的历史用这样平易的语言写出来. 我个人厚古薄今, 但是此书我非常喜欢.此为上海人民出版社的对原书第三版的译文.通过此书, 终于把教会史里面几个自己之前有些模糊的时间段弄明白了. 粗略的总结就是:初代教会大逼迫: 从五旬节圣灵降临开始耶稣基督的门徒就被逼迫,...

2019-02-02 13:42:03 3478

原创 职业目标备忘录(更新2018.12.22)

这个blog应该经常更新:V0.1.0: 2018.12.22天下武功, 唯快不破. 做的快意味着更多的试错机会, 快速把想做的尝试, 慢慢就会找到方向和深度.第一, 要找到工作, 尽量争取一下Capital one.然后是自我提升部分(在已经工作的前提下), 目前的想法有:保持刷题: 因为刷题这种东西根本三五个月不够, 之前是为了找工作甚至有背题的嫌疑, 稳定下来, 要有策略, 追...

2018-12-23 02:37:19 289

原创 Python中yield

这个讲解特别好, https://stackoverflow.com/questions/231767/what-does-the-yield-keyword-do, 果然是面向stackflow编程.一句话总结: yield在函数中相当于return, 只不过它return的是generator迭代器, 而不是实际数据迭代器的性质: 只能使用一次, 用完就失效了; 不占内存, 用的时候调用...

2018-09-07 08:27:51 137

原创 python基础: 正则表达式

今天才发现yield真个东西,真是太弱鸡了整理了一下相关资料,记录在下面.python 正则表达式 re 被老铁奚落一通, 所以直面问题,不要逃避了.仔细把文档看了,记录在下面 首先: 有一个在线查看效果和讲解的网站,太棒了https://regexr.com/ 其次: 文档在这里:文档是Python3的 https://docs.python.org/3/howto/regex.h...

2018-09-07 08:24:42 305

NLP论文:

Distributed Representation引入distributed representation是为了解决维度爆炸,使用更小的向量空间一些常见的训练词向量工具: S-Space(JAVA) Semanticvectors(JAVA) Gensim(Python and below) Pydsm Dissect FastText尤其是CBOW和Skip-gram...

2018-08-06 10:54:41 1075

原创 博客笔记八: [Zylotech] 用户流失模型以及召回的用户remarket

https://www.zylotech.com/blog/the-mechanics-of-predicting-customer-churn-part-1 https://www.zylotech.com/blog/the-mechanics-of-predicting-customer-churn-part-2 https://www.zylotech.com/blog/the-mech...

2018-07-31 01:56:13 713

原创 读书笔记&感想:清教徒的脚踪

总体感受:非常有共鸣的一本书,是钟马田牧师等设立一年一度的清教徒论坛的演讲合集,不过主要是每年钟马田做结束讲演的合集。也有一些是其他人的文稿。倾听大师演讲真的是享受。从贯穿教会史,思想史,对清教徒所处时代有了更很宏观的图像,对他们群体的细节也有了更加细节的感受。和钟马田牧师在多个方面有相通和共鸣。我总结的一些清教徒的特点和标签:加尔文神学,特别强调实践(教会体制,崇拜传统,服饰等等彻底...

2018-07-16 05:48:31 1183

原创 机器学习工具包--待续

基础的pandas,sklearn等等就不说了,最近因为比赛,学了几个特别给力的工具。感觉世界被打开了。自动机器学习他们采用不同的办法,有的是给予进化遗传算法,有其他的。这里几个工具是把特征选择和调参都给包含了。功能很强大。 - TPOT,主要用这个,很强大 - AutoML - Auto-sklearn,特点就是与sklearn无缝对接。 - H2O,口碑也很好,不过没太常...

2018-07-14 06:07:23 867

原创 读书笔记&感想:做个真门徒

总体感受:斯托得是当代著名的基督教作家,我对他不是很熟悉,但是有一位弟兄再朋友圈多次推荐他的书籍。《作个真门徒》这本书一直有所耳闻,一个偶然的机会从一个弟兄那里看到,遂借来一睹为快。这本书原名叫做Why I am a Chiristian,为什么我成为一个基督徒。不过本书并不是个人传记,而是通过讨论他自己在信仰上一些特别关注的方面,最终全人被福音所征服的心路历程,不是个人传记。写的很简洁...

2018-07-07 05:50:38 1125

原创 读书笔记&感想:人啊你往何处去

第二章 提到说圣经是唯一一本提供了救赎方法的经典第三章 亚当犯罪我要受苦,不公平?亚当犯罪如同黑冷的河水在深峡奔走,不能流到快乐的平原,因为他不能,里面没有改变的力量。如同人类不能自救。基督拯救是“人从罪的死亡中得救的唯一希望“作者说罪恶在造人以前就存在,否则不用造分别善恶果子的树。保留态度。不喜欢美国许多作家对圣经的过度想象,这里过度渲染魔鬼性格能力。第六章 犯罪基督徒的孤独,...

2018-06-29 09:33:24 1002

原创 git学习笔记

跟着这个教程:https://git-scm.com/book/zh/v1/ 也参照了:https://www.jianshu.com/p/08b7048ec925【0】命令行git init 把当前的目录变成可以管理的git仓库,生成隐藏.git文件。git add XX 把xx文件添加到暂存区去。git commit –m “XX” 提交文件 –m 后面的是注释。git...

2018-06-27 10:36:20 126

原创 博客笔记七: [Airbnb] 赢家诅咒在ab test的思考---为什么三个好的假设一起合作不如分开单干效果之和?

原文标题:Selection Bias in Online Experimentation Thinking through a method for the Winner’s Curse in A/B testing; 原文地址:https://medium.com/airbnb-engineering/selection-bias-in-online-experimentation-c3d...

2018-06-02 05:22:34 692 1

原创 博客笔记六: [Airbnb] 自动机器学习automated ml

原文标题:Automated Machine Learning — A Paradigm Shift That Accelerates Data Scientist Productivity @ Airbnb 原文地址:https://medium.com/airbnb-engineering/automated-machine-learning-a-paradigm-shift-that-ac...

2018-05-31 22:53:50 877

原创 博客笔记五: [Airbnb] 信用卡欺诈的loss function设计

原文标题:Fighting Financial Fraud with Targeted Friction作者:David Press原文地址: https://medium.com/airbnb-engineering/fighting-financial-fraud-with-targeted-friction-82d950d8900e面对问题:别人使用偷来的卡,真正持卡...

2018-05-31 00:49:44 443

原创 python三元运算符

为真时结果 if 判断条件为真 else判断条件为假时的结果 x = 5 if y=1 else 6 就是说y=1则x=5,否则x=6

2018-05-30 04:35:20 790 2

原创 博客笔记四: [Airbnb] word embedding改编,list embedding表达相似性用于推荐系统

原文标题:Listing Embeddings for Similar Listing Recommendations and Real-time Personalization in Search Ranking By Mihajlo Grbovic, Haibin Cheng, Qing Zhang, Lynn Yang, Phillippe Siclait and Matt Jones ...

2018-05-30 01:43:40 2515

原创 使用sequel导入cvs to mysql一个坑

把csv直接点点点拖拽import的功能还是很好用,省去了写脚本的麻烦。但是第一次会有点麻烦,reading之后记得进行columns对应,自动对应会对错。 第二个坑是日期要符合sql格式,要不然弄出来不对 ...

2018-05-25 22:29:51 3346

原创 Automated(AutoML) Machine Learning 探索: TPOT文档阅读

http://epistasislab.github.io/tpot 花了半天时间探索自动机器学习工具包,主要探索了tpot,其他很著名的还有suto sklearn, datarobot(付费),还有基于java和图形界面的Auto-WEKA。更多见这里: https://www.evget.com/article/2017/10/30/27128.html概述: 采用遗传算法,g...

2018-05-22 01:09:39 1691

转载 转载:「特征工程」与训练测试集合划分(原标题“警惕「特征工程」中的陷阱”)

博主按: 这是我转的第一篇文章,实在是因为欲罢不能,不转不行。说到心坎上去了。测试集训练集划分和训练中关系问题,在工作中常常遇到。自己于是思考了一下,在知乎上看了一个相关问答,不谋而合。直到看到本文,描述清楚有完整。不失为好的总结。警惕「特征工程」中的陷阱 知乎用户:微调 原文地址:https://zhuanlan.zhihu.com/p/33651227特征工程(Feature E...

2018-05-20 05:26:42 2766 3

原创 博客笔记三: [Airbnb] data science的pipline,工业级的解决

https://medium.com/airbnb-engineering/using-machine-learning-to-predict-value-of-homes-on-airbnb-9272d3d4739d 作者是:Robert Chang1. Customer Lifetime Value (LTV)客户生命周期价值模型, 应用场景: At e-commerce c...

2018-05-18 23:11:02 587

原创 博客笔记二: [京东白条,美团] 用户评分卡,在线广告模型

*后者是前者遇到问题搜索看到的,放一起了。前一阵址wayfair猛搞一通积累了8,9篇。这两天有点乱了,还是要集中精力。 先把netflix看完,从marketing开始看, 而且要深入。注意和自己实在不相干的就不要强迫自己看了。1. 线性模型会遇到两个问题:一是非线性特征的学习,比如年龄。一般使用的方法是进行变量离散化,把年龄分成不同的段或者使用稀疏编码或者自编码等算法对品类或者其他信...

2018-05-18 04:52:35 339

原创 博客笔记一: [Netflix] Data Science @ Netflix & Promoting Netflix Originals!

之前喜欢用笔来记,现在发现效率有点低,放在csdn上吧。 Kelly Uphoff https://www.linkedin.com/pulse/data-science-netflix-promoting-originals-kelly-uphoff/?lipi=urn%3Ali%3Apage%3Ad_flagship3_profile_view_base_post_details%3Bxz...

2018-05-17 12:53:04 251

原创 机器学习补漏之归一化

最近在公司里面做相关内容,发现许多理论并不坚固。归一化就是一个。1. 只能在训练集当中,然后应用到测试集上面。不能两部分一起归一化, 也不能各自用自己数据归一化。 因为我们默认两部分都有足够的数据,并且数据分布相同。当然最重要的是,测试集是不可以偷看的,更不要说计算这些统计数据。sklearn.preprocessing.StandardScaler方便把训练集上面的操作和数据对测试集也做...

2018-05-17 12:51:48 242

原创 sklearn里面knn调参数以及分类器效果评估方法

当然文档写的很好了,多而全面, 我这里只是针对自己情况做个学习的记录 http://scikit-learn.org/stable/modules/neighbors.html#classification http://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KNeighborsClassifier.html...

2018-05-17 12:50:52 20386 1

原创 《所谓情商高,就是会说话》读书笔记(六)——应对语言暴力

1. 应对刁难直接真诚的回答借题发挥转换人物角色,颠倒过来应对对方2. 自嘲好处多多3 . 反击羞辱反击要有力,坚决(这个好)打破僵局,问他,你为什么存心让我下不来台,能告诉我你为什么这么做吗? 你有毛病吗?我的毛病就是罪恶感,因为把上一个这么问的人给打了有,不过你走开的话就没了(然后走开)你父母怎么教养你的教养我不要回答问这么没素质话的人你以为你是什么人你自以为是什么人难道没

2018-05-02 10:03:25 585

原创 《所谓情商高,就是会说话》读书笔记(五)——说话分寸

1. 开玩笑注意避开别人短处痛处,更不能讽刺别人滑稽的动作不要重复做不要举止反常,会使别人感到怪异不要尴尬硬开玩笑,勉强冷笑话不要自己先笑独创的笑话要使人快乐,不要只是为了彰显自己会抖机灵2. 敢于说 不先表示同情,赞美,再加以拒绝其他几个觉得都不好

2018-05-02 09:53:00 505

原创 《所谓情商高,就是会说话》读书笔记(四)——尊重对方

1. 尊重的原则给对方台阶下每个人都有自尊2. 不要无谓争执不要攻击对方不要好为人师对于自大的人,方法就是任凭他3. 避免争论欢迎不同的意见不要太相信自己的直觉耐心听完,仔细考虑真诚4. 批评的情商态度鲜明,不要含糊,映射旁敲侧击(好难好难) 不光是错误,最好指出怎么办替对方想一想注意场合,公公场合给人留面子口气温和5. 不背后议论别人论断你不要参与有意见当

2018-05-02 09:41:45 796

原创 《所谓情商高,就是会说话》读书笔记(三)——注意礼貌

1. 礼貌用语接吻,请教,借光,请教,赐教,辛苦,麻烦,费神,费心,劳神,打搅,拜托,承蒙关照见面说 你好,在美国,这个真的好使多说 请,对不起,谢谢2. 感谢 立刻表达真诚感谢直接,不含糊当面,不要委托别人指名道姓感谢主动,及时!3. 说好 对不起勇于承担自己的责任及时不方便直接要借物传情(这个有点扯)持之以恒,真伤心了,谁能马上原谅你直接,不要找借口;不要轻描淡写,

2018-05-02 09:19:41 661

原创 《所谓情商高,就是会说话》读书笔记(二)——打动人心

1. 少说“我“ “我“ “我“多说 你我 改为 我们2. 不要直接说 你错了3. 好的说话风格简洁明快语气肯定, 少说 大概,差不多,也许思路清晰 语调自然,不要阴阳怪气养成好的习惯,口头禅4. 多谈对方感兴趣的善意建议记住对方说过的话注意对方微小变化,服饰发型等等呼叫对方名字,记住名字细节上投其所好(这个有点宽泛)

2018-05-02 09:06:11 1098

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除