- 博客(7)
- 资源 (8)
- 收藏
- 关注
原创 安装intelij + scala + sbt,手动、离线、公司
公司上班,开发环境是在虚拟桌面 ,离线环境下配置intelij 需要手动安装 scala、sbt 插件。 intelij要对应固定的插件版本 我的是: ideaIC-2016.2.5 + idea-sbt-plugin-1.8.0+ scala-intellij-bin-2016.2.1 intelij 下载地址:https://confluence.jetbrains.com/displa
2016-12-30 10:54:56 1928
原创 python 爬虫 beautifulsoup example 例子
今天第一次用python的beautifulsoup,虽然比较生疏,但还是爬下来了。 爬的网站是: 网站排行 爬取的内容:包括网站的url, aleax排名,百度权重, PR等 import urllib2 import pandas as pd from bs4 import BeautifulSoup def urlprocess(url): u = url.replace('
2016-04-19 16:56:23 1640
原创 python pandas 函数累积
pandas.min http://stackoverflow.com/questions/25479607/pandas-min-of-selected-row-and-columns
2016-04-18 11:14:47 1563
转载 Hadoop,Spark和Storm
Hadoop,Spark和Storm 由于Google没有开源Google分布式计算模型的技术实现,所以其他互联网公司只能根据Google三篇技术论文中的相关原理,搭建自己的分布式计算系统。 Yahoo的工程师Doug Cutting和Mike Cafarella在2005年合作开发了分布式计算系统Hadoop。后来,Hadoop被贡献给了Apache基金会,成
2016-04-14 17:54:08 602
原创 anaconda conda install 安装包
linux下加入路径 export PATH=~/anaconda/bin:$PATH conda install ××
2016-03-29 10:02:47 10248
原创 one-hot enconding,类别型特征,非数值型特征。
在计算广告领域,对于CTR,CVR,反作弊等内容时,对于categorical features,时常会用one-hot enconding 的处理方法。 借用互联网已有的博客, 在很多机器学习任务中,特征并不总是连续值,而有可能是分类值。 例如,考虑一下的三个特征: ["male", "female"] ["from Europe", "from US", "from
2016-03-04 16:07:17 4593
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人