自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Lenskit

逆水行舟 不进则退

  • 博客(5)
  • 资源 (6)
  • 问答 (2)
  • 收藏
  • 关注

原创 python选取特定列——pandas的iloc和loc以及icol使用(列切片及行切片)

假设df是一个dataframe,列名为A B C D具体如下:A B C D0 ss 小红 81 aa 小明 d4 f f6 ak 小紫 7dataframe里的属性不是指定的,空值默认为NA。一、选取标签为A和C的列,并且选完的对象类型还是dataframedf = df.loc[...

2017-03-14 19:14:19 239169 3

原创 python连接数据库——create_engine和conn.cursor

python连接数据的方法:一种是导入sqlalchemy包,另一种是导入psycopg2包。具体用法如下(此处以postgre数据库举例)

2017-03-14 18:44:39 23365 6

原创 (3)hadoop学习——namenode的fsimage与editlog详解

Namenode主要维护两个文件,一个是fsimage,一个是editlog。fsimage保存了最新的元数据检查点,包含了整个HDFS文件系统的所有目录和文件的信息。对于文件来说包括了数据块描述信息、修改时间、访问时间等;对于目录来说包括修改时间、访问权限控制信息(目录所属用户,所在组)等。

2017-03-10 14:15:21 15839 1

原创 (2)hadoop学习——hdfs架构详解

Hadoop整体架构架构:  1. 底层——存储层,文件系统HDFS  2. 中间层——资源及数据管理层,YARN以及Sentry等  3. 上层——MapReduce、Impala、Spark等计算引擎  4. 顶层——基于MapReduce、Spark等计算引擎的高级封装及工具,如Hive、Pig、Mahout等

2017-03-10 11:18:44 2175

原创 (1)hadoop学习——hadoop的前世今生

事物存在必然有它的意义,hadoop的发展可以说是必然的趋势。当数据进入爆发式增长的时代,摩尔定律变得越来越不适用,原有的存储方式和计算方式已经跟不上处理的节奏了。原有的对应方式:加大磁盘空间(1T到100T?),加强cpu核心数(现在已经是8核,还能大到100核不成?计算机发热也是个问题)所以,谷歌的gfs和mp在众人的期盼下登场了(03和04年发布了两篇论文)。

2017-03-10 09:51:06 1775 2

scala安装包

最新scala安装包,

2018-09-30

算法导论中文版

算法导论中文版,第三版,有笔记,很详细,欢迎大家下载

2018-09-26

集体智慧编程searchindex.db

集体智慧编程第四章需要的searchindex.db

2016-04-18

waffles工具

Waffles 英文原意是蜂蜜甜饼,在这里却指代一个非常强大的机器学习的开源工具包。Waffles里包含的算法特别多,涉及机器学习的方方面面,推荐系统位于 其中的Waffles_recommend tool,大概只占整个Waffles的1/10的内容,其它还有分类、聚类、采样、降维、数据可视化、音频处理等许许多多工具包,估计能与之媲美的也就数Weka了。

2016-04-07

SVDFeature

最新的SVDFeature工具,里面还有我自己找的几篇manual。 一个feature-based协同过滤和排序工具,由上海交大Apex实验室开发,代码质量较高。在KDD Cup 2012中获得第一名,KDD Cup 2011中获得第三名,相关论文 发表在2012的JMLR中,这足以说明它的高大上。 SVDFeature 包含一个很灵活的Matrix Factorization推荐框架,能方便的实现SVD、SVD++等方法, 是单模型推荐算法中精度最高的一种。SVDFeature代码精炼,可以用 相对较少的内存实现较大规模的单机版矩阵分解运算。另外含有Logistic regression的model,可以很方便的用来进行ensemble。

2016-04-07

win32 简单计算器

利用vc++,基于win32的简单计算器,可以完成+-*/开方求余计算。

2015-03-05

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除