关闭

关联分析之Apriori算法

1.数据挖掘与关联分析 数据挖掘是一个比较庞大的领域,它包括数据预处理(清洗去噪)、数据仓库、分类聚类、关联分析等。关联分析可以算是数据挖掘最贴近我们生活的一部分了,打开卓越亚马逊,当挑选一本《Android4高级编程》时,它会不失时机的列出你可能还会感兴趣的书籍,比如Android游戏开发、Cocos2d-x引擎等,让你的购物车又丰富了些,而钱包又空了些。 关联分析,即从一个数据集中发现项之间的隐...
阅读(26) 评论(0)

kafka客户端启动出错

本地虚拟机搭建的kafka伪分布式,三个broker对应的配置信息分别对应config中的server.properties,server-1.properties,server-2.properties 启动完zookeeper后,分别通过: bin/kafka-server-start.sh config/server.properties bin/kafka-server-start.s...
阅读(59) 评论(0)

indices should be one-based and in ascending order

MLUtils.loadLibSVMFile数据集标记的index是从1开始,如下:此时可以正确执行,输出:当index从0开始时:便会报错:...
阅读(55) 评论(0)

windows安装Jupyter出错:error: Unable to find vcvarsall.bat

Windows通过:pip3 install jupyter 安装Jupyter时,报错: building ‘zmq.libzmp’extension error: Unable to find vcvarsall.bat解决方法:去这里下载Visual C++ 2015 Build Tools,之后直接默认安装即可,安装时间会有些长,安装成功后重新 pip3 install jupyte...
阅读(42) 评论(0)

Windows安装lxml

首先在Pycharm中直接安装,安装失败 其次在命令行通过pip安装,仍旧失败,经查询发现在Windows上直接安装lxml几乎都是失败的,正确的安装方式为: 1、去网站lxml下载对应的lxml的.whl文件,而对应的版本应该如何看呢,首先打开命令窗口,执行python,接着在python shell中执行: import pip;print(pip.pep425tags.get_suppo...
阅读(41) 评论(0)

Hadoop下TreeMap的使用

最近在Hadoop下写Topk算法时,用到了TreeMap,它的API很适合该算法,比如: TreeMap...
阅读(57) 评论(0)

Python中的__name__属性

每一个Python模块(.py文件)都会有一个”__name__”属性,所以我们可以在任何模块中通过print __name__来打印当前的__name__值。 在本模块主动执行时__name__ =__main__,被其它模块调用执行时(这里假设本模块为test1.py,被test2.py模块调用执行) ,__name__ = test1如下图: com.driver是test1所在包...
阅读(42) 评论(0)

linux下查看Python安装路径

Centos下是原生支持Python的,在eclipse中安装Python插件后需要关联安装路径,可通过以下命令查看Python安装路径 python import sys print sys.path...
阅读(66) 评论(0)

粗粒度与细粒度

个人理解粗粒度与细粒度的关系就是一个由粗糙到细化的过程。比如 在java中我们为了类的高复用性,经常会把一个功能复杂的类(粗粒度)细分为几个简单的功能单一的类(细粒度),这就是一个细粒度的设计模式。再比如 我们设计数据库时,原则上应该尽量减少表的数量以及表之间的连接,为此,能够设计为一个表的就不会将其分开为多个表。这就是一个粗粒度的设计模式。...
阅读(77) 评论(0)

Linux中“is not in the sudoers file”解决方法

最近虚拟机装了个RedHat Enterprise Server 5,用惯了Ubuntu,觉得不太适应。   当在终端执行sudo命令时,系统提示“cuser is not in the sudoers file”: $ sudo ls Password: cuser is not in the sudoers file.  This incident will be reported.   其实就...
阅读(107) 评论(0)

hive启动报错: Hive metastore database is not initialized

解决方法:执行 schematool -dbType mysql -initSchema即可...
阅读(45) 评论(0)

Linux学习中遇到的命令积累

图形界面的安装: 第一步:yum -y groupinstall “Desktop” 第二步:yum -y groupinstall “X Window System”...
阅读(54) 评论(0)

win10专业版激活

折腾了半天,总是出现产品钥匙什么的出错,最后在官网下载了激活工具,链接:win10专业版激活工具 ,下载后里面的压缩包里有激活说明,很简单,之后就激活成功了。...
阅读(51) 评论(0)

鸟哥私房菜中的“od -t oCc /etc/issue”的意思

对这块有些困惑,搞了搞最后发现,其实 od -t oCc /etc/issue 等价于 od -t oC -t c /etc/issue,什么意思呢,首先,找男人时(man od)会发现: 即:C代表的是char的size当我们执行 od -t oc /etc/issue 时,如下图: 会发现上下无法对应上,这是因为,od命令默认是按Int读取数字的,而Int是按4字节分割的,一行只有...
阅读(105) 评论(1)

Linux(centos5.5)中shutdown命令出错:bash: shutdown: command not found

这里是用户权限的问题,只需切换到root用户即可,而且必须通过”su - root”来切换,而不是”su“切换,因为“ su ”只是切换了用户并没有切换环境,而“su - root”同时切换了用户与环境...
阅读(68) 评论(0)
24条 共2页1 2 下一页 尾页
    个人资料
    • 访问:2098次
    • 积分:252
    • 等级:
    • 排名:千里之外
    • 原创:22篇
    • 转载:2篇
    • 译文:0篇
    • 评论:4条
    最新评论