自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

ai_1046067944的专栏

Data Mining Learner

  • 博客(50)
  • 资源 (8)
  • 论坛 (1)
  • 收藏
  • 关注

原创 Pyspark can't pickle method_descriptor

如有不妥之处,欢迎随时留言沟通交流,谢谢~ 其实错误背后的理论原因没理解很清楚,麻烦大神帮忙解答下? 错误代码: from impala.dbapi import connect is_test = False host = '192.168.0.1' if is_test else '192.168.0.1' conn = connect(host=host, port=25001, t...

2018-07-23 15:22:43 1098 1

原创 Pyspark连接Kudu

如有不妥之处,欢迎随时留言沟通交流,谢谢~ 1、 Pyspark读Kudu(linux下提交任务ok) import pyspark pyspark --jars /home/zwshi/kudu-spark2_2.11-1.6.0.jar # 启动 sqlContext = pyspark.sql.SQLContext(spark) # 创建sql连接 df = sqlContex...

2018-07-23 11:56:10 2273

转载 Hadoop分布式环境下的抽样技术

1. 问题由来 Google曾经有一道非常经典的面试题: 给你一个长度为N的链表。N很大,但你不知道N有多大。你的任务是从这N个元素中随机取出k个元素。你只能遍历这个链表一次。你的算法必须保证取出的元素恰好有k个,且它们是完全随机的(出现概率均等)? 这道题的解法非常多,网上讨论也非常热烈。本文要讨论的是,这个问题是从何而来,有什么实用价值? 自从有了Hadoop之后,该问题便有了

2013-09-14 16:36:27 733

转载 如何评价《Big Data:大数据时代》这本书?

出处:http://www.zhihu.com/question/20666694 花了三天的零碎时间大致看完了舍恩伯格的《大数据时代:生活、工作、思维的大变革》。我看推荐说这是“迄今为止最好的一本大数据专著”。目前公司在搞Hadoop、大数据应用,外面各类零碎的资料也非常多,那么想我应该去看一下这“最好”的专著吧。 买回来看完的感觉是平平而已。个人看法,在五分制下,大概也就是最多打三分。

2013-09-14 16:11:19 3562 1

转载 Java正则表达式应用总结

Java正则表达式应用总结   一、概述   正则表达式是Java处理字符串、文本的重要工具。   Java对正则表达式的处理集中在以下两个两个类: java.util.regex.Matcher   模式类:用来表示一个编译过的正则表达式。 java.util.regex.Pattern   匹配类:用模式匹配一个字符串所表达的抽象结果。 (

2013-06-22 13:25:51 510

转载 R与JAVA的整合

文章转自http://jliblog.com/archives/10   R是统计计算的强大工具,而JAVA是做应用系统的主流语言,两者天然具有整合的需要。关于整合,一方面,R中可以创建JAVA对象调用JAVA方法,另一方面,JAVA中可以转换R的数据类型调用R的函数,互相取长补短。现在也有一个项目JGR,用JAVA做R的图形界面,可以实现高亮显示自动补全等,还能让JAVA和R互相调用。

2013-05-26 11:24:14 1744

转载 从Java里调用R – 使用Rserve

文章来自:http://shao-fan.com/blog/use-rserve-in-java.html java中设置调用R语言-使用JRI方法,有一些弊端: R需要与JVM运行在同一台机器上,当R需要运行大型计算时,会耗用大量CPU与内存,因此会影响到JVM的性能 JRI的设置需要本地库的支持,运行的时候还是有些麻烦的 Rserve可以解决这两个问题,同时也有JRI一样的易用性。它

2013-05-26 11:20:12 5795 2

转载 从Java里调用R – JRI的设置方法

文章来自:http://shao-fan.com/blog/eclipse-jri.html JRI允许用户从Java里面调用R的功能,而Eclipse是目前最常用的Java开发环境。本文介绍在Eclipse里设置JRI的方法。 环境: Windows 7 32bit Eclipse 3.6 R 2.13.1 rJava 0.9-1 1.在R里安装rJava扩展包。JRI已经被包含在

2013-05-26 11:17:25 2611

转载 RWeka用法

转载地址http://blog.sina.com.cn/s/blog_551d7bff01016qa1.html 今天在找关联规则相关的资料时候,无意发现R语言中文论坛,虽然里面的资料有限,但是很有价值,譬如RWeka,一种开源的机器学习工具,在此予以介绍: 1)Weka: Weka有两种意思:一种不会飞的鸟的名字,一个机器学习开源项目的简称(Waikato Environment for

2013-05-25 12:36:13 1947

转载 R语言与数据挖掘学习笔记(1):数据挖掘相关包的介绍

摘要: 今天发现一个很不错的博客(http://www.RDataMining.com),博主致力于研究R语言在数据挖掘方面的应用,正好近期很想系统的学习一下R语言和数据挖掘的整个流程,看了这个博客的内容,心里久久不能平静。决定从今天开始 ... 今天发现一个很不错的博客(http://www.RDataMining.com),博主致力于研究R语言在数据挖掘方面的

2013-05-25 10:48:11 1898 1

小型模拟合同信息管理系统

数据库课程设计之合同管理系统,里面包含数据库文件,很好使用,欢迎共享。

2011-01-12

albert_classify.zip

提供bert分类模型,使用pytorch开发,已经训练好,可以下载下来直接使用,不需要重新训练,如有问题,请提示,谢谢

2020-07-16

小型宾馆信息管理系统

独立编写的数据库课程设计——宾馆管理信息系统,欢迎参观。

2011-01-07

小型宿舍管理系统课程设计

数据库课程设计之小型宿舍管理系统,含有数据库文件,欢迎大家共享!

2011-03-11

hbase_py3.zip

无奈没有积分,逐个问题修复,免费给大家,喜欢的点个赞,python3读取Hbase通过Thrift操作时用到hbase-thrift包,但是运行时报错IOError,ttypes,xrange,iteritems等错误。

2019-09-30

C#电子购物商城系统

数据库课程设计做的项目———— 电子购物商城系统 含有数据库 欢迎共享

2011-06-06

小型图书馆信息管理系统

本学期的数据库课程设计内容,其中包好数据库文件,和源程序,图书馆系统。

2011-01-07

人事/工资/考勤管理系统

使用C#数据课程设计--人事/工资/考勤管理系统,包含有数据库文件,以及实验报告!

2011-03-27

C++调试时出现 unhandled exception Access Violation

发表于 2012-10-12 最后回复 2012-10-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除