2017年10月_计算所培训中心

原创对于相同喜好的用户，电商高手用Spark MLlib代码如何操作？

日前，小编接触了一个概念——协同过滤。相信很朋友也是第一次听说，上网在某度搜一下，结果发现这个算法居然是很成熟的。“协同过滤简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的信息，个人通过合作的机制给予信息相当程度的回应（如评分）并记录下来以达到过滤的目的进而帮助别人筛选信息，回应不一定局限于特别感兴趣的，特别不感兴趣信息的纪录也相当重要。”通过学习，小编

2017-10-30 10:17:57 439

原创 11月6日机器学习实战直播课，超级礼包来啦！

免费线上直播课，杨文川老师首次讲这个内容。非常适合刚刚接触大数据的生瓜蛋子，以及有一定经验大数据挖掘、大数据分析的老油条！

2017-10-26 14:01:56 1137 1

原创机器学习讲座，如何利用Spark MLlib进行个性推荐？

随着互联网发展，更多电商网站更加提倡用户参与和用户贡献。而在现今的推荐技术和算法中，最被大家广泛认可和采用的就是基于协同过滤的推荐方法。这种在信息过滤和信息系统中很受欢迎的技术，与传统的基于内容过滤直接分析内容进行推荐不同。协同过滤分析用户兴趣，在用户群中找到指定用户的相似（兴趣）用户，综合这些相似用户对某一信息的评价，形成系统对该指定用户对此信息的喜好程度预测，然后推荐给

2017-10-25 15:48:21 541

原创内存虚拟化技术，具体的实现方法有哪两种？

操作系统的内存管理单元（Memory Management Unit，MMU）只能完成一次虚拟地址到物理地址的映射，但获得的物理地址只是虚拟机物理地址而不是机器物理地址，所以需要VMM参与，以获得总线上可以使用的机器地址为实现虚拟地址到机器地址的高效转换

2017-10-23 10:36:40 6228

原创企业IT 管理的一项核心技能——伙伴管理

伙伴管理已经成为企业的一项核心技能，包括选择合适的伙伴和保持长期的合作关系。IT 管理之所以复杂，大部分原因来自于它需要协调好四个不同的却又重要关系之间的矛盾，包括：IT管理者、外部 IT 伙伴、用户管理以及高层管理者。

2017-10-20 11:01:19 388

原创初识Hive：3张图了解Hive的数据类型、架构图！

Hive是一个构建在Hadoop上的数据仓库框架，可以将结构化的数据文件，映射为一张数据库表，并提供完整的sql查询功能。可以将sql语句，转换为MapReduce任务进行运行。Hive选择Hadoop来存储和处理数据，因为Hadoop有较好的性价比。Hive设计的目标是让精通SQL技能(Java较弱的)分析师，能够从存放在HDFS的大规模数据集上，运行查询。Hive 一般

2017-10-18 10:04:14 772

原创如何训练结构化思维能力？它是一种工作方法还是思维方式？

结构化思维（Structured Thinking）是指人在面对工作任务或者难题时，能从多个侧面进行思考，深刻分析导致问题出现的原因，系统制定行动方案，并采取恰当的手段使工作得以高效率开展，取得高绩效的思维方式。

2017-10-16 11:14:35 2680

原创如何设计数据仓库？粒度问题是一个最重要方面！

粒度是指数据仓库的数据单位中保存数据的细化或综合程度的级别。细化程度越高，粒度级就越小；相反，细化程度越低，粒度级就越大。

2017-10-11 16:08:20 1013

原创 Python安装中需要特别注意的一件事

默认安装的Python开发环境已经附带了很多高级数据类型，如列表、元组、字典、集合、队列等，无需进一步编程就可以使用这些数据类型的操作。

2017-10-10 10:06:12 573

中科院计算所培训中心