机器学习
文章平均质量分 70
石默研
北京大学博士后,大型互联网公司大数据智能总监,第一界中国软件业十大杰出青年候选人,曾任重点大学计算机教师,20年以上人工智能算法应用、大数据、数据架构与中台等领域的实际项目开发、设计规划与授课经验,出版技术专著三部,美国工程索引IEEE EI论文6篇,自主软件版权一项,美国软件专利一项
展开
-
隐私计算开源平台Rosetta部署分享
Rosetta是一个方便、高效又实用的隐私计算开源平台,但其部署有不少的坑,作者踩过这些坑以后,在这里跟大家作以分享,以使同学们能一次就部署成功。在Rosetta github的repo里,有关于部署步骤与环境要求,如下:环境要求:Ubuntu (18.04=)Python3 (3.6+)Pip3 (19.0+)Openssl (1.1.1+)TensorFlow (1.14.0=, cpu-only)CMake (3.10+)部署步骤:git clone -原创 2022-05-06 20:34:40 · 1377 阅读 · 1 评论 -
用MapReduce实现机器学习小例
用分布式的并发计算能力来实现机器学习算法,是AI实践领域比较重要的方向,因为对海量数据的AI计算来讲,往往单机的能力严重不足,在自己机器上做点实验进行学习可以,但在实际工程中,特别是在所谓的大数据时代,往往需要借助分布式并行计算的能力。当然,已经有很多框架,比如MPI,Hadoop的Mahout,Spark ML、参数服务器等等,在工程中可以供开发者使用,不过,如果要对用分布式来实现机器学习的方法论与过程有更深入的理解与掌握,自行编程进行相关方向的实验,是需要的,在工程中,这种深入的体验也很有可能会原创 2022-01-19 16:22:10 · 2498 阅读 · 0 评论 -
数据智能系列文章之二:机器学习的核心要素
本文介绍数据智能及机器学习方法的核心要素。从上面的定义可以看出,机器学习有三个核心要素:数据,用现在流行的提法,也可以叫大数据;算法:主要指数据处理与机器学习算法,主体关注机器学习算法;算力,即计算能力,由于进入现代,在大数据基础上进行智能计算,算力已经越来越成为一个不可忽略的要素了。1. 资料:大数据再析数据,显然是数据智能最本质的核心要素,是生产资料,是产生智能的母体。也就是说,人们所寻找的智能,蕴藏在数据之中,所有的其它要素,都只是协助从中将其发掘出来的手段而已。在BI作为数据工程主...原创 2021-06-14 12:10:04 · 2488 阅读 · 1 评论 -
数据智能系列文章之一:人工智能现象
本系列文章我们讨论数据智能,即机器学习的理论与实践中的各种问题。本小节我们讨论“人工智能现象”,对人工智能研究与应用的现状与问题进行总结,而试图解决这些问题,则正是本系列文章的目标。在实践中,人工智能近年来也产生了巨大的进展,渗透到了人类工作生活的方方面面,可以说,人类历史上从未有过人工智能如此广泛普及的时期。但如果仔细分析实践现状就会发现:虽然千人千面、自动驾驶、人脸识别、语言识别、人机对话、机器人等等人工智能应用在人们的生活中似乎无处不在,但在各产业界,关于如何定位、如何使用人工智能,却有着巨大的分原创 2021-06-12 20:03:19 · 407 阅读 · 0 评论