机器学习
文章平均质量分 51
haimianjie2012
专注AI Complier,异构并行计算,HPC高性能计算,计算机视觉,深度学习和机器学习,C++开发;也写一些随笔读书笔记,面试题解析和求职攻略
展开
-
深度学习编译器开发的那些事儿
岗位要求来自字节跳动的招聘要求岗位:编译器开发工程师 3-5年 30-60K 15薪职位详情:加分项编译器优化中间件深度学习编译器学习笔记和实践体会 - 知乎 (zhihu.com)初识XLA - 知乎 (zhihu.com)XLA:优化机器学习编译器 | TensorFlow (google.cn)TVM: Deep Learning模型的优化编译器(强烈推荐, 附踩坑记录) - 知乎 (zhihu.com)用谁都能看懂的方法解释分布式系统, 大概....原创 2021-07-22 15:25:44 · 633 阅读 · 0 评论 -
【百面】机器学习的概率图模型
马尔可夫网络和贝叶斯网络的联合概率分布是什么?贝叶斯网络的联合概率分布是概率有向图模型,比如HMM隐马尔可夫模型,是一个时许的概率模型,它的变量可以分为状态变量和观测变量,状态变量和观测变量各自都是一个时间序列,每个状态/观测值都和一个时刻对应。马尔可夫网络的联合概率分布是概率无向图模型,多个变量间的联合概率分布可以基于团分解维多个势函数的乘积,势函数只与一个团相关。中文分...原创 2019-09-05 14:09:59 · 231 阅读 · 0 评论 -
百度认证_机器学习入门笔记
更多关于百度深度学习认证1.监督学习与非监督学习简介1.1 机器学习基本概念1.2 监督学习简介1.3 非监督学习简介1.4常见算法简介2.经典监督学习算法-决策树2.1决策树总体概览2.2 信息论-信息熵2.3 信息论-交叉熵与KL散度2.4 属性选择的依据2.5 剪枝操作2.6 决策树的拓展2.7 编程实现(python)3. 经典监督学...原创 2019-07-31 09:43:16 · 232 阅读 · 0 评论 -
《百面机器学习算法工程师带你去面试》学习笔记
《统计学习方法》https://github.com/pbharrin/machinelearninginactionpython3实现。《百面机器学习算法工程师带你去面试》了解机器学习中特征工程和模型评估:8月20日1、学习绪论视频,了解预备知识2、学习《百面机器学习》1.1-1.7,2.1-2.7本节将会向大家介绍特征工程和模型评估当中的一些知识点。特征工程是对原始...原创 2019-07-25 10:05:12 · 916 阅读 · 0 评论 -
运用sklearn学习库实现逻辑回归实例
1.导入库并建立训练模型2.运用模型预测,并打印结果3.python源代码:# coding: utf-8# In[1]:from sklearn import linear_model# In[6]:x = [[20,3], [23,7], [31,10], [42,13], [50,7], [60,5]...原创 2019-02-02 14:11:40 · 1212 阅读 · 0 评论 -
深度之眼学习笔记
机器学习西瓜书学习笔记原创 2020-05-13 09:17:10 · 769 阅读 · 0 评论 -
西瓜书学习笔记:支持向量机(6.1-6.2)笔记
机器学习西瓜书学习笔记目录1.支持向量机原型模型的建立和求解1.1常见的几何性质1.2SVM原始公式的导出1.3SVM的性质为什么?为什么支持向量机平面在上?2.SVM对偶形式的推导2.2对偶问题介绍z3.SVM的求解算法SMO1.支持向量机原型模型的建立和求解1.1常见的几何性质点到平面的距离公式推导1.2SVM原始公式的导...原创 2019-12-17 00:03:56 · 445 阅读 · 0 评论 -
西瓜书学习:特征降维(10.1-10.3)
特征降维的意思就是原有的一组特征经过数学变换,变换成数量更少的一组特征。通常特征降维主要有两种目的,第一,减少特征维数,使计算开销更小;第二,使转换后的低维特征更具有特征性,使学习器学习起来更容易线性判别分析:有监督降维主成分分析PCA:无监督降维。为什么要使用PCA?...原创 2020-01-14 10:49:53 · 255 阅读 · 0 评论 -
SVM问题的求解方法SMO算法
1.SMO算法思路讲解列表就是西瓜书上面的公式6.112.SMO算法简单实现的点就是支持向量机上面的点。30:43分钟开始讲code example自己实现一个SMO算法:参考文献:SVM SMO算法代码详细剖析机器学习算法整理(七)支持向量机以及SMO算法实现...原创 2019-12-19 20:51:48 · 377 阅读 · 0 评论 -
西瓜书学习:决策树(4.1-4.2)笔记
机器学习西瓜书学习笔记目录1.证明信息熵Ent(D)满足:2.信息增益Gain(D,a)3.CART算法1.证明信息熵Ent(D)满足:信息熵定义: 其中,是第k类样本占比例,所以有:且如果令,那么信息熵Ent(D)可以看作一个n元实值函数: ...原创 2019-12-09 20:25:32 · 505 阅读 · 0 评论 -
机器学习西瓜书学习笔记
今天开始学习机器学习西瓜书了,mark一下:2019年12月4日西瓜书学习:决策树(4.1-4.2)笔记,2019年12月9日西瓜书学习笔记:支持向量机(6.1-6.2)笔记西瓜书学习:特征降维(10.1-10.3)...原创 2019-12-04 19:43:31 · 428 阅读 · 0 评论 -
了解监督学习中的经典算法:8月22日
任务简介:学习《百面机器学习》3.2-3.3详细说明:由于支持向量机部分较难,我们先行学习后面两章。逻辑回归、决策树这两种经典分类算法。在很多实际问题中,因为海量且带有精确标注的数据难以获得,深度学习没有大显身手的余地,许多传统方法可以灵活巧妙地进行处理。我们为大家准备了逻辑回归和决策树的讲解视频和算法代码实战,视频和书本搭配可以更好的理解知识点,大家可以边看讲解文档,边运行程序代码,以期...原创 2019-09-07 18:23:04 · 256 阅读 · 0 评论 -
了解机器学习中如何降维处理
任务简介:学习《百面机器学习》4.1-4.4详细说明:不管是机器学习还是深度学习,数据都是以向量的形式进行表示的。而对高维向量进行处理时会极大的消耗系统资源,甚至产生维度灾难。因而降维不仅是在面试中,同时在实际应用中都是非常重要的知识点。本章主要介绍了PCA和LDA这两种降维的算法,其中PCA又从两个角度进行推导,并在最后将PCA和LDA进行对比,两种相似度较高的算法在一起对比是比较好的...原创 2019-09-05 18:13:44 · 253 阅读 · 0 评论 -
kmeans算法
K均值算法的步骤、选取初始聚类中心 通过计算距离进行聚类 重新计算聚类中心 重复2和3直到聚类中心不发生改变(或变化小于一定阈值)或者达到迭代次数上限。K均值优缺点、优点:1.原理简单,容易实现,收敛速度快,可解释性强;2.需要调节的参数较少(主要是聚类簇数K),且聚类效果好。缺点:1.聚类簇数K不好把握,一般只能通过暴力搜索法来决定;2.只适合簇型数据,对其他类型数据聚类效果...原创 2019-09-05 18:07:46 · 779 阅读 · 0 评论 -
kmeans算法应用图像压缩(sklearn实现)
from cv2 import imread, imwritefrom sklearn.cluster import KMeansfrom skimage import ioimport numpy as npdef compress_image(): """ 压缩图像 :return: """ image = imread('1.png')...原创 2019-08-05 20:36:03 · 743 阅读 · 0 评论 -
基于数据挖掘的商业银行客户关系管理系统应用研究
本文系统地讨论了对数据挖掘在商业银行客户关系管理中的应用研究问题。在进行了相关领域文献综述以后,本论文主要论述了以下几个方面:首先,对客户关系管理、商业银行客户关系管理理论以及数据挖掘相关理论进行探讨,同时,对商业银行实施客户关系管理的效用进行分析。再次,讨论了数据挖掘技术在商业银行CRM中的具体实施任务、方法选择;重点介绍了决策树C4.5、朴素贝叶斯、k-means聚类算法的基本原理及实例分析。最后,利用数据挖掘工具Weka分别建立贷款风险预测模型、客户特征细分模型并对实验结果进行分析。本文论述了数据原创 2013-04-30 20:46:14 · 5480 阅读 · 0 评论 -
数字图像处理与机器视觉——与后台图像交换swap():error C2039: “difference_type”: 不是“CImgProcess”的成员
文件菜单下面的“与后台图像交换”功能的响应函数代码,修改前:// CDIPDemp1View 消息处理程序void CDIPDemp1View::OnFileRotate(){ // 交换前、后台图像 CDIPDemp1Doc * pdoc = GetDocument(); swap(pdoc->m_Image, pdoc->m_OImage); pdoc->SetModifi原创 2017-05-21 08:00:31 · 1173 阅读 · 0 评论 -
机器学习算法:K近领学习笔记
在所有程序中可以找到jupyter notebook,如果jupyter notebook程序图标消失了,那么也可以在anaconda prompt中输入jupyter notebook启动jupyter notebook。1.运用pandas读取数据如图可以看到jupyter notebook的工作路径:C:\Users\randongmei201\,将listings.csv文件放...原创 2018-09-23 18:13:42 · 855 阅读 · 0 评论 -
机器学习之十大机器学习算法
逻辑回归机器学习实战书籍和代码分享 | 【PCA简介】机器学习算法篇:从为什么梯度方向是函数变化率最快方向详谈梯度下降算法资源 | 有没有必要把机器学习算法自己实现一遍?【推荐】用Python实现"Pattern Recognition and Machine Learning”里的算法【推荐】斯坦福统计学习导论习题解答Python版【推荐】用Python/Sc...原创 2019-02-02 14:04:28 · 297 阅读 · 0 评论 -
机器学习的变革与挑战
是懂人工智能的人搞业务,还是搞业务的人学习人工智能?就我观察,代表我自己的观点,我认为一般来说,搞IT的人做业务的,一般比做业务的人搞IT的要容易一些。真正的产品如果有其强大的功能满足需求一般是会被采用的个人认为AI只是一个工具,要和具体的专业结合起来才能发挥巨大威力,因此AI从业人员不但要有扎实的算法功底还要有具体应用领域的专业知识,比如从事医学AI开发的要有医学知识,金融AI开发人员要有...原创 2019-02-13 13:38:06 · 241 阅读 · 0 评论 -
多元线性回归python实现
1.2.3.import numpy as npimport scipydef regression(data_matrix, label): """ :param data_matrix: :param label: :return: """ #数据的数量 data_num = len(data_matrix)...原创 2019-08-05 06:59:29 · 616 阅读 · 0 评论 -
决策树python实现
from math import logimport operatordef calc_entropy(labels): """ 计算信息熵 :param labels:数据集上的标签集合 :return:返回信息熵 """ label_num = len(labels) label_show_up_times_dict = {}...原创 2019-08-05 07:02:36 · 181 阅读 · 0 评论 -
kmeans算法python实现
from random import randintclass Cluster(object): def _init_(self): #簇的所有特征向量 self._fcs = [] # 簇的中心点 self._center = None def set_center(self, new_center): ...原创 2019-08-05 20:15:17 · 259 阅读 · 0 评论 -
机器学习系列——统计学习方法1:第一章
第一章名词解释:1.独立同分布在概率统计理论中,如果变量序列或者其他随机变量有相同的概率分布,并且互相独立,那么这些随机变量是独立同分布。2.先验概率先验概率(prior probability)是指根据以往经验和分析得到的概率,如全概率公式,它往往作为"由因求果"问题中的"因"出现的概率。先验概率又可以分为主观先验概率和客观先验概率:利用过去历史资料计算得到的先验概率原创 2017-01-20 16:14:57 · 428 阅读 · 0 评论