machine learning
梦家
博客主页:https://dreamhomes.top/
展开
-
PyTorch 中的损失函数总结
原文地址:https://dreamhomes.github.io/posts/202012261041.html文章目录原文地址:[https://dreamhomes.github.io/posts/202012261041.html](https://dreamhomes.github.io/posts/202012261041.html)L1Loss实例代码验证代码MSELoss(L2Loss)实例代码验证代码SmoothL1Loss实例代码NLLLoss实例代码验证代码CrossEntropy.原创 2020-12-31 11:13:50 · 830 阅读 · 1 评论 -
【2005/WWW】Object-Level Ranking: Bringing Order to Web Objects
文章链接:http://www.ra.ethz.ch/CDstore/www2005/docs/p567.pdf摘要网页检索的主要任务是按照应答用户查询的相关性和流行度对相关对象进行排名。由于不同对象间不均匀性的存在,传统的PageRank模型在计算对象的流行度(Popularity)时不再有效。本文提出一种对一个特殊域的对象排名的域独立、对象级链接分析模型,明确的对每一类对象关系分配一个流行度传播因子(PPF,Popularity Propagation Factor),研究不同种类关系的不同PP.原创 2020-10-28 09:56:29 · 622 阅读 · 0 评论 -
核密度估计(Kernel Density Estimation)和累积分布函数 (Cumulative Distribution Function)
核密度估计核密度估计是采用平滑的峰值函数(“核”)来拟合观察到的数据点,从而对真实的概率分布曲线进行模拟,含义类似于数据直方图。核密度估计(Kernel density estimation),是一种用于估计概率密度函数的非参数方法,为独立同分布的nnn个样本点,设其概率密度函数为 fff,核密度估计如下:f^h(x)=1n∑i=1nKh(x−xi)=1nh∑i=1nK(x−xih)\hat{f}_{h}(x)=\frac{1}{n} \sum_{i=1}^{n} K_{h}\left(x-x_{原创 2020-10-15 17:30:52 · 10994 阅读 · 8 评论 -
类不平衡问题中不同的过采样方法对比
文章作者:梦家个人站点:dreamhomes.top原文地址:https://dreamhomes.github.io/posts/202005281734.html公众号ID:DreamHub多种过采样方法的比较from collections import Counterimport matplotlib.pyplot as pltimport numpy as npfrom sklearn.datasets import make_classificationfrom skl.原创 2020-05-30 10:34:55 · 1300 阅读 · 0 评论 -
理解直推式学习和归纳式学习
文章作者:梦家个人站点:dreamhomes.top原文地址:https://dreamhomes.github.io/posts/202005162008.html公众号ID:DreamHub理解机器学习中的学术名词:监督学习(supervised learning)半监督学习(semi-supervised learning)主动学习(active learning)无监督学习(unsupervised learning)直推式学习(transductive learning).原创 2020-05-16 21:06:25 · 8300 阅读 · 1 评论 -
PyCharm + Jupyter +Docker 搭建远程机器学习开发环境
背景作为机器学习开发者,一般都在远程连接服务器开发,每次搭建本地环境实在是太麻烦了啊!本文主要记录远程开发环境的搭建过程。本文需要一定的背景知识,已了解如何使用 docker 和 pycharm!No BB,下面直接上!流程创建容器前提是容器中 Python 开发环境已搭建好,例如本人执行命令:后台执行容器:docker run -d -p 8022:22 --name='dreamhomes' -v /home/workspace:/home/workspace dreamhomes/d原创 2020-05-11 17:46:24 · 1100 阅读 · 0 评论 -
朴素贝叶斯分类器详解
文章首发于 朴素贝叶斯分类器详解 | 隐舍分类问题定义已知集合:C={y1,y2,...,yn}C=\{y_1, y_2, ..., y_n\}C={y1,y2,...,yn}和I={x1,x2,...,xm}I=\{x_1, x_2, ..., x_m\}I={x1,x2,...,xm},确定映射规则y=f(x)y=f(x)y=f(x), 使得任意xi∈Ix_i\in Ixi...原创 2020-04-19 10:32:08 · 451 阅读 · 0 评论 -
浅入理解傅里叶变换
文章首发于个人站点:隐舍 | 理解傅里叶变换傅里叶变换傅立叶变换是将时域的函数转换成频域上的函数,是对于同一个函数的不同视角。数学定义如下:F(w)=F(f(t))=∫f(t)e−iwtdtF(w)=F(f(t))=\int{f(t)e^{-iwt}}dtF(w)=F(f(t))=∫f(t)e−iwtdt笛卡尔坐标系中的变换对着数学公式来理解傅里叶变换确实有点难度,下面先从笛卡尔坐标...原创 2020-04-17 12:06:22 · 2665 阅读 · 1 评论 -
可交互的可视化神器 Plotly Express
文章目录Plotly Express 简介散点图线图直方图/条形图3D三元坐标系地图图像保存Plotly Express 简介Plotly Express 是一个新的高级 Python 可视化库:它是 Plotly.py 的高级封装,它为复杂的图表提供了一个简单的语法。参考 官方文档散点图import plotly.express as pxiris = px.data.iris()...原创 2020-03-31 10:59:16 · 1453 阅读 · 0 评论 -
与过年相关的两个算法:红包算法和洗牌算法
红包算法和洗牌算法红包算法解决红包金额随机生成的问题。红包分配规则:所有人抢到金额之和等于红包金额。每个人至少抢到一分钱。保证所有人抢到金额的概率相等。法一:二倍均值法设剩余红包金额为M,剩余人数为N,金额公式:每次抢到的金额=(0, M / N X 2)公式保证每次随机金额的平均值是相等的,不会因为抢红包的先后顺序而造成不公平。问题:除了最后一次,每次抽到的金额都小...原创 2020-03-26 17:46:19 · 448 阅读 · 0 评论 -
如何成为一个高效的算法工程师?算法攻城狮の自我修养
算法工程师の自我修养在学好机器学习、深度学习的理论基础之后,如何使用自己的理论知识来解决实际数据分析中的算法问题呢?对于该问题,在此分享下自己在工业界的一点感受。作为一个萌新初出校门加入企业实习,会遇到非常多的问题。由于对工业界项目接触较少(其实在学校写论文也算一个小型项目了????),对于不同企业的开发环境、项目流程、工作汇报都不熟悉,这就需要一定的时间来适应这种新环境。例如服务器配置开发环境...原创 2020-03-26 17:24:27 · 554 阅读 · 0 评论 -
Alias 采样及其Python实现
Alias 采样参考:【数学】时间复杂度O(1)的离散采样算法—— Alias method/别名采样方法对于问题:比如一个随机事件包含四种情况,每种情况发生的概率分别为: 12,13,112,112\frac{1}{2},\frac{1}{3},\frac{1}{12},\frac{1}{12}21,31,121,121,问怎么用产生符合这个概率的采样方法。两次掷骰子:第一...原创 2019-12-11 11:41:06 · 988 阅读 · 0 评论 -
数理统计中常用函数、概率分布函数总结
Happiness is to find someone who can give you warm and share your life together. 幸福就是找一个温暖的人过一辈子。数理统计中常用函数、概率分布函数总结克罗内克函数(Kornecker delta)δ(n)={01if i≠jif i=j\delta(n)=\begin{cases}0& \text{if原创 2017-10-18 17:19:52 · 6746 阅读 · 0 评论 -
机器学习之One Hot Encoding
My existence is not without reason!I know that i could be a quite a different person! 我的存在必定有意义!我知道我会成为一个与众不同的人!基本概念One-Hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效。One-Hot原创 2018-01-03 20:34:12 · 819 阅读 · 0 评论 -
关于论文撰写的总结
关于论文撰写的总结 日期:2018-3-20 地点:甘肃 ⋅⋅\cdot 兰州对于《学术世界》公众号上有关于论文书写的文章,大多部分是关于中文论文上的格式要求或者英文论文的语法要求,但根据我对不同外文期刊或者会议论文的了解,不同的期刊论文的格式不尽相同,可以根据不同的期刊要求做出对应的格式修改即可。因此在本篇论文中不再总结论文撰写的具体细节,而是简单总结一下论文的整体...转载 2018-03-23 19:12:51 · 1619 阅读 · 0 评论 -
Machine learning
Four branches of machine learningSupervised learningoptical character recognitionspeech recognitionimage classificationlanguage translationSequence generateGiven a picture, predict a caption...原创 2018-10-07 20:09:47 · 685 阅读 · 0 评论 -
关于Numpy+TensorFlow+PyTorch构造NN的总结
使用Tensor的理由+静态图和动态图的区别implement the network using numpy and pytorchimport numpy as npimport torchdtype = torch.floatdevice = torch.device("cpu")# device = torch.device("cuda:0")# N: batch siz...原创 2018-11-13 21:39:47 · 459 阅读 · 0 评论 -
Python-CIFAR-10二进制格式数据集转为JPG格式
Python源码# -*- coding: utf-8 -*-"""@Date: 2018/12/25@Author: dreamhome@Summary:"""import cv2import numpy as npimport os# 文件夹名str_2 = './train_cifar10'str_1 = './test_cifar10'if os.pat...原创 2018-12-25 10:42:46 · 704 阅读 · 0 评论 -
大数据技术在电子政务中的应用
本文总结大数据技术在电子政务中的应用电子政务的定义电子政务(又称电子政府,或e-gov、数字政府、在线政府、联网政府等)是将政府与公民之间用数字化的方式连接(政府-公民称为:government and citizens,简称G2C,下同),政府到企业(government and businesses/Commerce,G2B)、政府到员工(government and employee...原创 2019-05-11 19:54:13 · 3693 阅读 · 0 评论 -
机器学习中对于正则化的理解
Promise yourself to be so strong that nothing can disturb your peace of mind. 对自己承诺:我要强大到任何事情都无法破坏我内心的平和。机器学习中对于正则化的理解在机器学习中,大多数算法都提及对向量进行正则化处理,搜集了一些网上的资料并在此写下自己对正则化的理解。正则化(regularization),是指在线性代原创 2017-09-09 22:18:38 · 1619 阅读 · 0 评论