machine learning
文章平均质量分 64
记录哥
大数据实践者,喜欢技术热爱生活,gh【记录技术记录我】
展开
-
pandas中的时间序列
pandas中的时间序列的详细讲解~原创 2022-02-10 08:21:04 · 1995 阅读 · 0 评论 -
数据处理利器:pandas
pandas在处理一维度数据和二维数据很是在行,在实际生产环境中应用十分广泛。我们直奔主题,本文主要讲解它的两个核心数据结构:Series 和 DataFrame...原创 2022-02-06 17:31:08 · 7281 阅读 · 0 评论 -
NumPy:高性能科学计算&数据分析的基础包
numpy不仅是 Python 中使用最多的第三方库,而且还是 SciPy、Pandas 等数据科学的基础库。它所提供的数据结构比 Python 自身的“更高级、更高效”,可以这么说,NumPy 所提供的数据结构是 Python 数据分析的基础。 在 NumPy 中需要重点掌握的就是对数组的使用即 NumPy和ufunc,因为这是NumPy和标准Python最大的区别,而ufunc能对数组中每个元素进行函数操作。NumPy 中很多 ufunc 函数计算速度非常快,因为都是采用 C 语言实现的...原创 2022-02-04 13:55:30 · 6330 阅读 · 0 评论 -
使用matplotlib绘制第一张图
如下是博主使用matplotlib学习绘制的一张图:import matplotlib.pyplot as pltx = [1, 2, 3, 4] # prepare datay = [10, 20, 25, 30] # prepare dataflg = plt.figure() # create plotax = flg.add_subplot(111) # plot...原创 2018-10-18 09:37:39 · 332 阅读 · 0 评论 -
机器学习常用数据处理
一,自定义数据样本from sklearn import datasetsimport matplotlib.pyplot as plt# create customized data,noise 表示的是离散的程度X,y=datasets.make_regression(n_samples=100,n_features=1,n_targets=1,noise=10)plt.sc...原创 2018-10-15 10:11:05 · 657 阅读 · 0 评论 -
机器学习中常见算法备忘单
偶遇一份机器学习备忘单,mark下。原创 2018-10-15 13:42:31 · 316 阅读 · 0 评论 -
机器学习算法汇总
如下是机器学习中算法的一个summary:原创 2018-10-15 13:46:06 · 385 阅读 · 0 评论 -
常见机器学习的python&R实现
如下是常见机器学习的训练及测试范本。原创 2018-10-15 14:13:05 · 263 阅读 · 0 评论 -
机器学习中常见库总结
机器学习中常见库总结一,matplotlib概述:Matplotlib是Python中最常用的可视化工具之一,可以非常方便地创建海量类型地2D图表和一些基本的3D图表.1,官网https://matplotlib.org/index.html2,完整文档https://matplotlib.org/contents.html#3,初学者入门教程https://m...原创 2018-10-19 16:53:38 · 980 阅读 · 0 评论 -
numpy的最基础的方法总结
如下是numpy最基础的也是比较核心的方法:原创 2018-10-17 10:14:38 · 278 阅读 · 0 评论 -
统计学习方式总结
常用的统计学习由如下几种方式组成:一,监督学习生成方法:由数据学习联合概率分布p(y|x),然后求出它作为预测模型。模型表示了给定输入x产生输入y的生成关系。eg,nb,hmm. 判别方法:该方法由数据直接学习决策函数f(x)或者条件概率分布作为预测的模型,判别方法关心的是对给定的输入x,应该预测什么样的输出y.eg,k近邻算法,感知机,决策树,LR,最大熵模型,SVM,CRF. 1...原创 2018-11-18 18:03:03 · 374 阅读 · 0 评论 -
机器学习模型训练范本
一,概述首先是数据获取; 处理训练数据和测试数据; 模型训练; 使用训练好的模型进行预测;二,源代码分析from sklearn.linear_model import LinearRegressionfrom sklearn.model_selection import train_test_splitfrom sklearn.datasets import load_ir...原创 2018-10-14 12:11:11 · 785 阅读 · 0 评论 -
ROC与AUC的分析
ROC,AUC一,ROC:受试者工作特征(Receiver Operating Characteristic); 二,AUC:ROC曲线的面积就是AUC(Area Under the Curve),TA 用于衡量“二分类问题”机器学习算法性能(泛化能力); 三,图示:样本中的真实正例类别总数即TP+FN。TPR即True Positive Rate,TPR = T...原创 2018-08-14 20:45:31 · 756 阅读 · 0 评论 -
机器学习相关概念梳理
回归类问题,分类问题,聚类问题,推荐原创 2017-11-12 22:20:46 · 644 阅读 · 0 评论 -
机器学习概要提纲
机器学习原创 2017-12-13 18:22:19 · 621 阅读 · 0 评论 -
numpy的小笔计
softmax函数softmax用于多分类过程中,它将多个神经元的输出,映射到(0,1)区间内,可以看成概率来理解,从而来进行多分类!假设我们有一个数组,V,Vi表示V中的第i个元素,那么这个元素的softmax值就是import numpy as npdef softmax(x): """Compute the softmax of vector x."""原创 2018-01-13 14:40:33 · 340 阅读 · 0 评论 -
机器学习的演进之路
数据和模型是很重要,但是正确的演进之路更加不容忽视,通常正确的演进之路是这样的:首先提出一个假设,可以通俗的说是对问题的一个猜想;针对假设,我们需要选择使用什么模型;模型选定后训练它,离线测试,如果验证通过就要上AB测试.否则要么换个模型,要么重新审视下自己的假设是否站得住脚;上AB测试,测试结果明显提升的话就上线,否则回滚,再看看最开始自己的那个假设是否靠谱; 这个过程中有如下几个比较困难原创 2018-02-02 00:09:05 · 436 阅读 · 0 评论 -
回归与支持向量机的总结
一, 线性回归(linear regression) 引入:房价预测(以英尺计算)表达式 衡量好坏的标准:代价函数 去往何方?值域目前是无穷大,假如我想解决分类问题,应该如何才能把值域控制在一个较小的区间范围之内呢?试想如下案例:二,逻辑斯蒂回归模型(logistics regression)(logistic regression)是统计学习中经典的分类方法.(属于对数线性模型)表达式:sigm...原创 2018-04-15 18:08:52 · 3536 阅读 · 0 评论 -
常见统计学习方法总结
如下是摘自李航老师的总结:原创 2018-04-21 21:03:41 · 290 阅读 · 0 评论 -
计算广告概述
最近看到一篇博客,是有关计算广告的.感觉写的很不错.收藏下来.转自如下地址:https://dirtysalt.github.io/html/computational-advertising.html#orgheadline3转载 2018-06-03 12:21:30 · 484 阅读 · 0 评论 -
NumPy基础学习
NumPy基础学习 基本概念NumPy是Python语言的一个扩充程序库。支持高级大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。Numpy内部解除了Python的PIL(全局解释器锁),运算效率极好,是大量机器学习框架的基础库! 使用举例 import numpy as np# 创建列表arr1=[[ 1., 0., 0.], [ 0., ...原创 2018-06-03 16:17:41 · 257 阅读 · 0 评论 -
Pandas基础学习
Pandas基础学习基本概念Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。使...原创 2018-06-03 19:09:22 · 267 阅读 · 0 评论 -
常用的推荐算法
推荐算法 基于流行度算法比较简单粗暴,根据热搜topN进行推荐. 协同过滤算法分为两种,基于用户的和基于物品的; 基于内容的算法基于内容的推荐算法能够很好地解决冷启动问题,并且也不会囿于热度的限制,因为它是直接基于内容匹配的,而与浏览记录无关。然而它也会存在一些弊端,比如过度专业化(over-specialisation)的问题。这种方法会一直推荐给用户内容密切关联的item,而...原创 2018-06-03 21:09:02 · 1811 阅读 · 0 评论 -
python工程找不到依赖的解决方案
问题描述:我的python工程运行的时候抛出了异常:importerror: no module named sklearn原创 2017-11-22 13:15:02 · 1885 阅读 · 0 评论