自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(111)
  • 资源 (2)
  • 收藏
  • 关注

原创 这么做事想出错都难

经过多年的实践检验和筛选,笔者逐步形成了一套系统的做事方法论,它按照闭环思维的三个阶段展开,整体结构...

2023-03-23 18:41:55 296

原创 Linux和Unix的那些事儿

linux和unix的发展脉络,你值得一看。

2022-03-11 23:16:01 282

原创 网络是怎样连接的

最近无意中发现了一本有趣的书:《网络是怎样连接的》。我记得之前网上看过比较火的一个问题:从输入url到浏览器显示页面发生了什么?这本书很好的诠释了这个问题。确切地说,应该是详实的回答了这个问题。一.浏览器生成消息我们将首先探索浏览器的工作方式。大家可以认为我们的探索之旅是从浏览器中输入网址开始的。比如我们输入这样的网址时,浏览器会按照一定的规则去分析这个网址的含义,然后根据其含义生成请求消息。https://www.baidu.com/在上面的这个栗子中.

2022-02-20 15:38:25 9261 2

原创 pandas中的时间序列

pandas中的时间序列的详细讲解~

2022-02-10 08:21:04 1938

原创 数据处理利器:pandas

pandas在处理一维度数据和二维数据很是在行,在实际生产环境中应用十分广泛。我们直奔主题,本文主要讲解它的两个核心数据结构:Series 和 DataFrame...

2022-02-06 17:31:08 7240

原创 NumPy:高性能科学计算&数据分析的基础包

numpy不仅是 Python 中使用最多的第三方库,而且还是 SciPy、Pandas 等数据科学的基础库。它所提供的数据结构比 Python 自身的“更高级、更高效”,可以这么说,NumPy 所提供的数据结构是 Python 数据分析的基础。 在 NumPy 中需要重点掌握的就是对数组的使用即 NumPy和ufunc,因为这是NumPy和标准Python最大的区别,而ufunc能对数组中每个元素进行函数操作。NumPy 中很多 ufunc 函数计算速度非常快,因为都是采用 C 语言实现的...

2022-02-04 13:55:30 6282

原创 学习新事物必问的三个问题

当我们要谈一个事物的时候,需要自问三个问题:是什么?为什么?怎么样?把程序员熟悉的"数据结构和算法"拉出来,拷问一下一.是什么?什么是数据结构和算法 数据结构,就是一组数据的存储结构。 算法,就是操作数据的一组方法。 数据结构是为算法服务的,算法要作用在特定的数据结构之上。 二.为什么?为什么需要数据结构和算法在计算机科学和互联网迅猛发展下,需要计算的数据量越来越庞大。但是计算机的计算能力是有限的,这么大量的数据计算,

2022-02-04 10:17:53 184

原创 数据结构与算法学习的书单

数据结构与算法学习的书单​

2022-02-03 22:48:47 1561

原创 统计学习方式总结

常用的统计学习由如下几种方式组成:一,监督学习生成方法:由数据学习联合概率分布p(y|x),然后求出它作为预测模型。模型表示了给定输入x产生输入y的生成关系。eg,nb,hmm. 判别方法:该方法由数据直接学习决策函数f(x)或者条件概率分布作为预测的模型,判别方法关心的是对给定的输入x,应该预测什么样的输出y.eg,k近邻算法,感知机,决策树,LR,最大熵模型,SVM,CRF.  1...

2018-11-18 18:03:03 350

原创 机器学习中常见库总结

机器学习中常见库总结一,matplotlib概述:Matplotlib是Python中最常用的可视化工具之一,可以非常方便地创建海量类型地2D图表和一些基本的3D图表.1,官网https://matplotlib.org/index.html2,完整文档https://matplotlib.org/contents.html#3,初学者入门教程https://m...

2018-10-19 16:53:38 955

原创 使用matplotlib绘制第一张图

如下是博主使用matplotlib学习绘制的一张图:import matplotlib.pyplot as pltx = [1, 2, 3, 4] # prepare datay = [10, 20, 25, 30] # prepare dataflg = plt.figure() # create plotax = flg.add_subplot(111) # plot...

2018-10-18 09:37:39 310

原创 numpy的最基础的方法总结

如下是numpy最基础的也是比较核心的方法: 

2018-10-17 10:14:38 259

原创 常见机器学习的python&R实现

如下是常见机器学习的训练及测试范本。 

2018-10-15 14:13:05 242

原创 机器学习算法汇总

如下是机器学习中算法的一个summary: 

2018-10-15 13:46:06 353

原创 机器学习中常见算法备忘单

偶遇一份机器学习备忘单,mark下。 

2018-10-15 13:42:31 285

原创 机器学习常用数据处理

一,自定义数据样本from sklearn import datasetsimport matplotlib.pyplot as plt# create customized data,noise 表示的是离散的程度X,y=datasets.make_regression(n_samples=100,n_features=1,n_targets=1,noise=10)plt.sc...

2018-10-15 10:11:05 633

原创 机器学习模型训练范本

一,概述首先是数据获取; 处理训练数据和测试数据; 模型训练; 使用训练好的模型进行预测;二,源代码分析from sklearn.linear_model import LinearRegressionfrom sklearn.model_selection import train_test_splitfrom sklearn.datasets import load_ir...

2018-10-14 12:11:11 755

原创 mvn打包中疑难杂症的解决

1,问题描述:在Intellij idea 中当我们有多个模块的时候,我们打包项目的时候,可能会遇到如下的问题:Maven依赖中类似was cached in the local repository样的错误;2,分析:可能是jar包没有从远程仓库中下载完整;3,解决:mvn -U clean package...

2018-09-03 13:10:10 467

原创 ROC与AUC的分析

ROC,AUC一,ROC:受试者工作特征(Receiver Operating Characteristic); 二,AUC:ROC曲线的面积就是AUC(Area Under the Curve),TA 用于衡量“二分类问题”机器学习算法性能(泛化能力); 三,图示:样本中的真实正例类别总数即TP+FN。TPR即True Positive Rate,TPR = T...

2018-08-14 20:45:31 705

原创 计算广告业务小计

常用业务总结一,一价 first price,FP,第一价格计费,Generalized First-price auction,广义第一计费,也就是大家常说的“一价”,是最早用在搜索广告中额竞价排名的一种机制; 竞价时通常可以分为两个步骤:排序和计费,在搜索广告中,开始排序之前,首先要准备好几个重要的因子: 1,出价,bid;2,质量度(Q):可以由多个因素组成,比如...

2018-08-14 20:10:13 322

原创 SpringBoot集成ES

SpringBoot集成ES概述一,依赖 <parent> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-parent</artifactId> <version>...

2018-08-14 19:51:45 1481

原创 英语积累__烦恼

1,Trouble:麻烦,烦恼;Something is a lot troubleSomething is so much trouble2,Troublesome:麻烦的,讨厌的,使人苦恼的;Someting is very troublesome.3,Such a pain in the neck,真麻烦4,Annoy:骚扰,惹恼5,Someone is a lot of trouble,某...

2018-06-09 22:00:22 558

原创 JVM总结

JVM总结一,JVM内存区域        方法区(method area):        该区域属于线程共享的内存区域,又称Non-Heap(非堆),主要用于存储已被虚拟机加载的类信息,常量,静态变量,即时编译器编译后的代码等数据,当方法区无法满足内存分配需求时,将抛出OutOfMemoryError异常;    JVM堆(java heap)        该区域属于线程共享的内存区域,它在...

2018-06-09 17:45:17 199

原创 mysql常识

mysql总结    三范式        第一范式                每一列必须仅包含一个值(有时候这个被描述为原子性或者不可分割性)                所有表都不能具有相关数据的重复列        第二范式            首先得满足第一范式            表的每一个不为主键的列必须依赖主键        第三范式            首先得满足第二范...

2018-06-09 15:59:56 227

原创 设计模式

设计模式    单例模式            确保某一个类只有一个实例,而且自行实例化且向整个系统提供这个实例        懒汉模式                package com.yomob.springcloud;/** * @author Wengang Wang * @since Jun 09, 2018 *///在类加载的时候不会创建单例实例,而是在首次请求实例...

2018-06-09 14:59:15 197

原创 常用的推荐算法

推荐算法    基于流行度算法比较简单粗暴,根据热搜topN进行推荐.    协同过滤算法分为两种,基于用户的和基于物品的;    基于内容的算法基于内容的推荐算法能够很好地解决冷启动问题,并且也不会囿于热度的限制,因为它是直接基于内容匹配的,而与浏览记录无关。然而它也会存在一些弊端,比如过度专业化(over-specialisation)的问题。这种方法会一直推荐给用户内容密切关联的item,而...

2018-06-03 21:09:02 1778

原创 Pandas基础学习

Pandas基础学习基本概念Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。使...

2018-06-03 19:09:22 243

原创 NumPy基础学习

NumPy基础学习    基本概念NumPy是Python语言的一个扩充程序库。支持高级大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。Numpy内部解除了Python的PIL(全局解释器锁),运算效率极好,是大量机器学习框架的基础库!    使用举例        import numpy as np# 创建列表arr1=[[ 1., 0., 0.], [ 0., ...

2018-06-03 16:17:41 234

转载 计算广告概述

最近看到一篇博客,是有关计算广告的.感觉写的很不错.收藏下来.转自如下地址:https://dirtysalt.github.io/html/computational-advertising.html#orgheadline3

2018-06-03 12:21:30 462

原创 计算广告中的常用术语概述

计算广告中的常用术语概述:新增首次登录或启动游戏的用户活跃日活跃用户数留存假设某段时间的新增用户数为A,经过一段时间后,仍然使用的用户占新增用户A的比例即为留存率。1日留存:日新增用户在+1日登录的用户数占新增用户比例。3日留存:日新增用户在+3日登录的用户数占新增用户比例。N日留存:日新增用户在+N日登录的用户数占新增用户比例。广告观看率有广告观看行为的用户占总活跃用户的比例计算...

2018-06-02 20:03:08 977

原创 Intellij创建项目的时候需要注意的问题

Intellij创建项目的时候需要注意如下:一般会比较有用的文件夹或者文件:    src文件夹;    target文件夹;    .gitignore文件    pom.xml文件    ps:其中的.gitignore文件的内容举例:# Created by .ignore support plugin (hsz.mobi)### Java template*.class# Mobi...

2018-05-28 00:02:57 413

原创 springcloud-zuul总结

springcloud-zuul总结一,依赖<dependency> <groupId>org.springframework.cloud</groupId> <artifactId>spring-cloud-starter-netflix-zuul</artifactId></dependency>二,配置文件sp...

2018-05-23 23:23:07 277

原创 git 创建仓库关联到远程仓库

新建文件夹,进入该文件夹;git init (初始化为git);在远程仓库中新建项目,取名springcloud-config.git把本地项目关联到远程仓库,git remote add origin [email protected]:wangwg/springcloud-config.git;然后做如下的常规操作:git add .git commitgit push -u origin...

2018-05-23 22:39:57 195

原创 SpringCloud-Config的总结

SpringCloud-Config学习一,概述一图胜千言.二,实战    1,远程配置中心文件项目项目名称:config-repo配置文件:application.properties    eureka.client.serviceUrl.defaultZone=http://localhost:8761/eureka/dev 环境的配置文件demo.env=devtest 环境的配置文件de...

2018-05-23 22:25:12 251

原创 SpringCloud-Eureka的总结

SpringCloud-Eureka 学习一,概述    (我们约定 E表示springcloud_eureka项目,P代表springcloud_eureka_provider项目,C代表springcloud-consumer项目)SpringCloud Eureka本质是一个服务注册和发现的工具包,P和C是注册在E上的instances,在E来到人世间之前,P,C的耦合性很强的,现在呢,自从...

2018-05-21 22:16:42 359

原创 Zookeeper的调用-javaApi

使用Java API调用Zookeeper    一,概述:        我们知道可以通过命令来操作Zookeper的客户端和服务端并进行相应的操作,但是有时候需要使用java在程序中对其进行操作.即,通过API(JAVA)来操作Zookeeper.    二,依赖:         <dependency> <groupId>org...

2018-05-14 12:41:02 293

原创 kafka Streams Application

kafka流式处理应用开发一,相关依赖 <dependency> <groupId>org.apache.kafka</groupId> <artifactId>kafka-streams</artifactId> <version>${ka...

2018-05-13 18:25:13 370

原创 hadoop总结

一,MapReduce基本的一些概念:MapReduce作业(job)是客户端需要执行的一个工作单元:它包括输入数据,MapReduce程序和配置信息.Hadoop将作业分成若干个任务(task)来执行,其中包括两类任务:map任务和reduce任务.这些任务运行在集群的节点上,并通过YARN进行调度.如果一个任务失败,它将在另一个不同的节点上自动重新调度运行.Hadoop将MapReduce的输...

2018-05-10 00:11:16 393

原创 springboot中redis的使用

redis的使用在springboot中一,引入依赖<dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-redis</artifactId> </dependency>二,添加...

2018-05-08 19:01:54 654

原创 springboot中的定时任务

定时任务    在我们的项目开发过程中,经常需要定时任务来帮助我们来做一些内容,springboot默认已经帮我们实行了,只需要添加相应的注解就可以实现一,pom.xml配置 <dependency> <groupId>org.springframework.boot</groupId> <artifactId>...

2018-05-08 18:45:54 170

微信收钱码

微信收钱码,用于打赏博主,它的文件名称为:WechatIMG330.bmp

2018-10-18

支付宝收钱码

支付宝收钱码,用于打赏功能,它的文件名称为:WechatIMG331.bmp

2018-10-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除