自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(54)
  • 收藏
  • 关注

原创 python数据结构——单调栈和单调队列

单调栈数据结构栈遵循先进后出的原则,在python中,利用list就可以实现栈的功能stack = []stack.append(1)stack.append(2)print(stack.pop()) #2单调栈遵循单调增或者单调减的原则,用于处理某些特别的任务,也就是常说的next greater element的问题。class MStack: def __init__(self): self.stack = [] def push(self, value): while

2021-05-31 21:58:52 1505

原创 python与数据结构——LRU缓存

LRU缓存机制LRU缓存机制有几个特点:缓存cache是带有容量的缓存必须有顺序之分,以区分最近使用和久未使用的数据(读数据也算使用)读和写数据都比如快,时间复杂度为O(1)为达到上述目的,LRU缓存算法的核心数据结构就是哈希链表,即双向链表和哈希表的结合。双向链表维护的是使用数据的顺序关系,哈希表方便读写操作。# 双向链表class ListNode: def __init__(self, key=None, value=None): self.key = key

2021-05-31 10:19:36 280

原创 pyinstaller failed to execute script pyi rth pkgres

pip uninstall pyinstallerpip install https://github.com/pyinstaller/pyinstaller/archive/devel

2020-05-19 22:08:10 708

原创 神经网络部署--网络压缩技术Network Compression

1 network pruningnetwork pruning技术的思路是:训练一个大的神经网络→评价网络中参数和神经元的重要度→根据重要度排序,移除不重要的weight和神经元(置0)为什么要训练一个大的网络再压缩,而不是直接训练一个小的网络呢?因为研究表明,大的网络比较容易训练,效果也更好。2 knowledge distillation训练一个大的,效果好的神经网络→训练一个小...

2020-04-07 11:29:23 732

转载 win10环境下pip install安装报错`OSError:raw write() returned invalid `

参考此链接:https://bugs.python.org/issue32245#msg308012好像是说终端的编码造成的,查看pycharm的Terminal终端chcp,显示936,即美国编码。使用 chcp 65001,改为utf-8编码,依旧报错。使用powershell激活当前虚拟环境,使用 chcp 65001,将当前编码换成utf-8,然后再安装就可以了...

2020-03-26 16:13:45 387

原创 word embedding

一般NLP任务中,都需要将词汇向量化,以往一般采用的是1-of-N encoding,但是这种方式,对于机器学习来说,词汇之间没有相互关联性,相同的词在不同的语境也会含有不同的含义,词汇没有分类(比如动词、名词没有分开)等等。后面延伸了一种方式叫word class,即把词汇进行分类,但是分类也有弊端,例如代表动物的一类中还有细化的分类,运动物体的类别可以和运动相关的动词相联系,但是静止的类别就...

2020-03-23 14:26:25 354

原创 异常检测算法

异常检测异常检测的特点,异常检测的训练样本没有或者少量的正样本(异常样本),正负样本比例非常不均衡的情况。异常检测可以采用三种处理方式:当做分类问题处理当做聚类问题处理采用概率分布问题处理分类算法由于异常检测的特殊性,在将异常检测当做分类算法处理时,由于样本分布不均的情况,很难得到一个行之有效的算法,因此在使用时应该尽量扩充样本的数量,尤其正向样本的数量,同时,获取尽可能多的特征...

2020-02-28 14:50:09 572

原创 算法选择

分类算法n为特征数,m为训练样本数。如果相较于m,n要大很多,即训练集数据量不够支持我们训练一个复杂的非线性模型,我们选用逻辑回归模型或者不带核函数的支持向量机。如果n较小,且m大小中等,例如n在1~1000,m在10 ~ 10000 之间,使用高斯核函数的支持向量机。如果n较小,而m较大,例如n在1~1000, 而m大于50000,则使用支持向量机会非常慢,解决方案是创造、增加更多的特...

2020-02-27 17:03:55 266

原创 机器学习:模型评价和优化方法

评价参数高偏差和高方差机器学习中的高偏差指的是模型的损失函数校验中,训练集和测试集error大,模型欠拟合;高方差是指训练集的error小,测试集的error大,模型过拟合。通俗来说,高偏差问题就是采用训练集训练效果都不太好的模型,而高偏差问题就是训练效果好,但是测试效果不好的模型,绘制学习曲线有助于了解算法是高偏差问题还是高方差问题,针对高偏差的优化方向:尝试增加特征尝试添加多项式特...

2020-01-14 14:31:35 1571

原创 python设计模式

单例模式保证某个类在全局只存在一个实例class Singleton: def __new__(cls,*args,**kwargs): if not hasattr(cls,'_instance'): cls._instance= super().__new__(cls,*args,**kwargs) return cls._instance def __init__(se...

2019-12-13 15:06:20 115

原创 leetcode:59. Spiral Matrix II

ProblemGiven a positive integer n, generate a square matrix filled with elements from 1 to n2 in spiral order.Example:Input: 3Output:[[ 1, 2, 3 ],[ 8, 9, 4 ],[ 7, 6, 5 ]]Solution解法类似于旋转取值,只...

2019-12-05 10:29:27 109

原创 leetcode:57. Insert Interval

ProblemGiven a set of non-overlapping intervals, insert a new interval into the intervals (merge if necessary).You may assume that the intervals were initially sorted according to their start times....

2019-12-03 09:48:40 107

原创 leetcode:56. Merge Intervals

ProblemGiven a collection of intervals, merge all overlapping intervals.Example 1:Input: [[1,3],[2,6],[8,10],[15,18]]Output: [[1,6],[8,10],[15,18]]Explanation: Since intervals [1,3] and [2,6] ove...

2019-12-01 21:34:08 135

原创 leetcode:55. Jump Game

ProblemGiven an array of non-negative integers, you are initially positioned at the first index of the array.Each element in the array represents your maximum jump length at that position.Determine...

2019-11-29 17:40:06 117

原创 leetcode-54. Spiral Matrix

problemGiven a matrix of m x n elements (m rows, n columns), return all elements of the matrix in spiral order.Example 1:Input:[[ 1, 2, 3 ],[ 4, 5, 6 ],[ 7, 8, 9 ]]Output: [1,2,3,6,9,8,7,4,5]...

2019-11-28 15:19:32 140

原创 特征选择方法和sklearn中的特征选择应用

数据类型可用方法连续-连续相关系数、假设检验连续-离散相关系数、连续二值化(最小Gini切分、最大熵增益切分)连续-离散相关系数(定序)连续-离散相关系数,熵相关、F分值离散-离散(非二值)熵相关、Gini、相关系数(定序)...

2019-08-05 16:41:57 680

原创 sklearn -回归分析的指标

sklearn.metrics.explained_variance_scoreexplained_variance_score(y_true, y_pred, sample_weight=None, multioutput=’uniform_average’)可释方差得分,表征数学模型中,残差的方差在整个数据集所占的比重的变量,计算公式如下:参数: y_true : 真实目标值的向...

2019-07-29 10:18:19 1408

原创 sklearn的特征分解

sklearn的特征分解主要有两个api模块,sklearn.decomposition和sklearn.cross_decompositiondecomposition主要是矩阵分解特征的算法:DictionaryLearning(n_components=None, alpha=1, max_iter=1000, tol=1e-08, fit_algorithm=’lars’, tra...

2019-07-24 14:38:28 540

原创 sklearn的特征抽取和特征筛选

数据分析过程中,往往需要处理很多类型的数据,数值型和非数值型,无论是在回归问题还是分类问题中,特征工程都是重中之重。我们都知道,特征值和特征向量在高等数学和线性代数中极为关键,特征工程,从表面上来说,就是从大大小小的数据中,筛选出有意义或者有用的条目,进而转换成一种数学表达,让机器和算法能够理解其中的意义。好比一个班上的每个学生,都有性别、年龄、身高、体重、成绩、性格特点等等特征,年龄、身高、体...

2019-07-23 15:36:23 4174 3

原创 ubuntu 更换apt源

备份原源文件sudo su #输入密码cd /etc/apt #切换到apt源文件sudo cp sources.list sources.list_bak #备份源文件sudo vim sources.list #修改源文件修改源将原来的sources.list 文件中的地址用“#”注释或者删除添加下列源(以阿里源为例):ubuntu 16.04xenial为...

2019-07-22 09:56:36 299

原创 odoo - 日志和异常

odoo中继承了基本的日常运行日志和异常报告功能日志在模型函数之前增加日志相关的模块import logging_logoer = logging.getLogger(__name__)记录日志有助于帮助查询数据的更改、错误,定位故障源、bug源等,_logger是用标准库进行初始化,以python的内部变量__name__用于标示本模块相关的日志信息。常用的记录日志的方法有:_l...

2019-07-16 10:28:18 1434

转载 linux -ssh无法连接ubuntu的解决办法

1、安装ssh服务sudo apt-get install openssh-server2、修改配置文件sudo vi /etc/ssh/sshd_config打开后#PermitRootLogin without-password #注释掉这行PermitRootLogin yes #增加这行#重启服务/etc/init.d/ssh restart3、远程连接报下面错误...

2019-07-13 10:43:47 464 1

原创 Django(7) - 使用Redis缓存session

Redis使用*使用Redis缓存session安装:pip install django-redis-sessions添加:setting.py:SESSION_ENGINE = ‘redus_sessions.session’SESSION_REDIS_HOST = ‘localhost’ #数据库的主机SESSION_REDIS_PORT = 6379 ...

2019-07-12 18:05:07 238

原创 Django(6) - 视图

视图概述:作用:视图接收web请求,并响应web请求本质:视图就是python中的一个函数响应:响应过程:用户在浏览器中输入网址www.sunck.wang/sunck/index.html—网址—>django获取网址信息,去掉IP与端口号,网址变成:sunck/index.html—虚拟路径与文件名—>url管理器逐个匹配urlconf,记录视图函数—视...

2019-07-12 18:03:00 79

原创 Django(5) -自定义模型

Django模型Django对各种数据库提供了很好的支持,Django为这些数据库提供了统一的调用API我们可以根据不同的业务需求选择不同的数据库。配置数据库修改工程目录下的__init__.py文件import pymysqlpymysql.install_ad_MySQLdb()修改settings.py文件中的DATABASES开发流程配置数据库定义模型类:一个模型都在...

2019-07-12 17:56:27 207

原创 Django(4) - 视图和模板的配置

视图的基本使用概述在Django中,视图是对web请求进行回应视图就是一个python函数,在views.py文件中定义。定义视图:示例:在myApp\views.py中写入from django.shortcuts import render# Create your views here.from django.http import HttpResponsedef inde...

2019-07-12 17:10:29 132

原创 Django(3) -数据表和页面管理

管理数据表:修改 myAPP\admin.py 如下:from django.contrib import admin#Register your models here.from .models import Grades, Students注册admin.site.register(Grades)admin.site.register(Students)自定义管理页面:属...

2019-07-12 17:00:46 134

原创 Django(2) - 模型的定义和数据操作

定义模型有一个数据表就对应有一个模型在models.py文件中定义模型引入:from django.db import models模型类要继承models.Model类示例:class Grades(models.Model):gname = models.CharField(max_length=20)gdate = models.DateTimeField()ggirlnu...

2019-07-12 16:48:23 141

原创 Django(1) - 简单的安装和配置

下载django的python包 pip install django pip install django==2.0.1切换到创建项目的目录 cd C:\Users\admin\Desktop\DjangoProject创建名为project的项目命令 django-admin startproject project注:所有路径不要有中文切换到新建的项目目录:cd ...

2019-07-12 16:40:54 69

原创 数据分析中的统计检验方法- t检验、f检验、卡方检验、互信息

数据的种类我们都知道,一般数据可以分为两类,即定量数据(数值型数据)和定性数据(非数值型数据),定性数据很好理解,例如人的性别,姓名这些都是定性数据。定量数据可以分为以下几种:定类数据表现为类别,但不区分顺序,是由定类尺度计量形成的。一般可以从非数值型数据中编码转换而来,数值本身没有意义,只是为了区分类别做出的数值型标识,比如1表示男性,0表示女性。定类数据无法比较大小,运算符也无意义。...

2019-07-12 16:25:24 44277 3

转载 Linux常用命令大全

转载自系统信息arch 显示机器的处理器架构uname -m 显示机器的处理器架构uname -r 显示正在使用的内核版本dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI)hdparm -i /dev/hda 罗列一个磁盘的架构特性hdparm -tT /dev/sda 在磁盘上执行测试性读取操作cat /proc/cpuinfo 显示CPU info的信...

2019-07-12 09:57:59 76

原创 leetcode - 49.Group Anagrams

遍历法遍历列表中的字符串,并将字符串排序,排序结果一致的字符串储存在一个字典中class Solution: def groupAnagrams(self, strs): res = dict() for s in sorted(strs): key = tuple(sorted(s)) res[key]...

2019-07-11 10:46:39 84

原创 leetcode - 48.Rotate Image

python式解法利用zip函数和*,首先将matrix反向,再利用zip压缩即可,*表示选择列表中的子列表,*listclass Solution: def rotate(self, matrix): """ Do not return anything, modify matrix in-place instead. """ ...

2019-07-11 10:42:32 115

原创 leetcode - 47.Permutations II

无重全排列递归解法class Solution: def permute(self, nums): res= [] self.recur([],nums,res) return res def recur(self,head,tail,res): if len(tail)<=1: re...

2019-07-11 10:40:53 86

原创 leetcode - 45.Jump Game II

贪婪算法定义step为步数,定义cur_pos和max_pos为当前能达到的最大位置和下一步能达到的最大位置,定义i表示两次最大位置中间隔的位置从第0步开始,计算每步能达到的最大位置,一直到达到终点位置,如果下一步的最大位置和本次最大位置一样,说明无法再前进class Solution: def jump(self, nums): max_pos,cur_pos =...

2019-07-11 10:38:06 91

原创 leetcode - 44.Wildcard Matching

DP算法定义状态dp(lengh=len(s)+1))表示s中的每个字符是否被p中的前几个子字符所匹配dp[0]用来表示p是否是以开头状态转移:若p中下一个字符为‘’,则newdp[i]=newdp[i-1] or dp[i] 0<i<n若p中下一个字符为’?’,则newdp = dp 0<i<n若p中下一个字符为其他字符,则newdp[i] = dp[i...

2019-07-11 10:36:33 145

原创 leetcode - 43.Multiply Strings

模拟乘法手算运算过程class Solution: def multiply(num1, num2): product = [0] * (len(num1) + len(num2)) pos = len(product)-1 for n1 in reversed(num1): tempPos = pos ...

2019-07-11 10:31:45 95

原创 leetcode - 42.Trapping Rain Water

简单解法从列表左边开始搜索,定义left=0,如果右边的数小于左边,则固定左边向右搜索,直到遇到右边某个数大于左边的数,或大于左边后的一个数,否则left+1class Solution: def trap(self, height): output = 0 left = 0 while left<len(height)-1...

2019-07-11 10:29:22 160

原创 leetcode - 41. First Missing Positive

简单解法class Solution: def firstMissingPositive(self, nums): n = len(nums) if n == 0: return 1 for i in range(1,n+2): if len([j for j in nums if j!=i...

2019-07-11 10:26:49 81

原创 leetcode - 40.Combination Sum II

DFS递归算法同上一题class Solution: def combinationSum2(self, candidates: List[int], target: int) -> List[List[int]]: candidates.sort() res = [] self.dfs(candidates,target,0,[...

2019-07-11 10:25:26 101

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除