- 博客(53)
- 收藏
- 关注
原创 oracle常用函数
oracle在update、delete、和inset操作后,要commit操作。接下来就是进行数据回滚操作了。(1)开启闪回,如果不开启无法进行闪回。DELETE FROM表名 WHERE 条件;Oracle 删除数据的几种方法。(2)闪回表数据到某个时间点。一 .创建存储过程语法。
2023-07-29 13:01:55 518
原创 机器学习总结
调和平均 和 F1值的关系:调和平均容易受极端值的影响,F1值相当于把精准率和召回率放在同等重要的位置进行衡量。链接:为何选用F1值(调和平均数)衡量P与R? - weixin_39490983的博客 - CSDN博客 https://blog.csdn.net/weixin_39490983/article/details/88297899调和平均数在F1上的应用 - 简书 ...
2019-06-11 12:13:39 275
原创 剑指offer(python)_动态规划——56. 从1到n整数中1出现的次数
56.(困难)(题目不难,难处在于,不要超过时间限制,内存限制,最优解法)输入一个整数n,求从1到n这n个整数的十进制表示中1出现的次数。例如输入12,从1到12这些整数中包含“1”的数字有1,10,11和12,其中“1”一共出现了5次。样例输入: 12输出: 51.暴力解法,超过内存限制(Memory Limit Exceeded )给的测试数据不大就能过,给的大的...
2019-04-13 16:45:28 467
原创 剑指offer(python)_动态规划——55. 连续子数组的最大和
55.(简单)——动态规划输入一个非空整型数组,数组里的数可能为正,也可能为负。数组中一个或连续的多个整数组成一个子数组。求所有子数组的和的最大值。要求时间复杂度为O(n)。样例输入:[1, -2, 3, 10, -4, 7, 2, -5]输出:18解题思路:动态规划问题状态:dp[i]记录当前以i结尾的连续数组的最大值(1)如果 dp[i]= ...
2019-04-13 13:46:51 695
原创 数据结构_总纲
目录数据结构:1.线性表:2.链表:3.栈和队列:4.几种排序算法:5.几种查找算法:6.二叉树和树:7.字符串匹配:8.图参考资料:数据结构:1.线性表:2.链表:3.栈和队列:4.几种排序算法:5.几种查找算法:6.二叉树和树:7.字符串匹配:8.图参考资料:数据结构与算法(python 语言描述)...
2019-04-08 22:41:38 294
架构(B站尚硅谷大数据项目实践 电影推荐系统概述)
详细版:整体流程:数据模型:数据模型解析:整体模块:环境搭建:数据加载服务:spark(scala)推荐模块:后台:前端:打包部署:解决冷启动问题:...
2019-03-28 12:22:50 5536 12
转载 sklearn preprocessing(预处理)
转发sklearn preprocessing (预处理) - 做梦当财神 - 博客园 https://www.cnblogs.com/keye/p/8194539.html预处理的几种方法:标准化、数据最大最小缩放处理、正则化、特征二值化和数据缺失值处理。知识回顾:p-范数:先算绝对值的p次方,再求和,再开p次方。数据标准化:尽量将数据转化为均值为0,方差为1的数据,形如标...
2019-03-26 22:28:15 480
原创 机器学习(三):决策树--回归树--提升方法
参考:七月在线机器学习第九期决策树,西瓜书目录决策树(Deecisioon Tree model)总体概括:(1)ID3:(2)C4.5(3)CART(二叉树)回归树:bagging思想:决策树优缺点:参考:决策树(Deecisioon Tree model)总体概括:逻辑回归过渡到决策树:对于相亲问题,有很多中就解决方案,用...
2019-03-20 16:54:15 3159
原创 机器学习——特征工程篇
参考:七月在线ML第九期-特征工程目录1.数据清洗2.采样2.特征工程数值型:(1)幅度缩放(最大最小值缩放,归一化。。。)(2)离散化/分箱分桶(等距pd.cut ,等频pd.qcut)(非线性,加速,特征交叉,健壮性)(3)统计值:(max,min ,quantile,均值,中位数,众数,分位数)(4)四则运算:(加减乘除)(5)幅度变化:(有一些...
2019-03-15 20:47:14 693
原创 机器学习(二):回归类问题
目录1.线性回归1.1线性回归1.1.1 一元线性回归1.1.2 多元线性回归1.2损失函数1.2.1 梯度下降(GD)1.3正则1.3.1 过拟合(overfitting)与欠拟合(underfitting)1.3.2 正则化2. 逻辑回归2.1 sigmoid()函数2.2 逻辑回归是怎样解决分类问题的2.3 损失函数2.4 ...
2019-03-11 17:09:33 740
原创 机器学习(一):机器学习入门常识
机器学习常常划分为三个方面:监督学习:(有标签的学习)包括分类,回归问题 无监督学习:(无标签的学习)聚类问题 强化学习:(有延迟的反馈)根据当前的处境选取最优解,比如下象棋,下完这步棋,在这步棋的基础上,争取下的最好,整部棋下的好坏,跟前几步都有关系。分类问题:因为有了标签值,根据算法,将样本归于哪一类。(逻辑回归,决策树,随机森林,svm)回归问题:是一个连续值,根据样本上的...
2019-03-10 23:11:03 441
原创 提交论文出现字体未嵌入的解决办法
Adobe Acrobat XI Pro破解版详细安装教程 https://www.douban.com/note/685235142/ 在EDAS提交论文时出错显示 “A PDF font is not embedde”的最直接的解决方法 - p=NULL; 的博客 - CSDN博客 https://blog.csdn.net/qq_30592147/article/details/835...
2019-02-19 22:49:55 1902
原创 python
python:解释性语言优点:第三方库比较多利用anaconda比较方便,提供的第三方库比较多create 创建不同的环境conda list 查看第三方库conda install 库名 安装第三方库最重要的是notbook,使用非常方便,类似于写博客,外部网页形式书写python : Jupyter Notebook 常用的三个库:numpy:数组,矩阵的运算...
2019-01-21 00:03:50 173
原创 pandas手册(用一个总结一个)
DataFrame.filter(items = None,like=None,regex=None,axis=None)例子:>>> dfone two threemouse 1 2 3rabbit 4 5 6>>> # select columns by name>>>...
2019-01-18 22:15:39 381
原创 numpy.take()从数组中取指定的行或列
成长需要一个过程,但是时间太漫长import numpy as npa = np.arange(12).reshape(3,4)print(a)print(a.take([1,2],axis = 1))#axis = 1 表示按照列来取print(a.take([1],1))print(a.take([1,2],axis = 0))#axis = 0 表示按照行来取输出:...
2019-01-18 19:36:02 4855 2
原创 数据的存储与读取:序列化文件pickle()用法
忽然想到唐家三少里面的一个魂技;坚挺!坚挺!!金苍蝇#coding:utf-8__author__ = 'DBL_fish'import pickleimport pickledataList = [[8,8,'hei'], [6,6,'ha'], [1,0,'he']]dadaDic = {0:[1,6,8,3], ...
2019-01-18 09:46:22 954
原创 正则
竖中指指 import repattern = re.compile(r'^(.*)\((\d+)\)$')print(pattern.match('Toy Story (1995)').group())print(pattern.match('Toy Story (1995)').group(1))print(pattern.match('Toy Story (1995...
2019-01-17 20:00:09 114
原创 numpy在矩阵中的简单应用
不得不吐槽一下:老板约好的今天讨论论文,结果又被放鸽子,结果一看朋友圈,老板居然在绕校园跑步,真特么心累。。。。 1.简单的一维二维数组:import numpy as np"""一维numpy数组"""a= np.array([1,2,3])#一维数组print(a)print(type(a))print(a.shape)print(a[0],a[1],a[...
2019-01-09 09:43:38 773
原创 个人感悟
我眼镜呢!!! 学习就是一个不断前进的过程,不能够懈怠,每周做一下总结,不仅对自己每周的知识的一个回顾,同时也能够查缺补漏。我并不在意自己的博客有多少人关注,我把写博客当作一种笔记。当很多年后,再次看到以前的青涩文章,感觉自己收获良多。 我决定了,每周天对自己做一个总结。 随着越来越大,发现无论是学习还是做人,不仅仅是能力问题,更主要的是一个态度问题!!!...
2019-01-07 17:41:23 515
原创 数据处理
这几天没有熬夜!啊,我黑眼圈哩!!!! 原始数据:data1,data2 data1: 每列代表:user, poi ,ratingdata2: 每列代表:poi, jingdu ,weidu 目标是把data2中的经纬度加入到data1中最终结果:每列代表:user,poi,rating,jingdu,weidu 数据处理...
2019-01-05 11:29:59 615
原创 ESMM
来一张狗头镇楼,镇压我代码万古岁月~~~~~~交叉熵损失函数开篇之前,记录以下关键名词:impression:用户观察到曝光的产品click:用户对曝光产品的点击conversion:用户点击后对物品的购买行为CTR:点击产品的次数 /...
2018-12-17 11:13:08 359
原创 tf.layers.dense()层的定义
dense( inputs, units, activation=None, use_bias=True, kernel_initializer=None, bias_initializer=tf.zeros_initializer(), kernel_regularizer=None, bias_regularizer=None,...
2018-10-30 20:50:41 5978 1
原创 zip,sorted小记
a = [3,1,2]b = [6,5,4]zipped = zip(a,b)print(zipped)b = list(zipped)print("b:",b)c=sorted(b,key=lambda x:x[0])#根据第一位排序 升序print("c:",c)d=sorted(b,key=lambda x:x[1])#根据第二位排序 升序print("d:",d)e...
2018-10-25 11:18:10 167
原创 tensflow自定义损失函数
三、自定义损失函数标准的损失函数并不合适所有场景,有些实际的背景需要采用自己构造的损失函数,Tensorflow 也提供了丰富的基础函数供自行构建。例如下面的例子:当预测值(y_pred)比真实值(y_true)大时,使用 (y_pred-y_true)*loss_more 作为 loss,反之,使用 (y_true-y_pred)*loss_lessloss = tf.reduce_...
2018-10-24 18:19:09 211
原创 csr_matrix矩阵用法小节
from scipy.sparse import *row = [0,0,0,1,1,1,2,2,2]#行指标col = [0,1,2,0,1,2,0,1,2]#列指标data = [1,0,1,0,1,1,1,1,0]#在行指标列指标下的数字team = csr_matrix((data,(row,col)),shape=(3,3))print(team)print(team...
2018-10-24 15:50:37 21801 2
原创 各种乘法的区别 “点积、外积、数乘...等
I've seen several conventions, including ⋅⋅, ∘∘, ∗∗, ⊗⊗, and ⊙⊙. However, most of these have overloaded meanings (see http://en.wikipedia.org/wiki/List_of_mathematical_symbols).Thus, in my persona...
2018-10-20 17:13:28 5584
原创 tensorflow模型的保存与加载
1.保存:(保存的变量都是停放,tf.Variable()中的变量,变量一定要有名字)saver = tf.train.Saver()saver.run(sess,"./model4/line_model.ckpt") 2.查看保存的变量信息:(将保存的信息打印出来)from tensorflow.tools.inspect_checkpoint import prin...
2018-10-20 17:05:52 232
原创 tensorflow入门线性回归
实际上编写tensorflow可以总结为两步. (1)组装一个graph; (2)使用session去执行graph中的operation。 当使用tensorflow进行graph构建时,大体可以分为五部分: 1、为输入X与输出y定义placeholder; 2、定义权重W; 3、定义模型结构; 4、定义损失...
2018-10-20 16:24:34 290
原创 python充电
flatten()函数的用法 使数组或者矩阵变成一维用在数组import numpy as npa = [[1,3],[2,4],[3,5]]a = np.array(a)b = a.flatten()print(a)print(b)输出:[[1 3] [2 4] [3 5]][1 3 2 4 3 5]Process finished with exit co...
2018-10-19 19:12:43 559
原创 One_Hot数据预处理
在很多机器学习任务中,特征并不总是连续值,而有可能是分类值数据预处理之One-Hot 0.说在前面 1.什么是One_Hot? 2.One_Hot编码处理离散特征 3.One_Hot编码实现 4.作者的话0.说在前面前面一节我们讲了机器学习过程中的特征工程处理,那么这一节是不是该到数据预处理了呢,对头!接下来,我们进入数据预处理环节...
2018-10-15 09:44:09 2371
原创 leetcode(3)无重复字符的最长子串
3. 无重复字符的最长子串题目描述提示帮助提交记录社区讨论阅读解答随机一题给定一个字符串,找出不含有重复字符的最长子串的长度。示例 1:输入: "abcabcbb"输出: 3 解释: 无重复字符的最长子串是 "abc",其长度为 3。示例 2:输入: "bbbbb"输出: 1解释: 无重复字符的最长子串是 "b",其长度为 1。示例 3:输入:...
2018-10-12 23:01:00 116
原创 python实现k近邻算法
很简单的一个分类算法:根据不同特征值之间的距离方法进行分类优点:输入高,对异常值不敏感,无数据输入假定缺点:计算复杂度高,空间复杂度高适用数据范围:数值型 和 标称型 代码实现:"""K近邻算法""""""伪代码:(1)计算已知数据集的点与当前点之间的欧式距离(2)按照距离递增顺序进行排序(3)选取与当前距离最小的K个点(4)确定前K个点所属类别的出现频率...
2018-10-07 21:58:25 804
原创 (leetcode)66. 加一
题目描述:给定一个由整数组成的非空数组所表示的非负整数,在该数的基础上加一。最高位数字存放在数组的首位, 数组中每个元素只存储一个数字。你可以假设除了整数 0 之外,这个整数不会以零开头。示例 1:输入: [1,2,3]输出: [1,2,4]解释: 输入数组表示数字 123。示例 2:输入: [4,3,2,1]输出: [4,3,2,2]解释: 输入数组表示...
2018-10-07 20:43:47 97
原创 (leetcode)67.二进制求和
今天做的一道leetcode 二进制求和 分享给大家67. 二进制求和给定两个二进制字符串,返回他们的和(用二进制表示)。输入为非空字符串且只包含数字 1 和 0。示例 1:输入: a = "11", b = "1"输出: "100"示例 2:输入: a = "1010", b = "1011"输出: "10101" 很简单的一个实例cla
2018-10-07 12:55:08 123 1
转载 tensorflow学习笔记--embedding_lookup()用法
个人分类: tensorflowpython所属专栏: Tensorflow修炼手册版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u013041398/article/details/60955847embedding_lookup( )的用法 关于tensorflow中embedding_lookup( )的用法,在Udac...
2018-09-13 15:37:25 319
原创 写第一个Templates,models,admin
修改方式:setting.py 改成想要用的模板引擎(1)blog->new->Directory->新建template目录 ->(2)在template目录下 new->html.file <h1>hello,blog<h1>(3)view.py models.py...
2018-05-27 20:42:30 5188
原创 django安装
第二种URL配置格式myblog.py ->urls.py可将总索引改成myblog在blog.py里面创建urls.py子索引为空 这样输出来的就是http://127.0.0.1:8080/myblog
2018-05-26 11:01:36 145
转载 【django】Error: [WinError 10013] 以一种访问权限不允许的方式做了一个访问套接字的尝试
亲测有效问题描述:启动django服务时出现“Error: [WinError 10013] 以一种访问权限不允许的方式做了一个访问套接字的尝试。”的错误问题原因:8000端口被占用了解决办法:默认启动的服务端口是8000,启动时修改该端口即可指定新端口重新启动...
2018-05-25 11:11:14 26588 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人