- 博客(11)
- 收藏
- 关注
原创 用自编码器实现信用卡数据集的异常检测(详细),Pytorch版本
1.自动编码器(Auto encoder)自动编码器(au toencoder) 是神经网络的一种,该网络可以看作由两部分组成:一个编码器和一个生成重构的解码器)。传统上,自动编码器被用于降维或特征学习。其为非线性降维,传统的如:PCA,为线性降维。自编码器结构如下图所示,编码器来实现维度的压缩,解码器实现维度的恢复重构。自编码器可用于:训练深度学习网络、压缩、分类以及异常检测等,本文主要是异常检测的应用。2.数据集本文采用公开数据集,信用卡用户的异常检测。链接如下:链接:ht...
2021-11-26 17:02:14 5442 12
原创 机器学习决策树算法泰塔尼克号预测
对于数据集观察其中有11列个维度,需要对其中一些进行数据处理PassengerId ,乘客的id号,对生存率没影响。Survived ,应该是标签,1表示存活,0表示死亡。Pclass ,船舱等级,就是我们坐船有等级之分。这个属性会对生产率有影响。Name ,名字,这个不影响生存率。应该可以忽略。Sex , 性别,女士优先,所有这列保留,可能有影响。Age , 年龄,因为优先保护老幼,可能有影响。SibSp ,兄弟姐妹,就是有些人和兄弟姐妹一起上船的。这个会有影响,保留.
2021-11-12 21:17:00 1549
原创 python实现时间序列数据的填补
对于一个二维的Datafram序列部分如图,实现对其中间空缺值的填补。这里用到了pandas库中的重采样import numpy as npimport matplotlib.pyplot as pltimport pandas as pd#导入库df = pd.read_csv(path)df = df.drop_duplicates(['time'])#为防止有重复索引序列,将其删除df = pd.DataFrame(df).set_index('time')#将时间列变为索.
2021-10-27 11:25:57 3670 1
原创 用matplotlib绘制折线图
首先要导入matplotlib中的pyplot模块来用于绘图其次导入font_manager来显示中文from matplotlib import pyplot as pltfrom matplotlib import font_manager调整图片大小像素,dpi可调节像素,figsize调节长宽fig = plt.figure(figsize=(20,8),dpi = 80)选择载入中文的字体路径my_font = font_manager.FontPropert..
2021-08-23 12:06:59 675
原创 Python基础学习——Day5
1.类和对象都由方法属性组成,如下获得对象属性方法和属性字典class Student: def __init__(self,name,score): self.name = name self.score = score def say_score(self): print("{0}的分数是{1}".format(self.name,self.score))s1 =Student("huhu",18)s1.say_score(.
2021-08-16 21:36:48 45
原创 Python基础学习 函数
1.函数可用return返回值和结束函数执行,变量要对应def printMAX(a,b): if a>b: print(a) else: print(b)printMAX(10,20)def my_avg(a,b): return((a+b)/2)#返回值和结束函数执行print(my_avg(10,20))locals()可显示局部变量,globals()可显示全局变量。2.位置参数,默认值参数,命名参数#位置参数
2021-08-16 12:36:15 51
原创 用海龟画图画一个棋盘
import turtlex1 = 100y1 = 100turtle.speed(20)x2,y2 = -100,-100turtle.penup()turtle.goto(x2,y1)turtle.pendown()for i in range(20): turtle.goto(x1,y1-10*i) turtle.penup() turtle.goto(x2,y1-10*(i+1)) turtle.pendown()turtle.penup()tu.
2021-08-15 20:48:24 639
原创 Python基础学习——Day4
1.循环嵌套,最基础单分支结构if语句,和双分支结构if else,多分支结构用if,elif。#单分支a = input("请输入一个数字小于十")if int(a)<10: print(a)#双分支结构b = input("请输入一个数字")if int(b)<10: print("b小于10")else: print("b大于等于10")#多分支选择结构a = input("请输入成绩")if int(a)<60: pr
2021-08-15 19:05:23 74
原创 Python基础学习——Day3
常见的序列有字符串、列表、元组、字典以及集合。1.列表,可以直接创建,也可以用list()来创建和其他类型转化为列表a = [1,2,3,'s']b = list(range(10))c = list('assd,da')print(a,b,c)print(type(a),type(b),type(c))d = [x*2 for x in range(50) if x%9 == 0]print(d)列表的增加和删除可以用append,也可以用extend,插入可以用inser.
2021-08-14 16:27:47 191
原创 Python基础学习——Day2
1.在python中可导入时间并用时间计时import timeprint(time.time())2.布尔值运算。可通过==,>=和<=比较类=来布尔运算a = 10b = 20print(a == b)print(a >= b)print(a <= b)c = Trued = Falseprint(c or d)3.字符串操作字符串复制可直接用*倍数,转义字符可用\n换行。字符串的查找替换切片可用如下指令a = 'abcdefg'
2021-08-13 17:34:19 48
原创 Python基础学习——Day1
1.交互模式可以在交互模式输入python打开python,输入quit()可以退出。可以用以下代码在交互模式检测gpu下pytorch是否配置成功。2.程序基本格式(1) 恰当的空格缩进。用制表符来实现四个空格的缩进,缩进风格要统一。(2)python中要区分大小写。(3)注释。行注释用#来实现,注释内容不会运行。段注释用三个连续单引号实现,可忽略注释之间的内容不运行。a = 10b = 20'''段注释内不执行'''print(a)print(b)#导入t
2021-08-12 19:52:18 59
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人