今晚月亮有点圆-CSDN博客

原创 linux设置jupyter开机自启

ExecStart=路径/bin/jupyter-lab --config=路径/jupyter_lab_config.py。WorkingDirectory=工作目录。非root用户需要sudo。

2022-08-24 11:21:36 1075 1

原创 linux安装jupyter lab并实现远程连接

由于公司服务器自带防火墙了，我就进行了简单设置，私人服务器应该要注意设置防火墙。服务器使用python运行以下指令。在文档中找到想要修改的命令进行修改。conda或者pip都可。直接在浏览器访问即可。...

2022-08-19 09:56:00 1002 1

原创 python传参传的是什么

虽然写了很长时间，但是这个点一直非常模糊，每次为了省事都直接return。

2022-07-21 09:43:43 91

我猜测函数可能是根据这一分类依据自动创建了leiden_color并进行分类和上色。我猜测每次生成umap，图中的颜色都是从这个数组中取得的，于是我尝试把相同celltype的颜色改为一致。在用scanpy进行单细胞分析时常常要对聚类后的簇进行细胞标注并生成细胞图谱，但是在通常使用的更改注释的方法中。好吧，现在相同celltype的颜色总算是一致了，总体美观多了，就是右侧的类型注释还是没有做到合并。的字符不允许重复，而我无法确保每一个簇的细胞类型都不相同，于是我只能在相同的细胞类型后添加。...

2022-07-19 14:29:10 1617 2

原创 scanpy细胞类型标注（marker基因对比）

scanpy细胞类型标注

2022-07-13 15:50:28 2189

原创 python生成多维矩阵

python如何生成多维矩阵

2022-07-11 09:05:27 1883

原创数美22春招算法题

一# 贪心def func(arr): maxp = 0 end = 0 step = 0 for i in range(len(arr)-1): maxp = max(maxp, i + arr[i]) if end == i: step = step+1 end = maxp return step二在这里插入代码片三# 优先队列使用堆排序def func(a

2022-05-31 08:25:23 248

原创 Python写字

from turtle import *speed(1)#bgpic(r"abc.gif")def writeString(mystr,fontsize=60): pendown() write(mystr,font=('楷体',fontsize,'normal')) penup()def yinzhang(): pensize(2) pencolor('red') pendown() for i in range(4):

2022-05-22 18:50:59 1335

原创费米问题求解

费米估算介绍有时在面对一个问题时，往往会因为解决这个问题的信息资源有局限，条件资源有局限，而感到无从下手。而费米估算正是解决如何在数据不明确、以及各种限制条件下，利用一些假设的理由和经验推算出正确答案这一问题的方法。其具体思路为，通过公式或者逻辑将大的问题拆解为多个可以解决的小问题，再通过小问题的求解来得到大问题的答案。例子：芝加哥有多少调音师有公式如下：总人数 = 总工作时长 / 单人工作时长所以问题可以分解如图：此时问题已经拆解至可解，而对于可解问题，仍然没有一个准确的数据，此时就需

2022-05-22 18:29:18 467

原创 vgsales游戏销售数据分析

分析目标游戏类型销量趋势（近年热门游戏类型）游戏平台销量趋势（近年热门平台类型）游戏地区销量趋势（近年高销量地区）类型标准差：31.0385平台标准差：94.1193发行商标准差：10.8071大区标准差：41.3870...

2022-04-10 00:05:19 630

原创电信客户流失分析实战

分析目标找到流失用户特点预测用户是否流失提出优化建议源数据数据预处理数据清洗import pandas as pdf = pd.read_csv(r'D:\Data\电信用户流失' r'\WA_Fn-UseC_-Telco-Customer-Churn - Copy.csv') #检索数据print(pd.isnull(f).sum(), f.info())#按列检索数据# for x in f.columns:#

2022-02-25 10:03:04 1224 1

原创 Airbnb NYC2019分析实战

分析目标民宿特征分布图可视化（位置、房型、价格）寻找热门民宿特点源数据数据预处理字段分析字段含义id民宿idname民宿名称host_id房东idhost_name房东姓名neighbourhood_group邻近大区neighbourhood临近社区latitude维度longitude经度room_type房型price价格minimum_nights最少入住天数number_of_r

2022-02-20 18:07:39 460 1

原创 MySQL经典习题50道

根据以下博文所创建的自己的答案原博文先建四张表学生表 Studentcreate table Student(SId varchar(10),Sname varchar(10),Sage datetime,Ssex varchar(10));insert into Student values('01' , '赵雷' , '1990-01-01' , '男');insert into Student values('02' , '钱电' , '1990-12-21' , '男');insert

2022-02-08 17:22:58 55

转载三大特征提取器（RNN/CNN/Transformer）

三大特征提取器 - RNN、CNN和Transformer简介近年来，深度学习在各个NLP任务中都取得了SOTA结果。这一节，我们先了解一下现阶段在自然语言处理领域最常用的特征抽取结构。本文部分参考张俊林老师的文章《放弃幻想，全面拥抱Transformer：自然语言处理三大特征抽取器（CNN/RNN/TF）比较》(写的非常好，学NLP必看博文)，这里一方面对博文进行一定程度上的总结，并加上一些个人理解。在深度学习流行起来之后，随着我们的网络越做越深，我们的神经网络模型越来越像一个黑箱，我们只要喂给它

2021-06-11 10:30:56 11468 1

转载 4种边界Padding方法

卷积操作作为卷积神经网络的核心模块，在其计算过程中必须考虑图像“边缘像素”的卷积方式。查阅资料发现，我们可以采用“卷积之前进行边界填充”或“卷积之后进行边界填充两种方式”，同时边界填充的具体手段包含常量填充、零填充、镜像填充以及重复填充等。比起使用卷积自带的填充方式，提前填充有更强的功能有更大的自由，更为推荐。在具体分析各种Pad之前，先创建一个2dTensor用于测试后面的填充操作：x = torch.Tensor([[1, 2], [3, 4]])创建的Tensor数值分别1、2、3、4：1

2021-04-06 14:45:18 2419

转载卷积的三种模式:full, same, valid

卷积的三种模式:full, same, valid通常用外部api进行卷积的时候，会面临mode选择。本文清晰展示三种模式的不同之处，其实这三种不同模式是对卷积核移动范围的不同限制。设 image的大小是7x7，filter的大小是3x31，full mode橙色部分为image, 蓝色部分为filter。full模式的意思是，从filter和image刚相交开始做卷积，白色部分为填0。filter的运动范围如图所示。2，same mode当filter的中心(K)与image的边角重合时

2021-04-06 14:30:09 367

转载卷积核为何是奇数

为什么CNN中的卷积核一般都是奇数为什么CNN中的卷积核一般都是奇奇数奇数，没有偶数偶数的？咱们经常见到的多为 3 * 3、55;怎么从来没有见过 44，6*6 之类的卷积核？无论奇数 or 偶数，都是能够做卷积的呀之前学习的时候真的没有想过这些问题，再复习时，觉得全是 Why?说明之前还是没有搞明白从AlexNet模型的1111、55、33，还有VGG开始统一卷积核为33，再到之后的模型，都没有用过偶数偶数的卷积核，说明它是有问题的，或者是没有奇数奇数的方便这一串的问题，原因有两个：1.保

2021-04-06 10:08:18 479

原创将.mat转为.csv

import pandas as pdimport scipyfrom scipy import io# 文件路径features_struct = scipy.io.loadmat(r'D:\Document\Cincinnati_Bearing\提取\feature1.mat')# matlab变量名features = features_struct['ans']dfdata = pd.DataFrame(features)# 存储路径datapath1 = r'D:\Documen

2021-03-31 11:23:50 739 3

原创 12.PyTorch深度学习实践——循环神经网络（基础）

循环神经网（RNN）络被大量运用于NLP领域，但是实际上，只要是时序信号比如轴承振动信号等交由RNN处理都有不错的效果。本节就来熟悉RNN的使用。如上图所示，RNN由同一循环单元重复运算构成，它的参数会随着每次运算改变。单个循环单元解释如下：从这里可以看到，它通过将输入x线性变换成和隐层h维度相同而进行运算，所以通过输入x维度和隐层h维度即可确认循环单元，可得公式如下：这里即是构造了一个循环单元，只需将循环单元循环使用即可构造RNN网络。在构造之前我们需要数据维度，网络运输就是一个维度变换的过程

2021-03-15 15:44:47 874

原创 10.PyTorch深度学习实践——卷积神经网络（基础）

本节开始学习卷积神经网络卷积神经网络(Convolutional Neural Networks, CNN)最早由Alexander Waibel于1987年提出，起初被称作时间延迟网络(Time Delay Neural Network, TDNN)，在Yann LeCun于1989年论述网络结构时提到了“卷积”一词，因此得名。同年Yann LeCun及其合作者的LetNet-5项目为CNN引入了池化层，该项目及其变体不断发展完善CNN，最终定义了现代CNN的基本结构。还记得上一节中我们使用全连接神经

2021-02-23 13:16:47 674 3

原创 09.PyTorch深度学习实践——多分类问题

import torchfrom torchvision import transformsfrom torchvision import datasetsfrom torch.utils.data import DataLoaderimport torch.nn.functional as Fimport torch.optim as optimbatch_size = 64transform = transforms.Compose([ transforms.ToTensor()

2021-02-18 18:28:05 489

原创 08.PyTorch深度学习实践——加载数据集

这节主要看到了DataLoader的使用和batch_size对训练的影响，DataLoader帮助我们更便捷的操作数据集，batch_size会极大地影响训练效果准备先了解机器学习中的Epoch，Batch_size，Iteration三个概念，其实也是之前一直用到的用公式表示：Epoch = Batch_size * Iteration为什么用DataLoader？DataLoader帮我们做了什么？实验了解了基本概念和DataLoader后直接上代码，对比Batch_size对训练

2021-02-06 16:39:29 268

原创 07.PyTorch深度学习实践——处理多维特征的输入

采用sigmoid激活函数import numpy as npimport torchimport matplotlib.pyplot as plt#这里之所以设置为float32是因为大部分显卡的存储都支持，只有少部分高端显卡支持doublexy = np.loadtxt('data/diabetes.csv.gz', delimiter=',', dtype=np.float32)x_data = torch.from_numpy(xy[:, :-1])y_data = torch.fr

2021-02-04 12:26:31 214

原创 06.PyTorch深度学习实践——逻辑斯蒂回归

逻辑回归主要用于二分类问题（Binary Classification），与线性回归的区别在于添加了sigmoid激活函数（sigmoid函数也叫Logistic函数），使线性回归预测值映射在（0，1）之间，代表二分类的概率；损失函数改为计算分布差异的损失函数BCELoss，计算分布差异的方法还有很多，如KL和Cross Entropy。在损失函数中有一个选项为是否求均值，这里是否都可，主要是对学习率有影响。import torchimport matplotlib.pyplot as pltimp

2021-02-03 11:56:26 184

scGPT human checkpoint

boston_house_prices.csv

空空如也