废物药浪学代码-CSDN博客

原创 Anaconda的安装、配置与使用conda安装软件

利用conda快速安装软件安装软件与使用软件是计算生物学需要掌握的技能，大部分的软件都是命令行软件。早先的时候安装软件特别麻烦，现在出了很多自动安装软件的框架，例如conda。起初这个框架只是为了方便安装Python 版本与Packages，但是后来无论是C/C++或者R 之类的运行环境也都能安装了。它有一些已经打包好的安装了各种软件的发行版，例如Anaconda。1.安装conda可以去anaconda官网下载最新版本，或者去镜像源站下载anaconda的历史稳定版本，也可以安装更小型的minico

2021-10-26 00:04:10 15530 1

原创【sklearn】如何使用Pipeline来整洁深度学习模型代码

Pipeline介绍Pipeline是一种使数据预处理和建模代码井井有条的简单方法。具体来说，管道打包捆绑了（bundles）预处理和建模步骤，因此您可以像使用单个步骤一样使用整个捆绑包。许多数据科学家在没有Pipeline的情况下将模型组合在一起，但Pipeline有一些重要的好处。其中包括：更简洁的代码：在预处理的每个步骤中处理数据可能会变得混乱。使用管道，您无需在每个步骤手动跟踪您的训练和验证数据。更少的错误：错误应用步骤或忘记预处理步骤的机会更少。更易于生产：将模型从原型转换为可大规

2021-08-13 17:17:15 1317

原创【蛋白结构AI预测时代】在Colab上使用AlphaFold2教程

标题Alphafold2 开源了！！！这将进一步推动学界预测和设计蛋白。可以看到官网上给出的结果图，结构生物学实验解得的结构与预测的别无二致。但模型的数据与预测所需资源过大，跑起来也比较费时，这里用Sergey Ovchinnikov 提供的“alphafold_single_sequence.ipynb”的代码，快速跑通看一下它的效果。%%bashgit clone https://github.com/deepmind/alphafold.gitmv alphafold alphafold_

2021-07-22 10:11:31 17759 24

原创【Kaggle竞赛树叶分类Baseline】上万片树叶分为一百七十六类

【Kaggle竞赛树叶分类1】https://www.kaggle.com/c/classify-leaves任务是预测叶子图像的类别。该数据集包含 176 个类别、18353 张训练图像、8800 张测试图像。每个类别至少有 50 张图像用于训练。测试集平均分为公共和私人排行榜。本次比赛的评估指标是分类准确度。本章的内容是介绍Baseline。下一章将介绍提升分类准确度的tricks和模型环境：将使用google colab pro作为代码运行和云服务器平台。#先分配GPU!nvidia-smi

2021-07-17 22:24:14 8621 22

原创【Golang语言之旅3】Create and use Module!~完整七步

创建一个Go模块接下来，将创建两个模块。第一个是旨在由其他库或应用导入的库。第二个是将使用第一个的调用应用。本教程包括七个简短的主题，每个主题都说明了语言的不同部分。创建一个模块——用你可以从另一个模块调用的函数编写一个小模块。从另一个模块调用您的代码——导入并使用您的新模块。返回并处理一个错误——添加简单的错误处理。返回一个随机的问候——处理切片中的数据（Go 的动态大小的数组）。为多人返回问候——将键/值对存储在映射中。添加测试——使用 Go 的内置单元测试功能来测试您的代码。

2021-07-16 09:36:56 566

原创【Golang语言之旅2】Get started with Go!

在前一节中，已经讲述了Go是如何安装的，这一节将介绍Go代码的简单实现：编写简单的“Hello, world”代码。使用 go 命令运行您的代码。使用 Go 包发现工具查找可以在您自己的代码中使用的包。调用外部模块的函数。1.实现“Hello world”首先，在cmd或者是vs code的终端输入命令行，创建一个“hello”文件夹cd mkdir hellocd hello然后，在本例中，在终端输入go mod init example.com/hello命令行，创建一个go.

2021-07-14 13:48:37 369

原创【Golang语言之旅1】Now，Let‘s Go!

Golang学习日记（1）：Go的安装与教程Golang下载地址：https://golang.org/点击Download Go下载后安装，我选择了Window版本的下载安装。一路next，完成安装。Go官方教程最快的系统学习方法是跟着官方教程走一遍Go。https://tour.go-zh.org/list...

2021-07-14 12:55:35 289

原创【AutoGluon的安装】仅用几行代码实现高性能的AutoML

AutoGluon（官网：https://auto.gluon.ai/stable/index.html）AutoGluon：可用于文本、图像和表格数据的 AutoML。 AutoGluon 支持易于使用和易于扩展的 AutoML，重点是自动堆栈集成、深度学习以及跨越文本、图像和表格数据的实际应用程序。AutoGluon 面向机器学习初学者和专家，使您能够：使用几行代码快速为原始数据构建深度学习和经典 ML 解决方案原型。在没有专业知识的情况下自动利用最先进的技术（在适当的情况下）。利用自动超参

2021-07-14 10:40:55 5397

原创【Keras入门】1.4用于降维的自编码器Autoencoder与PCA

0.1用于降维的主成分分析法（PCA）0.2用于降维的自编码器（Autoencoder）1.加载数据，并将28×28的图片Reshape成784维的向量from keras.datasets import mnist(x_train, y_train), (x_test, y_test) = mnist.load_data()print('shape of x_train:' + str(x_train.shape))print('shape of x_test:' + str(x_tes

2021-07-09 00:29:47 2419

原创【Kaggle竞赛猫狗分类】1.3 卷积神经网络中的Tricks（使用keras为例）

Kaggle竞赛的猫狗分类：https://www.kaggle.com/c/dogs-vs-cats/-展示如何使用卷积神经网络CNN的Tricks如Dropout、数据增强、预训练、Ensemble、多任务学习，来提高CNN的泛化能力。CNN0.下载和解压猫狗图片数据集猫狗分类数据集下载: https://www.kaggle.com/c/dogs-vs-cats/data下载好后解压到相应文件夹。1.加载和处理猫狗图片数据集1.1加载数据集（划分为猫狗两个文件夹）from ker

2021-07-08 00:19:53 1093 2

原创【Keras入门】1.2 使用Keras训练卷积神经网络CNN（手写数字为例）

将以最简单的MNIST数据集展示如何使用Keras框架训练卷积神经网络CNN。卷积神经网络CNN，在测试集上的精度达到了98.8%最简单的神经网络（输入784维，输出10维）1.加载和处理MNIST数据集1.1 加载数据集from keras.datasets import mnist(x_train, y_train), (x_test, y_test) = mnist.load_data()print('shape of x_train:' + str(x_train.shape)

2021-07-07 15:25:25 618

原创【Keras入门】1.1 使用Keras训练简单的神经网络（手写数字为例）

将以最简单的MNIST数据集展示如何使用Keras框架训练神经网络。最简单的神经网络，在测试集上的精度达到了88.5%使用全连接的神经网络，精度达到97.2%。最简单的神经网络（输入784维，输出10维）1.加载和处理MNIST数据集1.1 加载数据集from keras.datasets import mnist(x_train, y_train), (x_test, y_test) = mnist.load_data()print('shape of x_train:' + st

2021-07-07 14:03:14 773

原创 Colab防断，防止colab每隔一段时间自动断连。

通过设置Colab自动点击网页，防止断连Colab目前30min会自动断开运行程序，如下方法可以解决该问题，亲测有效。按Ctrl+ Shift + i 或者F12打开浏览器控制台，找到console，在其中输入：function KeepClicking(){ console.log("Clicking"); document.querySelector("colab-toolbar-button#connect").click()}setInterval(KeepClicking,6000

2021-04-15 23:29:18 9168 4

原创 Day11 PicGo + GIthub 图床搭建教程

图床PicGO + GithubPicGO 为上载器Github 为图片托管网站新建github仓库用户settings -> Developer settings -> Personal access tokens -> Generate new token -> 取名并勾上repo -> 复制 token下载 PicGo配置Github图床用户名/仓库名main or master[复制的Token]在仓库下创建文件夹的名字加速访问的域名 ht

2021-04-10 08:03:51 252

原创 Win10 Edge浏览器设置默认bing/google为搜索引擎教程

看了许多网上的教程，都说从设置里面的高级设置里进去更改搜索引擎，但并没有找到高级设置。后来在设置-隐私、搜索和服务-地址栏和搜索中找到。更换搜索引擎。

2021-04-06 09:21:17 7204 2

原创 WSL Windows下使用linux 配置环境

装了个WSL运行unbuntu，才发现安装环境这么简单，git clone 以后conda别人环境的yml就行。之前还用conda一个个配置对应的环境，浪费了不少时间。

2021-04-03 18:47:38 318

原创 Ubuntu20.04 安装 Anaconda3

环境：VMware12， Ubuntu20.04 64位1.下载Anaconda3安装包为了下载更快，在清华大学开源软件镜像站，这里我选择了Anaconda3-5.3.1-Linux-x86_64.sh下载，如下图所示。https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/2. 使用命令行安装Anaconda3（1）Open in Terminal（2）cd到安装包下载的位置cd Downloads（3）bash运行安装包文件bash

2021-03-20 23:38:26 2472

转载机器学习算法（九）: 基于线性判别LDA模型的分类（基于LDA手写数字分类实践）

机器学习算法（九）: 基于线性判别模型的分类1.前言：LDA算法简介和应用1.1.算法简介线性判别模型（LDA）在模式识别领域（比如人脸识别等图形图像识别领域）中有非常广泛的应用。LDA是一种监督学习的降维技术，也就是说它的数据集的每个样本是有类别输出的。这点和PCA不同。PCA是不考虑样本类别输出的无监督降维技术。LDA的思想可以用一句话概括，就是“投影后类内方差最小，类间方差最大”。我们要将数据在低维度上进行投影，投影后希望每一种类别数据的投影点尽可能的接近，而不同类别的数据的类别中心之间的距离

2021-03-20 23:03:19 4868

转载机器学习算法（八）：基于BP神经网络的预测（乳腺癌分类实践）

机器学习算法（八）：基于BP神经网络的预测1.前言：算法简介和应用1.1.算法简介BP（Back Propagation）网络是1986年由Rumelhart和McCelland为首的科学家小组提出，是一种按误差逆传播算法训练的多层前馈网络，是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系，而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法，通过反向传播来不断调整网络的权值和阈值，使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层（inp

2021-03-20 22:51:56 12059 12

原创 Day10 ：编辑器 Emacs 快速入门

Emacs 教程简介界面配置配置文件插件进阶基本概念–命令模式帮助基本内容文件操作复制粘贴撤销重做ReferenceEmacs 教程简介Emacs是一个编辑器，与Vim一起并称为两大神器。Vim 是编辑器之神而 Emacs 是神之编辑器，世界上的程序员分三种，一种使用Emacs，一种使用vim，剩余的是其它。Emacs是一个架构在编辑器上的集成环境，除了最基本的编辑功能，还可以完成文件管理、终端模拟、浏览网页、收发邮件、编译程序等工作，以及煮...

2021-03-20 14:14:56 457

原创 DAY9 ：划词翻译字典 goldendict 使用教程

goldendict 教程安装sudo apt-get install goldendictsudo apt-get remove youdao-dict如果有代理，请设置google 整句翻译安装 translat-shellgit clone https://github.com/soimort/translate-shellcd translate-shell/makesudo make install打开 GoldenDict，在菜单编辑-词典-词典来源-程序中，点击

2021-03-20 14:13:23 1390

原创 PyCharm中添加常用的文件夹路径

通过File->Settings->Project->Project Structure->Add Content Root增加新目录，如图：这样就实现了可以访问多个文件夹。

2021-03-16 20:08:43 6278 1

原创 win10 网页你尚未连接代理服务器可能有问题，或地址不正确。

win10在使用浏览器添加网页时出现，但QQ微信能使用。你尚未连接代理服务器可能有问题，或地址不正确。原因分析：因为使用了科学上网，可能涉及到了代理服务器相关。解决方法：在这里输入代理。打开代理服务器设置。发现使用代理服务器被打开，将其关闭。再次使用浏览器，发现问题解决，可以上网了。...

2021-03-15 16:47:32 51833 17

转载 Pytorch基础教程（8）: 强化——混合前端的seq2seq模型部署

本节将介绍如何把seq2seq模型转换为PyTorch可用的前端混合Torch脚本。我们要转换的模型来自于聊天机器人教程Chatbot tutorial。1. 混合前端在一个基于深度学习项目的研发阶段, 使用像PyTorch这样即时eager、命令式的界面进行交互能带来很大便利。这使用户能够在使用Python数据结构、控制流操作、打印语句和调试实用程序时通过熟悉的、惯用的Python脚本编写。尽管即时性界面对于研究和试验应用程序是一个有用的工具，但是对于生产环境中部署模型时，使用基于图形graph

2021-03-13 12:52:14 553 1

转载 Pytorch基础教程（7）: 强化——迁移学习

在深度学习模型日益庞大的今天，并非所有人都能满足从头开始训练一个模型的软硬件条件，稀缺的数据和昂贵的计算资源都是我们需要面对的难题。迁移学习可以帮助我们缓解在数据和计算资源上的尴尬。作为当前深度学习领域中最重要的方法论之一，迁移学习有着自己自身的理论依据和实际效果验证。作为一门实验性学科，深度学习通常需要反复的实验和结果论证。在现在和将来，是否有海量的数据资源和强大的计算资源，这是决定学界和业界深度学习和人工智能发展的关键因素。通常情况下，获取海量的数据资源对于企业而言并非易事，尤其是对于像医疗等特定领.

2021-03-13 12:40:54 619

转载 Pytorch基础教程（6）: 数据增强——数据加载和处理

Pytorch提供了许多工具来简化和希望数据加载，使代码更具可读性。这里将专门讲述transforms数据预处理方法，即数据增强。数据增强又称为数据增广、数据扩增，它是对训练集进行变换，使训练集更丰富，从而让模型更具泛化能力。from PIL import Imagefrom torchvision import transforms as Timport torch as tto_tensor = T.ToTensor()to_pil = T.ToPILImage()cat = Ima.

2021-03-13 12:23:19 858

转载 Pytorch基础教程（5）：实战案例----手写数字分类任务

Fashion-mnist分类任务Fashion-mnist经典的MNIST数据集包含了大量的手写数字。十几年来，来自机器学习、机器视觉、人工智能、深度学习领域的研究员们把这个数据集作为衡量算法的基准之一。你会在很多的会议，期刊的论文中发现这个数据集的身影。实际上，MNIST数据集已经成为算法作者的必测的数据集之一。有人曾经调侃道：“如果一个算法在MNIST不work，那么它就根本没法用；而如果它在MNIST上work，它在其它数据上也可能不work！”Fashion-mnist的目的是要成为MNI

2021-03-13 12:01:41 575

转载 Pytorch基础教程（4）：入门——神经网络

softmax的基本概念分类问题：一个简单的图像分类问题，输入图像的高和宽均为2像素，色彩为灰度。图像中的4像素分别是x1x_1x1，x2x_2x2，x3x_3x3，x4x_4x4。假设真实标签为狗、猫或者鸡，这些标签对应的离散值为y1y_1y1，y2y_2y2，y3y_3y3。我们通常使用离散的数值来表示类别，例如y1=1y_1=1y1=1，y2=2y_2=2y2=2，y3=3y_3=3y3=3。权重矢量o1=x1w11+x2w21+x3w31+x4w41+b1

2021-03-13 10:06:14 159

转载 Pytorch基础教程（3）：入门——autograd自动微分

Pytorch基础教程（3）：autograd-自动微分import torchtorch.manual_seed(7)<torch._C.Generator at 0x7f3c1f9e0490>1. torch.autograd.backward(tensors, grad_tensors=None, retain_graph=None, create_graph=False)功能：自动求取梯度tensors：用于求导的张量，如 lossretain_graph：保存计

2021-03-13 09:57:54 234

转载 Pytorch基础教程（2）：入门基本原理与如何创建/操作张量

本节含量较大，包含深度学习基本原理、分类与回归基本原理、如何创建张量、自动求导、定义神经网络结构与损失函数。1. 深度学习基本原理深度学习的概念源于人工神经网络的研究，是机器学习研究的一个新的领域，目的是建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像、声音和文本。作为一种机器学习方法，深度学习能让我们用给定的输入值训练AI模型预测输出值。这是在 http://playground.tensorflow.org/ 尝试构建的多层神经网络实现分类，如下图所示。2. 分

2021-03-13 09:49:52 363

原创 Day6: Markdown.md教程

Markdown教程标题一级标题二级标题三级标题四级标题五级标题六级标题字体分隔线删除线分段下划线脚注列表效果一致任务列表区块代码链接图片表格高级技巧支持HTML标签注释转义Latex 公式ReferenceMarkdown教程“Markdown” is two things:(1) a plain text formatting syntax;(2) a software tool, ...

2021-03-07 13:21:01 210

原创 Day5: 用Everything一秒查找文件

Everything 使用教程快速上手介绍Everything是voidtools开发的一款文件搜索工具，官网描述为“基于名称实时定位文件和目录（Locate files and folders by name instantly）”。它体积小巧，界面简洁易用，快速建立索引，快速搜索，同时占用极低的系统资源，实时跟踪文件变化，并且还可以通过http或ftp形式分享搜索。在搜索框输入文字，它就会只显示过滤后的文件和目录。Everything搜索只基于文件和文件夹的名称，所以它创建数据库很快。一

2021-03-06 09:23:37 354

转载 Pytorch基础教程（1）：人工智能与Pytorch简介

Pytorch基础教程（1）：人工智能与Pytorch简介1.人工智能简介人工智能是新一轮科技革命和产业变革的重要驱动力量，其发挥作用的广度和深度堪比历次工业革命。蒸汽革命成就了英国，电气和信息化革命成就了美国。如今人工智能的历史机遇正在全面展开，也将成就新的引领者。下图显示了一部典型iPhone手机上安装的一些常用应用程序。苹果Siri等智能助理和智能聊天类应用，正试图颠覆你和手机交流的根本方式；新闻头条等热门新闻应用依赖于人工智能技术向你推送最适合你的新闻内容；美图秀秀等利用人工智能技术

2021-03-05 12:10:03 681

原创 Day4： Jupyter 主题修改

Jupyter 修改主题# 安装，当然也可用conda来安装pip install --upgrade jupyterthemes# 加载可用主题列表jt -l# 选择你想要的主题jt -t <name of the theme># 恢复到最初主题，会清空你的参数设置jt -r# 如果字体太小了看不清可以用下面的命令来调节## 其中 -f(字体) -fs(字体大小) -cellw(占屏比或宽度) -ofs(输出段的字号) -T(显示工具栏) -N(显示自己主机名)j

2021-03-05 09:50:14 146 1

转载机器学习算法（七）: 基于LightGBM的分类预测（基于英雄联盟10分钟数据判断红蓝方胜负）

机器学习算法（七）基于LightGBM的分类预测1. 实验室介绍1.1 LightGBM的介绍LightGBM是2017年由微软推出的可扩展机器学习系统，是微软旗下DMKT的一个开源项目，由2014年首届阿里巴巴大数据竞赛获胜者之一柯国霖老师带领开发。它是一款基于GBDT（梯度提升决策树）算法的分布式梯度提升框架，为了满足缩短模型计算时间的需求，LightGBM的设计思路主要集中在减小数据对内存与计算性能的使用，以及减少多机器并行计算时的通讯代价。LightGBM可以看作是XGBoost的升级豪华版

2021-03-04 20:11:16 6434 4

原创 Day3: FlipIt – Windows的开源翻页时钟

FlipIt – Windows的开源翻页时钟，可替代 FliqloFlipIt 是一款 Windows 下免费开源的翻页时钟，开发者灵感来自老牌翻页时钟应用 Fliqlo，无网络权限，不需要 Flash，单 .scr 屏保程序，堪称最佳 Fliqlo 替代品。Fliqlo是最经典的翻页时钟屏保。但它基于 Flash 开发，由于 Flash 被微软正式禁用，Fliqlo 不能用了。FlipIt首先，它只有一个 .scr 屏保文件（.scr 后缀为屏保程序），你只需要把这个 .scr 屏保文件移动到

2021-03-04 16:36:55 5957 2

转载机器学习算法（六）: 基于XGBoost的分类预测(基于天气数据集的XGBoost分类实战)

机器学习算法（六）: 基于XGBoost的分类预测1. 实验室介绍1.1 XGBoost的介绍XGBoost是2016年由华盛顿大学陈天奇老师带领开发的一个可扩展机器学习系统。严格意义上讲XGBoost并不是一种模型，而是一个可供用户轻松解决分类、回归或排序问题的软件包。它内部实现了梯度提升树(GBDT)模型，并对模型中的算法进行了诸多优化，在取得高精度的同时又保持了极快的速度，在一段时间内成为了国内外数据挖掘、机器学习领域中的大规模杀伤性武器。更重要的是，XGBoost在系统优化和机器学习原理方面

2021-03-02 10:29:05 15132 22

空空如也

空空如也