普通网友-CSDN博客

原创基于Windows11系统和NVIDIA显卡的DeepNude无水印版本零基础复现教程

作为2023年最热门的计算机视觉（CV）项目之一，DeepNude引起了非常多技术发烧友和普通大众更大关注。这个项目使用MASK技术实现了人体图像特定遮挡物的去除与去除后的图像生成，采用了对抗神经网络（GAN）等多种值得学习的计算机视觉（CV）技术，值得学习。因此俺写了这篇DeepNude在普通人的Windows电脑上进行复现的教程。

2023-10-16 20:45:05 6246 1

原创【AIDD】基于SMILES的高效大规模药物对接筛选打分方案+代码

这篇文章主要记录俺所作的计算生物学工具-基于SMILES表示法的高效大规模药物对接筛选打分器，以下简称SMILESDOCKING。这个工具可以进行大规模的药物分子-靶标多筛选，也可以为AIDD（基于人工智能的药物设计）提供参考特征。

2023-06-29 18:47:36 412 1

原创预训练大模型在新冠药物研发中崭露头角——首届全球AI药物研发算法大赛基线模型详解

首届全球AI药物研发算法大赛，是由清华大学药学院、百度飞桨、百度智能云和临港实验室共同主办，并得到中国药学会等单位大力支持的一项全球性技术创新大赛，旨在借助百度飞桨在生物计算方向上的算法优势，通过AI Studio平台，探索AI+药学领域前沿技术，挖掘和培育优秀人才，诚邀全球范围内生物计算、人工智能等相关专业的高校师生、企业、科研机构及开发者参赛。参赛者可以利用深度学习、分子对接等方法，预测和评估小分子与主蛋白酶之间的相互作用，以及小分子在细胞中抑制病毒复制的潜力，挖掘潜在的药物候选物。

2023-06-23 16:22:49 688 3

原创零基础机器学习--自动化库Pycaret快速入门指南之回归任务

PyCaret的回归模块是一个有监督的机器学习模块，用于估计因变量（通常称为 "结果变量"，或 "目标"）和一个或多个自变量（通常称为 "特征"，"预测因素"，或 "协变量"）之间的关系。如果所有的数据类型都是正确的，你可以按回车键，或者键入退出退出设置。这个函数使用交叉验证法对模型库中所有可用的估计器的性能进行训练和评估。PyCaret是一个代码量超低的机器学习库，它有效的自动化了机器学习工作流。要在未见过的（新）数据集上生成标签，只需在predict_model函数中传递数据集。

2023-02-08 21:36:29 511

原创零基础机器学习--基于Pycaret快速部署分类任务

分类任务一些常见的用例包括预测客户违约（是或不是），预测客户流失（客户将离开或留下），发现的疾病（积极或消极）。Pycaret有超过18种随时可用的算法和并且可以一行代码分析训练好的模型的性能。如果所有的数据类型都是正确的，你可以按回车键，或者输入quit来退出设置。PyCaret是一个代码量超低的机器学习库，它有效的自动化了机器学习工作流。该函数使用训练好的模型预测标签和分数（预测类别的概率）列。

2023-02-05 17:13:21 257

原创基于OCRA软件实现密度泛函计算优化双分子体系的复现实验，以ABPA和Trp为例

这是我预PhD期间的第一项复现实验，复现的是我研究计划中最重要的参考文献中的一个计算。ORCA是从头计算、DFT和半经验的从头电子结构SCF-MO程序包，可以处理环境的影响和，特别着重于分子的光谱计算。公式:最佳线程数目=(线程等待时间与线程CPU时间之比+1)CPU数目对于CPU密集型,线程等待时间/线程CPU时间接近于0,所以设置线程数为CPU的数目线程数目不易太大,如果线程数太大就会造成线程切换,降低效率在实际情况中一般CPU密集型线程数量设置为CPU数+1*模型：奥斯汀模型1(AM1)

2023-02-01 16:17:39 628

原创三步轻松安装量子化学软件OCRA到Windows11系统

ORCA是一个量子化学程序包，包含现代电子结构方法，包括密度泛函理论、多体扰动、耦合群、多参考方法和半经验量子化学方法。ORCA是由Frank Neese的研究小组开发的。免费版本只提供给学术机构的学术使用。ORCA的特色功能很多，每个人都会日常用到的首先是RI和DLPNO，其次是各种3c系方法，完善的双杂化支持，虽然不算出彩但对用户非常友善的多参考态支持，接下来是SF-TDDFT、EOM-CCSD、旋轨耦合计算等。它的主要应用领域是大分子、过渡金属配合物及其光谱特性，也可以应用于其他领域。

2023-01-28 13:56:06 1841 1

原创自动化深度学习-skorch的基本介绍与安装指南

skorch的目标之一是使PyTorch与sklearn的【联合使用】成为可能。这是通过提供一个具有sklearn接口的PyTorch的包装器来实现的。skorch并没有重新写轮子，而是尽可能地让你摆脱使用Pytorch需要重复编写代码的困境。如果你熟悉sklearn和PyTorch，你不需要学习任何新的概念，而且语法应该是众所周知的，如果你不熟悉这些库，跟随本系列教程，你可以同时精通PyTorch、Sklearn和skorch。此外，skorch抽象出了训练循环，使很多模板代码变得非常简单。

2023-01-27 15:47:11 846

原创如何测试机器学习模型--Pycaret快速入门指南之聚类任务

Pycaret的聚类模块是一个无监督的机器学习模块，它执行对一组对象进行分组的任务，使得同一组（也称为集群）中的对象彼此之间比其他组中的对象更相似。它提供了几个预处理功能，通过设置功能为建模准备数据。它有超过10个随时可用的算法和多种绘图方法来分析训练模型的性能。

2023-01-24 16:06:18 420

原创基于Pycaret自动化机器学习库的异常检测任务入门方案

PyCaret 的推理算法将根据某些属性自动推断所有特征的数据类型。PyCaret是一个代码量超低的机器学习库，它有效的自动化了机器学习工作流。实现了端到端的机器学习和模型管理工具，可以成倍地加快机器学习的学习、部署和实践速度。本文主要介绍Pycaret的特色、优势和理念，喜欢的朋友请关注本专栏，我的专栏将陆续更新。确保数据类型正确在 PyCaret 中非常重要，因为它会自动执行多个特定于类型的预处理任务，这对于机器学习模型来说是必不可少的。，这篇教程主要关注这个库的一些最简单的使用方式。

2023-01-23 17:34:28 378

原创【认知跃迁】自动化任务与持续清理的港口思维

港口思维，指的是像港口对工作区的处理方式一样，利用大量自动化手段，限制缓冲区和工作区的存量，从而对缓冲区和工作区进行更好的管理。世间万物是动态的。每件事从开始到结束，会经历一个中间状态。在观念上，我们一定要接受这个中间状态的存在。在行动上，主动在生活各方面打造一个个装卸货的缓冲区，临时存放电子文件、网络内容、实体物品、甚至知识观念，用来容纳这个中间状态。而不是在心理上否认或忽视中间状态的存在，以至于缺乏对中间状态的管理，事情来了，如不立即处理得到结果，则转瞬即忘，或堆积如山。并非所有事都要有始有终。

2023-01-20 14:37:47 204

原创【数据博彩】如何使用大数据机器学习预测NBA比赛结果？

【重磅】大数据机器学习预测NBA比赛结果独家方案+代码。

2023-01-17 12:11:46 3665

原创【深度学习+】基于卷积和全连接神经网络的主动学习岩土力学模型训练方案（Pytorch框架实现）

监督学习问题中，存在标记成本较为昂贵且标记难以大量获取的问题。针对一些特定任务，只有行业专家才能为样本做上准确标记。在此问题背景下，主动学习（Active Learning, AL）尝试通过选择性的标记较少数据而训练出表现较好的模型。主动学习已经是一个较为成熟的技术，已经有很多研究工作将其应用于不同学科和领域，本文仅从最简单方法出发，作为示例。

2023-01-12 18:29:36 709 3

原创基于PyCaret和Xgboost的MathorCup B 题机器学习建模方案

本次2022mathorcup数学建模大赛采取中国移动通信集团北京公司数据，要求对于客户语音业务和上网业务分别建立客户打分基于相关影响因素的数学模型，这个方案基于对比20种机器学习模型进行，用于帮助参赛选手选择合适的模型。

2023-01-09 15:24:03 465 2

原创基于PaddleTS的亚太杯1月场E题第二问方案和代码解析（世界拥核国家数量预测）

使用先进的集成时间序列预测工具Paddle进行建模预测的部分可视化内容和代码解析。PaddleTS 是一款基于飞桨深度学习框架的开源时序建模算法库，其具备统一的时序数据结构、全面的基础模型功能、丰富的数据处理和分析算子以及领先的深度时序算法，可以帮助开发者实现时序数据处理、分析、建模、预测全流程，在预测性维护、智慧能耗分析、价格销量预估等场景中有重要应用价值。

2023-01-07 16:45:53 540 3

原创天池“英特尔创新大师杯”深度学习挑战赛第15名方案【自然语言处理方向】

【天池大赛】阿里达摩院机器智能技术团队联合CCKS2021大会举办此次地址评测任务。这篇文章使用Bert模型进行训练和推理，为参加此次比赛的朋友提供参考。

2023-01-05 22:23:37 522

原创基于AAARR模型的游戏商业分析（附带模型代码）

希望通过对玩家在游戏前7天的行为数据的分析，了解玩家的在线情况、常见的支付指标以及现金道具的消耗情况。（2）控制产品的总体成本/收益关系，用户生命周期价值（LTV）远远大于用户获取成本（CAC），这意味着产品运营的成功。它指的是获取用户、增加活动、提高留存率、获得收入和病毒传播。有必要找到游戏行为和支付率（PR）的谷来提高PR。（1）以用户为中心，以完整的用户生命周期为线索。用户支付率PR：3.26%（高于平均1.74%）从活化到保留的转化率：25.01%（较低）从保留金到付款的转换率：13.04%

2023-01-05 15:08:06 383

原创 PyCaret：低代码自动化的机器学习工具

随着ChatGPT和AI画图的大火，机器学习作为实现人工智能的底层技术被大众越来越多的认知，基于机器学习的产品也越来越多。传统的机器学习实现方法需要较强的编程能力和数据科学基础，这使得想零基础尝试机器学习变得非常困难。机器学习、深度学习和人工智能（AI）的关系PyCaret是 Python 中的开源低代码机器学习库，可自动执行机器学习工作流程。它是一种端到端的机器学习和模型管理工具，可以成倍地加快实验周期并提高您的工作效率。

2023-01-03 22:06:52 616

原创百度吃鸡排名预测挑战赛第六名方案（基于PyCaret）

笔者参加百度吃鸡排名预测挑战赛位列第六名，现将方案给出供大家参考，如有想上车参赛的同学请在评论区留言。

2023-01-02 21:03:58 744

原创百度网盘AI大赛表格结构检测第七名方案（基于PaddleDetection的尝试）

笔者参加百度网盘AI大赛表格结构检测目前位列第七名，现将方案给出，供同样参赛的朋友参考，也欢迎想要组队的伙伴联系。

2023-01-02 19:04:10 431 6

基于卷积和全连接神经网络的主动学习岩土力学建模预测源代码

主动学习，即在拥有少部分监督数据的情况下，主动的去选择一部分对训练模型有较大提高的未标注数据，然后对选择出来的数据进行标注，标注后加入到训练集进行训练。为什么这么做的，我们把数据都标注一下不行吗？当然可以，但是标注是要时间和金钱的，特别是对于科研数据、工程数据来说，我们希望选择更有助于模型提高的数据先进行标注。在这个方案针对的岩土力学数据中，前两个通道是土的力学参数，是随机场生成的，第三个数据是桩位，每条数据的形状为3信道40*70的形式，这形式彷佛一个有三种颜色的40*70大小的图片，有标注数据共2000+条，无标记数据4000+条。用另外一个模型来学习当前模型的损失，这是一个很有创新的想法，而且非常有用。既然我们选择数据的时候没有标签（未打标签），那么是不是可以先选择出预测较差的数据进行打标签。这时候loss确实是一个可以用来做这种选择的东西。当loss较大的时候说明和真实标签的差异性很大，loss较小则差异较小。其实最终我们是要对未打标签的数据进行排序，先是模型较难预测的，然后再是较好预测的。

2023-01-13

基于20+机器学习模型的2023mathorcup全部方案+代码+论文大纲

大于二十种模型的对比以及模型集成，本方案保证回归准确率和创新性，限时发布！我们的建模方案使用Pycaret作为机器学习工具，PyCaret 是 Python 中的开源低代码机器学习库，可自动执行机器学习工作流程。它是一种端到端的机器学习和模型管理工具，可以成倍地加快实验周期并提高工作效率。与其他开源机器学习库相比，PyCaret 是一个高度封装的低代码库，可以用几行代码代替数百行代码。这使得机器学习实验呈指数级快速和高效。

2023-01-09

基于核战模拟器和PaddleTS的亚太杯1月场E题建模方案

本次亚太杯APMCM组织委员会要求你的团队处理当前的报告和未来的核武器预测。他们提供了数据集2022_APMCM_E_Data.csv来帮助您进行研究。请收集相应的数据，建立一个数学模型，并回答问题。这是基于核战模拟器和PaddleTS的亚太杯1月场E题建模方案。 PaddleTS 是一款基于飞桨深度学习框架的开源时序建模算法库，其具备统一的时序数据结构、全面的基础模型功能、丰富的数据处理和分析算子以及领先的深度时序算法，可以帮助开发者实现时序数据处理、分析、建模、预测全流程，在预测性维护、智慧能耗分析、价格销量预估等场景中有重要应用价值。核战争模拟器破解版这款游戏将会是值得每一位玩家进行尝试的，在这里玩家将会经历一场场的核战争，在这次战争中，全世界绝大多数地区都会被毁灭，真实的爆炸半径和毁伤效果为大家带来真实的核战体验。

2023-01-07

“英特尔创新大师杯”深度学习挑战赛第15名方案【自然语言处理方向】

这个资源是我本人参赛使用BERT模型的全部代码，取得15名的成绩，供参赛的小伙伴参考。 BERT 全称为Bidirectional Encoder Representation from Transformers（来自Transformers的双向编码表示），谷歌发表的发的论文Pre-traning of Deep Bidirectional Transformers for Language Understanding中提出的一个面向自然语言处理任务的无监督预训练语言模型。是近年来自然语言处理领域公认的里程碑模型。

2023-01-05

百度网盘AI大赛表格结构检测第七名模型+预测文件

百度网盘AI大赛表格结构检测第七名模型+预测文件使用轻量级卷积模型LCNet+LCPAN+PicroHead进行训练目前排名为第七名，后续将继续更新和优化参数。

2023-01-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人