逍遥_yjz
码龄8年
关注
提问 私信
  • 博客:380,907
    社区:2
    动态:23
    380,932
    总访问量
  • 96
    原创
  • 54,562
    排名
  • 677
    粉丝
  • 31
    铁粉
  • 学习成就

个人简介:主要从事文本处理,实体识别方向;攻读自然语言处理,深度学习。

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2016-10-26
博客简介:

xiaoyaozizai017的博客

博客描述:
坚持,相信自已
查看详细资料
  • 原力等级
    成就
    当前等级
    4
    当前总分
    544
    当月
    5
个人成就
  • 获得223次点赞
  • 内容获得36次评论
  • 获得482次收藏
  • 代码片获得1,154次分享
创作历程
  • 14篇
    2024年
  • 5篇
    2023年
  • 2篇
    2022年
  • 5篇
    2021年
  • 1篇
    2020年
  • 52篇
    2018年
  • 25篇
    2017年
成就勋章
TA的专栏
  • 生信分析工具
    8篇
  • python基础
    24篇
  • ML-AI-框架
    1篇
  • Python高效数据分析
    14篇
  • 自然语言处理
    6篇
  • Python-主流库
    2篇
  • 环境配置
    13篇
  • 电脑与手机
    4篇
  • 前言知识
    2篇
  • 数据结构及题
    3篇
  • 机器学习实战
    3篇
  • 机器学习
    7篇
  • 深度学习
    3篇
  • Linux
    15篇
兴趣领域 设置
  • 数据结构与算法
    推荐算法
  • 人工智能
    opencvcaffetensorflowmxnetpytorchnlpscikit-learn聚类集成学习分类回归
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

175人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Scanpy(5)单细胞轨迹推断-PAGA

以小鼠数据为例,进行单细胞轨迹推断。
原创
发布博客 2024.06.05 ·
1317 阅读 ·
9 点赞 ·
0 评论 ·
13 收藏

Scanpy(4)用与数据整合和批次处理

对ingest整合好的数据集进行PCA。屏蔽pca之后的图对比:发现,
原创
发布博客 2024.06.05 ·
1132 阅读 ·
21 点赞 ·
0 评论 ·
26 收藏

Scanpy(3)单细胞数据分析常规流程

面对高效快速的要求上,使用R分析数据越来越困难,转战Python分析,我们通过scanpy官网去学习如何分析单细胞下游常规分析。数据3k PBMC来自健康的志愿者,可从10x Genomics免费获得。在linux系统上,可以取消注释并运行以下操作来下载和解压缩数据。最后一行创建一个用于保存已处理数据的目录write,后面直接使用保存的数据,能快速加载数据。
原创
发布博客 2024.06.05 ·
1393 阅读 ·
17 点赞 ·
0 评论 ·
18 收藏

LightGBM简介

LightGBM 简介及其与XGBoost的比较优缺点
原创
发布博客 2024.06.04 ·
793 阅读 ·
15 点赞 ·
0 评论 ·
28 收藏

ChAMP加载肺癌数据和分析甲基化数据流程

ChAMP 甲基化数据分析流程
原创
发布博客 2024.05.27 ·
916 阅读 ·
30 点赞 ·
0 评论 ·
10 收藏

ChAMP分析甲基化数据:样本信息csv的制作和IDAT读取

使用ChAMP包分析甲基化数据,chAMP包非常强大,记录一下,用于学习记录,按照自已安装的方式安装。
转载
发布博客 2024.05.24 ·
261 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

vscode远程ssh隧道连接linux服务器并配置conda环境调试python过程

vscode远程ssh隧道连接linux服务器并配置conda环境调试python过程
转载
发布博客 2024.05.10 ·
236 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Python 调试更好的方式

在本文中,我介绍了一个很棒的 Python 第三方库,名为"Ice Cream"。它增强了Python 的普通print() 函数,并提供了详细的输出。因此,它使调试变得非常方便。Ice Cream库永远不会取代print() 函数,因为它是为调试目的而设计的。同时,它也不会取代日志系统。
转载
发布博客 2024.05.08 ·
39 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

shell常用文件处理命令

在Linux中,查看文件内容,截取文件内容,压缩解压查看前两行 – head要查看文档的前两行
原创
发布博客 2024.05.07 ·
961 阅读 ·
5 点赞 ·
0 评论 ·
14 收藏

sh包装脚本

两个脚本,运行的时间间隔分别是一分钟和五分钟,放入到sh文件中,挂在后代,脚本里面的路径最好是绝对路径。
原创
发布博客 2024.05.07 ·
383 阅读 ·
5 点赞 ·
0 评论 ·
9 收藏

mamba 和conda 安装R包

5. 安装包6. mamba 提速 conda6.1 安装mamba是用于管理环境的 CLI 工具,相比于conda 对包和环境的管理,mamba可以实现并
原创
发布博客 2024.04.28 ·
1451 阅读 ·
6 点赞 ·
0 评论 ·
9 收藏

Scanpy(1)数据结构和样本过滤

Scanpy 是一个可扩展的工具包,用于分析与 AnnData(一种数据结构)联合构建的单细胞分析数据。通过conda,使用命令cd。
原创
发布博客 2024.04.21 ·
1343 阅读 ·
15 点赞 ·
0 评论 ·
25 收藏

scanpy的UMAP可视化优化

在进行UMAP可视化时,经常使用scanpy.pl.umap()来进行可视化,但是有时不能画出我们想要的结果,这时应该怎么办呢?
原创
发布博客 2024.04.21 ·
683 阅读 ·
3 点赞 ·
0 评论 ·
2 收藏

Scanpy(2)多种可视化

我们使用10x的PBMC数据集(包含68k个细胞)。Scanpy在其发行版中包含了这个数据集的缩减版,该数据集只包含700个细胞和765个高变基因。。
原创
发布博客 2024.04.19 ·
1060 阅读 ·
8 点赞 ·
0 评论 ·
29 收藏

损失函数中的均方误差以及平方误差

机器学习中的所有算法都依赖于最小化或最大化某一个函数,我们称之为“目标函数”。最小化的这组函数被称为“损失函数”。损失函数是衡量预测模型预测期望结果表现的指标。寻找函数最小值的最常用方法是“梯度下降”。把损失函数想象成起伏的山脉,梯度下降就像从山顶滑下,目的是到达山脉的最低点。损失函数可以大致分为两类:分类损失(Classification Loss)和回归损失(Regression Loss)。下面这篇博文,就将重点介绍5种回归损失。
原创
发布博客 2023.10.23 ·
262 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

数据+代码】LightGBM+Optuna实现回归分析

我们可以看到,LightGBM在RMSE和R2方面表现非常好,RMSE为2065.31,R2为96.68%,而线性回归的RMSE为4602.43$,R2为83.51%。此外,该图表明,与配备自动或半自动变速器的汽车相比,配备手动变速器的汽车的价格范围更窄,后者的价格范围更大。里程数:平均数约为2.5万,由于存在一个32.3万英里的异常值(这个数字太高了),我们将删除这个离群值,以获得一个更准确的数据表示。为了分析数据中的数值特征,我们将首先定义一个函数,绘制所有数字特征的分布直方图和箱线图。
原创
发布博客 2023.10.23 ·
191 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

跳过开屏广告

虽然 APP 被迫下架这事令人神伤,但大家其实完全没必要为再没有同类 APP 可用这事担心首先就是这类 APP 都是依靠安卓系统的无障碍服务,在 APP 启动时模拟人工点击跳过按钮来实现自动跳过开屏广告,实际都是无需联网即可使用的只不过因为每个 APP 的广告关闭按钮位置都不相同,联网权限只是作者为了给你更新不同 APP 的对应规则简单来说,**就是虽然在应用市场被下架了,但完全不影响 APP 的继续使用!**尽管作者以后都不会再更新规则了,但你完全可以自行添加规则继续使用。
原创
发布博客 2023.10.16 ·
2002 阅读 ·
3 点赞 ·
0 评论 ·
2 收藏

小白看得懂的 Transformer (图解)

Attention和Transformer讲解
转载
发布博客 2023.10.10 ·
182 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

PaddleNLP开源UTC通用文本分类技术,斩获ZeroCLUE、FewCLUE双榜第一

百度构建了“任务架构统一、通用能力共享”的通用文本分类技术UTC,其实现了良好的零/少样本迁移性能。
原创
发布博客 2023.01.16 ·
1687 阅读 ·
0 点赞 ·
1 评论 ·
2 收藏

2021 年年度最佳开源软件

与Git类似,LakeFS 的数据中会带有提交记录、元数据字段和回滚等信息,此外还有hooks,即在分支合并到主分支前,hooks会检查数据,确保完整性和质量。StreamNative 将 Apache Pulsar 分布式流处理架构与 Kubernetes 和混合云支持等,以及企业级功能、大型数据、认证和授权、性能监控等工具相结合,既简化了应用程序的开发,又简化了流数据应用的部署和管理。Orange 包含了完整的一系列的组件以进行数据预处理,并提供了数据帐目,过渡,建模,模式评估和勘探的功能。
原创
发布博客 2022.12.12 ·
10245 阅读 ·
15 点赞 ·
10 评论 ·
74 收藏
加载更多