jingyi130705008
码龄8年
  • 1,091,435
    被访问
  • 178
    原创
  • 20,505
    排名
  • 198
    粉丝
关注
提问 私信

个人简介:你已经很好了,只是你还可以更好。

  • 加入CSDN时间: 2014-09-20
博客简介:

JingYi的专栏

查看详细资料
  • 5
    领奖
    总分 1,439 当月 43
个人成就
  • 获得410次点赞
  • 内容获得124次评论
  • 获得1,732次收藏
创作历程
  • 17篇
    2021年
  • 39篇
    2020年
  • 18篇
    2019年
  • 40篇
    2018年
  • 67篇
    2017年
  • 8篇
    2016年
  • 1篇
    2015年
成就勋章
TA的专栏
  • 数据分析
    13篇
  • PySpark
    6篇
  • 自然语言处理
    5篇
  • 产品相关
    1篇
  • Python学习
    40篇
  • Python相关安装
    9篇
  • Python报错及解决方案
    7篇
  • 图形学
    1篇
  • 数据结构及基本算法设计思想
    22篇
  • sklearn学习
    3篇
  • 比赛总结
    1篇
  • 常见的数据处理技巧
    4篇
  • 机器学习
    25篇
  • 面试小结
    1篇
  • Java相关
    2篇
  • 深度学习
    27篇
  • 大数据
    13篇
  • 推荐系统
    8篇
  • 实用技能
    5篇
  • 最近
  • 文章
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

NLP各类任务pytorch代码

发布资源 2022.01.18 ·
zip

mysql 分组查询最新的/最高的一条记录

mysql 分组查询最新的/最高的一条记录
原创
发布博客 2021.12.21 ·
552 阅读 ·
0 点赞 ·
0 评论

PySpark error: AttributeError: ‘NoneType‘ object has no attribute ‘_jvm‘

出现这种问题,一般是由调用udf的过程报错,报错的几个原因如下:(1)引用pyspark.sql.functions的方法覆盖python本身的方法;(2)没有处理None值
原创
发布博客 2021.11.29 ·
256 阅读 ·
0 点赞 ·
0 评论

paddlenlp使用预训练模型实现快递单信息抽取中CrossEntropyLoss()指定weight报错

paddlenlp使用预训练模型实现快递单信息抽取中CrossEntropyLoss()指定weight报错
原创
发布博客 2021.08.17 ·
107 阅读 ·
0 点赞 ·
0 评论

python3 request返回结果出现乱码

nlpc_res = requests.post(url, json.dumps(params))nlpc_res.encoding='utf-8' # 加上zhe yi j
原创
发布博客 2021.06.18 ·
209 阅读 ·
1 点赞 ·
0 评论

机器学习自动调参小试

1. 安装环境2. 脚本
原创
发布博客 2021.06.07 ·
210 阅读 ·
1 点赞 ·
1 评论

dlopen:cannot load any more object with static TLS:

这是一个低版本glibc (< 2.23)的已知bug,通过dlopen加载一个动态链接库(DSO),并依次将其依赖的DSO也加载进来的时候。具体产生条件是:glibc < 2.23 已经加载了超过14个含TLS的DSO 当前加载的DSO使用了static TLS注意条件2,3。如果能够在加载14个含TLS的DSO前,提前加载含有static TLS的DSO,即可绕过这个问题。具体做法:找到报错模块(比如paddle)如果可以单独import成功的话,调整import包的顺序...
原创
发布博客 2021.06.06 ·
436 阅读 ·
0 点赞 ·
0 评论

pandas 快速读写大csv文件

1. 快速读2.快速写
原创
发布博客 2021.05.21 ·
200 阅读 ·
0 点赞 ·
0 评论

java.io.IOException: No space left on device

java.io.IOException: No space left on device原因是 /root/tmp 空间不够了,可以制定自己的tmp目录, 在conf/spark-default.conf 里加上 “spark.local.dir /home/XXX/你自己的目录” 即可。
原创
发布博客 2021.03.22 ·
661 阅读 ·
0 点赞 ·
0 评论

Python-pandas:每组均值填充缺失值

使用transform:>>> df name value0 A 11 A NaN2 B NaN3 B 24 B 35 B 16 C 37 C NaN8 C 3>>> df["value"] = df.groupby("name").transform(lambda x: x.fillna(x.mean()))
原创
发布博客 2021.03.16 ·
2856 阅读 ·
5 点赞 ·
2 评论

pyspark udf传入固定参数

1. udf 定义def udf_test(column1, column2): if column1 == column2: return column1 else: return column2apply_test = udf(udf_test, StringType())df = df.withColumn('new_column', apply_test('column1', 'column2'))2. 带固定变量的udf定义.
原创
发布博客 2021.03.08 ·
269 阅读 ·
1 点赞 ·
0 评论

PySpark dataframe 按照某列排序

df.orderBy('column_name', ascending=False)
原创
发布博客 2021.02.26 ·
1974 阅读 ·
0 点赞 ·
0 评论

Linux查看物理CPU个数、核数、逻辑CPU个数

# 总核数 = 物理CPU个数 X 每颗物理CPU的核数 # 总逻辑CPU数 = 物理CPU个数 X 每颗物理CPU的核数 X 超线程数# 查看物理CPU个数cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l# 查看每个物理CPU中core的个数(即核数)cat /proc/cpuinfo| grep "cpu cores"| uniq# 查看逻辑CPU的个数cat /proc/cpuinfo| grep "proce...
原创
发布博客 2021.02.22 ·
92 阅读 ·
1 点赞 ·
1 评论

pandas apply 并行处理的几种方法

1.pandarallel2.joblib (Parallel, delayed 两个函数)https://blog.csdn.net/Jerr__y/article/details/71425298?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-3.control&dist_request_id=4ddf3b64-071d-4fd7-a503-9272a88468...
原创
发布博客 2021.02.22 ·
4090 阅读 ·
3 点赞 ·
4 评论

深度学习在NLP中的演进

前一段时间看了一篇知乎专栏《PTMs| 2020最新NLP预训练模型综述》,介绍了NLP的一些主流模型。如下图所示:
原创
发布博客 2021.02.18 ·
78 阅读 ·
0 点赞 ·
0 评论

XGBoost学习资料

1. 原论文2. PPT3. 学习视频XGBoost Part 1 (of 4): Regression:https://www.youtube.com/watch?v=OtD8wVaFm6EXGBoost Part 2 (of 4): Classification:https://www.youtube.com/watch?v=8b1JEDvenQUXGBoost Part 3 (of 4): Mathematical Details:https://www.youtube..
原创
发布博客 2021.01.24 ·
59 阅读 ·
0 点赞 ·
0 评论

time_series_covid19_deaths_global.csv

发布资源 2021.01.22 ·
csv

python matplotlib绘制动态图

1. 效果2. 代码import matplotlib.animation as aniimport matplotlib.pyplot as pltimport numpy as npimport pandas as pddef load_data(): """ 获取数据 """ url = "./time_series_covid19_deaths_global.csv" df_all = pd.read_csv(url, delim.
原创
发布博客 2021.01.22 ·
780 阅读 ·
1 点赞 ·
2 评论

pandas shift方法

1. 接口介绍2. 使用示例3. 小结
原创
发布博客 2021.01.18 ·
383 阅读 ·
0 点赞 ·
0 评论

dlopen: cannot load any more object with static TLS

交换import顺序解决 解决方法:降级sklearn版本 降级为scikit-learn 0.20.3会使问题消失。
原创
发布博客 2020.12.17 ·
854 阅读 ·
2 点赞 ·
1 评论
加载更多