自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 收藏
  • 关注

原创 Python SHAP 对机器学习特征可视化报错

这些warning是因为在使用 numba.jit 装饰器时未明确提供 nopython 关键字参数。从 Numba 0.59.0 版本开始,如果未指定 nopython 参数,其默认值将从 False 变更为 True。这种变化可能会影响代码的兼容性,因为在 nopython 模式下,Numba 强制所有的操作都必须在 Numba 的 JIT 编译器中能够被识别和优化。解决了这个问题后似乎可以导入shap pkg了,但是一直输出warning。这样shap可以正常导入,且不会输出warnings。

2024-04-18 11:07:30 310 1

原创 解决无法成功安装tensorflow包时 拒绝访问的问题

【代码】解决无法成功安装tensorflow包时 拒绝访问的问题。

2023-06-09 15:16:26 422

原创 Python solution AttributeError: module ‘pandas‘ has no attribute ‘ewma‘

【代码】Python solution AttributeError: module ‘pandas‘ has no attribute ‘ewma‘

2023-06-09 10:30:46 213

原创 Python 解决 AttributeError: module ‘pandas‘ has no attribute ‘rolling_std‘

【代码】Python 解决 AttributeError: module ‘pandas‘ has no attribute ‘rolling_std‘

2023-06-09 10:24:36 290

原创 Python解决ValueError: array must not contain infs or NaNs

如果返回True,则证明存在nan或者inf值。表明数据中存在nan或者inf值。

2023-05-17 14:16:38 2345

原创 R语言解决Error in library(sjPlot) : there is no package called ‘sjPlot’问题

更新R Studio后想要安装sjPlot这个pkg,但是提示。看来sjPlot已经退出历史舞台了,需要在仓库中调用。这样就可以成功安装并使用sjPlot了。

2023-02-10 09:58:41 1123

原创 解决Python报错AttributeError: module ‘scipy.sparse‘ has no attribute ‘coo_array‘

解决AttributeError: module 'scipy.sparse' has no attribute 'coo_array'报错

2022-10-26 11:43:44 3381

原创 220612:Mapping Exposure Diversity: The Divergent Effects of Algorithmic Curation on News Consumption

220612:Mapping Exposure Diversity: The Divergent Effects of Algorithmic Curation on News Consumption

2022-06-11 13:51:36 108

原创 每周读文章:Information and Expression in a Digital Age: Modeling Internet Effects on Civic Participation

周报文章

2022-06-06 09:30:55 113

原创 亲测有效,解决MAC无法联网的问题

1.打开Macintosh HD, 点击资源库2.选择“资源库”中的“Preference”3.选择“Preference”中的“SystemConfiguration”,仅保留“com.apple.Boot.plist”这个文件4.重启电脑,问题解决

2022-05-12 13:59:15 8164

原创 机器学习常用Metrics的Latex公式(持续更新...)

LaTeX is a high-quality typesetting system; it includes features designed for the production of technical and scientific documentation.R方:$ R^2=1-\frac{SSres}{SStot} = 1 - \frac{\sum_{i}(y_i-\widehat{y}_i)^2}{\sum_{i}(y_i-\overline{y}_i)^{2}}$R2=1−SSre

2022-01-11 16:42:52 919

原创 Python-XGBoost算法中绘制AUC-ROC曲线图

简单记录一下auc-roc的思想:利用机器学习算法处理分类问题时,主要是通过测试样本产生的实值与预测概率来解决问题。随后将预测值与阈值进行比较。阈值可以被看作为一个门槛,高于门槛为true,反之为false。同时,由于测试样本时产生的是一个概率,可以对概率进行排序,确定最可能为True的样本排在前面,最不可能为True的样本排在后面。在排序额度过程中存在一个cut point。排在cut point前为正例。如果我们更重视“查准率”,则可选择排序中靠前的位置进行截断;若更重视“查全率”,

2021-12-25 16:44:48 7554 5

原创 “文章略读”——刘炜:《门槛模型:一个社会学形式理论的建构与拓展》

我们如何去判断个人在网络中的转发某条信息的阈值?个体如何收到网络中邻居的影响?门槛/阈值理论或许可以为我们提供参考http://src.ruc.edu.cn/CN/abstract/abstract3.shtmlcitation format:刘炜. 门槛模型:一个社会学形式理论的建构与拓展[J]. 《社会学评论》, 2016, 4(6): 28-42....

2021-12-22 10:23:25 612

原创 Python利用Twitter API根据tweet id抓取tweet(via tweepy/twython)

1.申请Twitter Developer账号要抓取twitter平台信息的第一步是在Twitter Developer官方网站(https://developer.twitter.com/en)申请开发者账号。作者之前使用国内注册的谷歌邮箱和国内手机注册账号,两次申请均被脆拒。在同学的帮助下,利用国外手机号和谷歌邮箱注册twitter developer账户提交申请即通过。可以看出,境外手机号申请更容易通过~2.建立“APP”选择Projects&Apps,建立个人APP。建立成功后会获

2021-10-27 17:38:59 2077 1

原创 Python解决AttributeError: module ‘matplotlib‘ has no attribute ‘get_data_path‘问题

当import matplotlib.pyplot as plt时,报错显示AttributeError: module 'matplotlib' has no attribute 'get_data_path'检查了一下目前matplotlib的版本是3.4.3,出现包导入错误可能是系统或package升级的原因,多尝试一下降低package的版本就好。试了一下3.3.1 和3.3.4版本,最后3.3.4版本可以完美解决上述报错~...

2021-09-18 14:00:25 14599 2

原创 一些与Twitter Cleaning有关的帖子

处理与Twitter相关数据的手段,持续更新ing当利用Twitter API下载数据报错时https://developer.twitter.com/en/support/twitter-api/error-troubleshooting一些主要错误:404 V2The URI requested is invalid or the resource requested, such as a user, does not exist.Check that you are using va

2021-09-13 12:23:01 108

原创 Python SHAP summary_plot()方法修改及画出蜂窝图的解决方式

8月上旬使用Python SHAP中 summary_plot()时,画出来的图依然是各特征的shap value,图状为beeswarm,但在中旬重新跑该段代码时,画出来的图为mean(|shap value|),图状为柱状图。SHAP修改之后:fig = plt.figure()shap.summary_plot(shap_values, data[cols], show = False, max_display = 30)plt.tight_layout()plt.savefig('5-2

2021-08-13 08:40:24 16421 9

原创 Python Tqdm:进度监测神器

在实际项目和工作需求汇总,我们面对的数据大小往往以G计数,数据条数在100k以上。Excel是进行数据透视和简单函数计算很不错的工具,但是在是读存数据体量较大(10w-104w条数据)、计算速度较慢(超过30min)的场景下,我们很难真实预测完成一份数据分析工作的时间。尽管Python在读取数十万条信息是同样需要一定的时间,但第三方包Tqdm可以很好地帮助我们避免上述问题。在发现Tqdm之前,基本上是通过写循环,print出当前的工作进度。在发现Tqdm之后,只需要一行代码,不仅可以知道机器目前工作的进度

2021-08-02 15:06:50 1477

原创 python如何批量读取csv格式文件为dataframe格式

pandas(https://pandas.pydata.org/)作为提供易操作的数据结构和数据分析工具,可以成为我们处理xls、csv等结构化数据时不错的帮手。恰巧在昨天处理了一份csv数据,今天便花一些时间整理了如何利用Python批量读取csv文件为dataframe格式的数据。#####第一步,导入包import osimport globimport pandas as pd#####第二步,找到需要的所有csv文件bigv_path = '/Users/Macbook/Desk

2021-03-08 11:07:33 4297

原创 Python解决ImportError: cannot import name ‘stopwords‘ from ‘nltk‘

nltk是做自然语言文本(尤其是英文)处理时无法绕开的模块,按照nltk官方网站http://www.nltk.org/data.html的介绍:*Create a folder nltk_data, e.g. C:\nltk_data, or /usr/local/share/nltk_data, and subfolders chunkers, grammars, misc, sentiment, taggers, corpora, help, models, stemmers, tokenizer

2021-02-06 18:13:46 2354

原创 AttributeError: ‘DataFrame‘ object has no attribute ‘DataFrame‘应如何处理?

alist = []for tweet in ds: full_text = tweet['full_text'] alist.append(full_text)trydata = pd.DataFrame({'full_text':alist})报错:AttributeError: ‘DataFrame’ object has no attribute ‘DataFrame’求助各位大神应该如何处理?...

2020-12-08 20:35:11 23226 2

原创 Python检查多个url能否正常运行

拖拉了2个月,个人项目终于开始动工,也在不断的学习和成长。手里拿到了一份OpenSources(github上直接搜索可以查到),感兴趣的朋友也可以下载csv文件进行练手。import pandas as pdimport urllib.requestimport time#这里读取文件所在的位置data =pd.read_csv('/Users/Macbook/Documents/GitHub/opensources/sources/sources.csv')data[:30]#看一下前30行

2020-10-30 14:52:37 1278 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除