- 博客(14)
- 收藏
- 关注
原创 用R进行电商美容仪爬虫数据的清洗、拆分、分析
美容仪爬虫包含产品参数爬虫和用户评论爬虫。第一步:合并多个月的产品参数爬虫数据。第三步:评论爬虫数据汇总及分析。第四步:导出所需的数据到。第二步:拆分产品参数。
2024-04-24 11:06:27 145
原创 Python做Reliability分析,weibull模型为例,计算单侧/双侧可靠性值(含置信度)
第二步:拟合2p-weibull分布(若样本的失效服从其它分布,则需要选择其它统计分布)并绘图。置信度C50的情况,以下代码计算出在50%置信度下,5000个循环的可靠性为97.76%第一步:导入或创建F和S数据,本案例中假设有4种失效类型,同时有F和S的数据。主要用到Matthew Reid开发的Reliability包。第三步:计算可靠性(区分双侧和单侧)如果需要查看SF曲线。
2024-04-24 10:50:32 401 1
原创 用R进行电商空气净化器爬虫数据的清洗、拆分、分析
本篇介绍空气净化器的分析,思路相似。以下是爬虫结果的预览。第一步:多个月的爬虫数据合并、清洗。第三步:对文本类字段进行词频分析。第二步:字段拆分、统一写法。
2024-04-22 11:39:27 792
原创 电动牙刷电商评论分类方法(R语言)
电动牙刷评论主要涉及外观、清洁力度、便携性、噪音振动、智能、操控难度等,分类方法详见下方R代码。结合爬虫得到的评价星级,可了解各类评论的占比差异,如下图可知电池续航、噪音振动的五星好评比例低于其它角度(83%和78%)。
2024-04-19 09:18:11 105 1
原创 R中用%in%无法识别出文本中包含某字符(有字符但是却输出FALSE)的解决方案
用grep(pattern, text) 替代 pattern %in% text
2024-03-25 14:16:17 83
原创 R报错解决 stri_replace_all_regex argument is not an atomic vector
str_replace()报错argument is not an atomic vector
2024-03-25 14:07:45 122
原创 R read.csv()读取ANSI编码的中文表格报错type.convert.default
表格的变化是ANSI,直接用read.csv()读入报错,加上encoding="ANSI"也报错,报错的详情是:Error in type.convert.default(data[[i]], as.is = as.is[i], dec = dec, : invalid multibyte string at '<cb>ղ<b4>'修改方法如下:增加 fileEncoding = "gbk"
2024-01-22 13:45:20 583
原创 R语言 Error in make.names(col.names, unique = TRUE) : invalid multibyte string at ‘<b1><ea><cc><e2>‘
R语言导入CSV文件的时候报错
2023-11-29 09:45:29 2893
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人