自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 问答 (1)
  • 收藏
  • 关注

原创 R经验-grepl():检查字符串中是否存在多个特定字符?

检查my_str字符串中是否存在多个特定关键词key_words方式1:检查每个关键词是否存在方式2:检查所有关键词是否存在方式3:检查部分关键词是否存在。

2023-05-05 11:13:30 1377

原创 Git常用命令

注意:git checkout – file命令中的–很重要,没有–,就变成了“切换到另一个分支”的命令,我们在后面的分支管理中会再次遇到git checkout命令。假设,他人克隆了项目,本地默认只有master分支,若需在dev分支上开发,则需手动创建远程的dev分支到本地。通常,合并分支时,如果可能,Git会用Fast forward模式,但这种模式下,删除分支后,会丢掉分支信息。配置Git的时候,加上–global是针对当前用户起作用的,如果不加,那只针对当前的仓库起作用。复制提交到dev分支上。

2023-02-27 19:48:57 440

原创 R语言学习笔记

利用R语言进行数据分析,基础入门笔记

2023-01-05 16:45:45 334

原创 plotnine数据可视化手册

介绍R语言数据可视化的强大之处在于ggplot2,而plotnine就是python版的ggplot2,语法与R语言的ggplot2基本一致,无论是从语法简洁性、作图灵活性、美观度等方面,个人认为plotnine均可胜于python中那些常用的可视化模块(例如:matplotlib、seaborn等)。目前国内在用plotnine的人似乎还不多,中文网站上很难搜索到比较全面的使用方法,作为数据分析工作者,出图的速度直接影响数据挖掘的效率,所以撰此文目的在于加强自己对可视化模块plotnine的学习巩

2022-05-21 19:52:33 2347

原创 样本切分器—利用python按比例均匀切分样本

利用python按比例均匀切分数据样本

2022-05-17 14:25:14 1907

原创 利用Python进行股票交易分析(三):A股量化交易策略的验证及数据分析。

背景1、前两篇文章我们分别对股票量化交易策略进行了定义(详见第一篇)、并对A股所有历史行情数据进行了爬取保存以备后续的数据分析(详见第二篇)第一篇:利用Python进行股票交易分析(一):量化交易策略——买点与卖点的量化第二篇:利用Python进行股票交易分析(二):爬取A股所有历史行情数据2、量化交易是否有效可行,我们需要根据大量的历史行情数据来进行回测验证。目标1、将量化交易策略用于单个股票进行回测,并将回测结果可视化(策略收益趋势、最大回撤幅度),交易日志展现(交易日期、买

2021-07-13 20:07:45 12668 10

原创 利用Apr算法做关联性分析:以对公众号推送的文章类型组合做出优化

背景1.订阅号推送一条图文消息时可一次性组合推送最多8篇文章,如下图,其中1篇头条和最多7篇次条。2.在推送文章时,需要考虑到文章类型的多样性,因此,每天的推送排版,都要考虑不同的文章类型之间的契合性。要是陈列不当,次条的阅读量就很惨淡。当然,要是选择恰当,头条和次条就能相互促进,而且,头条一般都是确定的,主要是次条文章的挑选。目的那针对不同类型的头条文章,应该怎么罗列订阅号的“次条”比较好呢?或者,换句话说,读者可能会同时喜欢看什么类型的内容呢?通过对用户阅读行为的关联分析,了解顾客的

2021-07-09 21:50:30 812

原创 利用Python进行股票交易分析(一):量化交易策略——买点与卖点的量化

背景:1、炒股的基本常识是“低吸高抛”、“低点买入,高点卖出”,大部分股民全凭直觉判断股价趋势的低点与高点,但“直觉”实际上是“基于经验的潜意识分析判断”,将经验用数字量化呈现,就是股票的交易策略。2、历史总是惊人的相似,观察股价走势的周期特征及各个指标的相关性,找出共同点,并将其量化,形成我们的股票交易策略。3、股市的历史数据已是海量且很容易下载到,我们可以利用每只股票的历史数据进行回测验证,以此推断我们的策略是否有效。4、本文将分享一种操作简单且易理解的股票交易策略:股价持续下跌后在企稳

2020-12-02 16:06:46 18447 2

原创 Python+Selenium爬虫实现:草料二维码微信群活码自动更新,提升社群运营效率

背景1.我部门在社群运营工作中,通过将微信群码加入线下海报的方式进行线下引流,每个社区建立一个微信群,目前已有社区微信群500个;2.微信群码有效期14天,过期必须将线下海报替换,否则群码失效,用户无法扫码加入微信群;3.使用“草料二维码平台”的活码功能,把生成的活码加入海报,将微信群码作为活码的内容,用户扫描海报上的活码-打开实时的微信群码-进入微信群,以此解决了“群码过期必须线下替换海报”的问题;4.但运营人员依然需要每14天将活码中的微信群码进行手动更换,耗时严重(全部更换完约8小时),手动更

2020-11-17 19:07:44 3970 1

原创 K-means聚类:对某健身APP的用户价值分析

一、 背景与挖掘目标1.近期运营部门要加大社群运营力度,计划将用户分层后导入社群,但平台还没有成熟的用户价值评估体系;2.针对不同的用户进行不同的精准营销手段,实现利润最大化;3.建立用户价值评估模型,进行用户分层,是解决问题的关键。二、分析方法与过程分析方法1.明确目标:用户价值识别并进行分层2.借用RFM模型,识别出高价值客户:R:消费间隔,距离最近一次消费时间间隔F:消费频率,一段时间内消费的次数M:消费(充值)金额,一段时间内消费的总额另加入两个指标,L:用户关系长度,即用户

2020-11-11 13:27:46 1365 3

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除