2020年04月_小刘要努力。

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创 Centos7搭建Kubernetes集群

@Author：By RunsenKubernetesKubernetes 及其整个生态系统（工具、模块、插件等）均使用 Go 语言编写，从而构成一套面向 API、可高速运行的程序集合，这些程序文档精良、易于参与贡献或在其上构建应用程序。（百度百科）那么 Kubernetes有什么用？其实很简单，Docker是部署我们的项目的容器，可是一个容器部署不够，如果在多个Linux服务器中使用Doc...

2020-04-28 12:35:55 1279

原创 Python北京空气质量数据处理

北京空气质量数据处理这是我接单的一个单，看了数据源，马发现很有印象，马上就知道来源kaggle中国北京上海广州成都，沈阳的Pm2.5数据集，对应的链接：https://www.kaggle.com/uciml/pm25-data-for-five-chinese-cities，数据集去kaggle下载，在kaggle上就是一个时间序列的问题。他们老师的要求：将源码与生成的数据（rar或zip格...

2020-04-27 12:06:18 2377

原创七、Python简单爬取学堂在线合作院校页面内容

这是一个大学生的爬虫作业，我是收钱干活的，比较简单，来过来分享一下。就是要爬取到合作院校的名称及该所院校在学堂在线开课的数量，将爬取到的数据保存到一个json文件中！例如：“{“清华大学”:308}”直接用xpath就可以了，保存为字典，然后转化成json就OK了。dict(zip(course,nums))将两个列表变成字典，这个需要知道。爬取代码如下。'''@Author： R...

2020-04-23 14:49:19 3343

原创五十二、Python北京美团汉堡外卖数据分析实战

前言@Author：By Runsen今天肚子饿了，我突然想点一个外卖，最近迷上了香辣鸡腿堡，打开美团外卖竟然发现周围没有店家，有的店家离我非常远，气得我不行了，送过来要2个小时，说好的美团外卖，送啥都快。于是，我不得不跑去支付宝下的饿了么去下单，发现半小时就可以给我送到了，神速。吃上香辣鸡腿堡，顺便点了薯条和可乐，真香！突然间，做了一个小梦，梦到了负责北京的美团老板私信我，说北京各...

2020-04-23 14:41:28 2739 1

原创八、爬虫解析利器 PyQuery 的使用

@Author: Runsen每个网页，都有一定的特殊结构和层级关系，而且很多节点都有 id 或 class 作为区分，我们可以借助它们的结构和属性来提取信息。如果你用惯了xpath和bs4，学习Pyquery是一个不错的选择。pyquery 是 Python 的第三方库，我们可以借助于 pip3 来安装，安装命令如下：pip install pyquery下面，我以CSDN首页为例。...

2020-04-23 14:23:23 1127

原创二十九、接了一单Python数据分析的私活，心痛

前言大家好，我是润森。在很早之前，2020-03-29接到一个非常简单的单子，是重本大学大学生的作业，就是有test1和test2.csv下图是test1的csv，数据比较多。下图是test2的csv，数据比较少，一共12条数据。他的要求是通过test1中的A列中有多个数据，使用A列中的F列减去对于的test2中的D列，再用A列中的G列减去对于的test2中的E列。y使用下面的计...

2020-04-18 18:39:10 6185 5

原创四十一、完成scrapy爬取官方网站新房的数据

在前几天，接到一个大学生的作业的爬虫单子，要求采用scrapy爬取链家官方网站新房的数据（3-5页即可，太多可能被封禁ip），网址：https://bj.fang.lianjia.com/loupan/，将楼盘名称、价格、平米数等（可以拓展）数据保存到一个json文件中。

2020-04-17 19:27:55 2954 3

原创股市永不过时的黄金铁律：零下金叉疯狂买，零上死叉立即卖

MACD和RSI技术分析指标在前面详细介绍了Talib，谈到期货交易软件中常用的技术分析指标，如MACD、RSI、KDJ、动量指标、布林带等等。（1）MACDMACD指标是所有技术指标里最经典的一个技术指标，正确运用这个指标，通过结合K线(日K线、周K线)、个股走势、量、大盘走势、利空利好消息等，基本上就可以达到较好地买卖效果。MACD有四大元素，分别是DIFF，DEA，红绿柱线和零轴线...

2020-04-15 10:31:06 1326

原创 Python爬虫加密

加密在开发爬虫的过程中，我们经常遇到的一种反爬措施是数据加密。常见的加密算法可以分为三类：对称加密算法，非对称加密算法和Hash算法（事实上不是加密算法而是摘要算法）一、对称加密1.定义采用单钥密码系统的加密方法，同一个密钥可以同时用作信息的加密和解密，这种加密方法称为对称加密，也称为单密钥加密。由于其速度快，对称性加密通常在消息发送方需要加密大量数据时使用。但是，加解密双方使用同样的密钥...

2020-04-09 10:15:48 1370

原创三十、Pyspider爬虫框架总结，爬取Scrapy文档

安装好pyspider后，创建一个项目文件夹用来存放相关文件，进入文件夹后运行pyspider命令，默认情况下会运行一个web服务端监听5000端口，通过http://localhost：5000即可访问pyspider的web管理界面。

2020-04-09 10:14:33 1128

原创 js调试微博登录案例

js调试五、微博登录案例1.分析流程手动操作流程访问首页https://weibo.com输入用户名和密码点击登录如果有验证码，就输入验证码验证成功跳转到微博首页面请求流程分析过程根据上面的手动操作流程，我们要分析出网站的http请求逻辑。1.首页面请求分析首先，打开谷歌浏览器开发者调试工具，查看在请求首页面时，请求回的响应是否包含cookie，也即是看首页面的响应头中...

2020-04-09 10:13:20 1207 3

原创五十五、手把手教你从零到一，完成淘宝数据分析案例

淘宝数据分析案例假设，老板是做服装的行业的。某一天，老板想上市自己T-shirt的产品，但在上市前需要知道，在我国主要的竞争对手在哪个省份以及T-shirt的主要定价属于什么区间。拿到任务的你，进行第一步数据采集。思考了下，我应该先把淘宝网上卖T-shirt的卖家的信息爬取一遍，于是开心的打开淘宝官方网站，搜索T恤。下面，你决定先明确爬取的目标的数据，决定爬取每个商品的标题，价格，位置和销...

2020-04-08 18:08:16 1594

原创三十三、自从我会了Python中的PIL，发现了其实超级简单

PIL全称是Python Image Library，顾名思义，是用来做图像处理的。我们可以用PIL干嘛呢？第一，可以将两张图片合并在一起Image.blend(image1,image2,alpha)合成公式为：out=image1(1.0- alpha)+image2alphafrom PIL import Imageim1 = Image.open("1.jpg")im2 = ...

2020-04-08 11:08:24 1435

原创我是Python小玩家，一行代码能做哪些炫酷的事情（三十一）

python之禅一行代码启动一个Web服务python -m SimpleHTTPServer 8080python3 -m http.server 8080一行代码实现变量值互换a, b = 1, 2; a, b = b, a一行代码打印迷宫print(''.join(__import__('random').choice('\u2571\u2572') for i in r...

2020-04-08 10:46:18 1130

原创手把手教你插入数学公式，妈妈再也不用担心我写不了论文了

LaTeX是专为学术写作开发的语言和编纂程序，拥有强大的package资源，这意味着用LaTeX写作可以避免Word带来的令人头疼的排版问题，而且世界上有很多人已经写好了针对各种写作格式的coding package，我们只需要套用这些package就行了。行间公式 (inline):用$...$将公式括起来。块间公式 (displayed)，用$$...$$将公式括起来是无编号的形式...

2020-04-07 23:50:03 1674

原创 AHP层次分析法解决用户价值评估

前言@Author : Runsen现在互联网都有得到用户，那用户到底有没有价值需要评估。通过各种指标来给用户综合打分，每个用户最后会得到一个分值，分值越高，说明用户的价值越高。这是一个总的目标，一个用户可以创造的价值由两部分决定：创造价值的能力和创造价值的意愿，前者是能不能的问题、后者是愿不愿意的问题。定了两个主线以后再次进行目标拆解，根据业务经验分别找到那些能够判断用户创造价值的能力和意...

2020-04-07 23:40:42 1578

原创 Python在window平台打包工具pyinstaller （三十五）

Java 一次编译到处运行，Python没有这么好本事，但是也有一个pyinstaller可以打包exe，在window平台下运行pyinstaller安装pip install pyinstaller参数参数含义-F只生成一个exe文件–distpath指定生成的exe存放的目录–workpath指定编译中临时文件存放的目录-i创建一个目录...

2020-04-07 12:03:42 1077

原创二十二、深入Python的进程和线程（上篇）

进程（Process）和线程（Thread）都是操作系统中的基本概念，它们之间有一些优劣和差异，那么在Python中如何使用进程和线程？

2020-04-07 11:12:00 1158

原创 Python中的itchat模块使用大全

Python中有一个itchat实现微信的分析和登录。itchat是一个开源的微信个人号接口，使用python调用微信从未如此简单。使用不到三十行的代码，你就可以完成一个能够处理有信息的微信机器人。当然，该api的使用远不止一个机器人，更多的功能等着你来发现。#实现微信消息的获取import itchat@itchat.msg_register(itchat.content.TEXT)...

2020-04-06 11:11:55 7106 6

原创 65 | 邮件发送

在Python中，我们可以使用smtplib和email两个库来实现发送邮件的功能。smtplib库用于发送邮件，而email库用于构建邮件内容。

2020-04-06 10:49:15 1337

原创 Python读写docx文件（三十五）

Python读写docx文件Python读写word文档有现成的库可以处理pip install python-docx安装一下。https://python-docx.readthedocs.io/en/latest/学习官网： http://python-docx.readthedocs.org/en/latest/import docx# 新建,打开,保存文件。import ...

2020-04-06 10:40:06 1010

原创 26 | logging模块

模块在Python中提供了一个灵活的框架用于发出日志信息。这个模块提供了许多功能，比如更改日志消息的输出格式，指定日志消息的级别等。这段代码将输出类似’2023-07-27 12:15:27 - WARNING - 这是 warning 级别的消息’的日志信息。这段代码将只输出级别为INFO及以上的日志消息。因此，'这是 debug 级别的消息’将不会被打印出来。这段代码将所有级别的日志消息都输出到’example.log’文件中。：请将日志信息同时输出到控制台和文件。：请捕获并记录一个运行时错误。

2020-04-06 10:31:42 1126

原创 27 | pickle、json 和 shelve

在Python中，pickle、json和shelve是用于数据序列化的常见模块。相比于pickle模块，json模块的优势在于其生成的 JSON 字符串是人可读的，并且可以被 Python 以外的语言（如 JavaScript）读取和写入。Pickle 模块是 Python 提供的用于序列化和反序列化的标准接口，它能够将 Python 对象转换为一种可以传输或存储的格式，同时还能够进行反向操作。注意，Pickle模块的序列化和反序列化过程可能存在安全风险，不应该处理来自不可信的或未经验证的源的数据。

2020-04-06 10:26:37 1118

原创 13 | 常见关键字

在上面的代码中，我们使用 assert 关键字检查变量 a 和 b 是否相等。在上面的代码中，我们使用 class 关键字定义了一个名为 Person 的类，它有两个属性 name 和 age，并且有一个方法 greet，用于打印出人的姓名和年龄。在上面的代码中，我们使用 def 关键字定义了一个名为 greet 的函数，它接受一个参数 name，并在屏幕上打印出 “Hello, name!在上面的代码中，我们使用 finally 关键字定义了一个必须执行的代码块，并打印出 “Done” 的消息。

2020-04-03 19:28:04 1459

原创 17 | 逻辑回归

逻辑回归是一种监督学习算法，用于解决二元分类问题。它的目标是预测一个二元变量的结果，例如预测一个人是否会购买某个产品，或者预测某个病人是否患有某种疾病。逻辑回归的输出是一个介于0和1之间的概率值，表示给定输入数据属于正类的概率。如果概率大于或等于一个预定义的阈值，则将该输入数据分类为正类，否则将其分类为负类。逻辑回归（Logistic Regression）是一种广泛用于二分类问题的回归模型，尽管它的名称里包含“回归”二字，但它实际上是用于分类的一种算法。原理。

2020-04-03 10:19:51 1088 1

原创总结Python机器学习中的回归算法

下面我带大家整理下机器学习的回归算法基本回归方法（线性、决策树、SVM、KNN）和集成方法（随机森林，Adaboost和GBRT）下面是源码import numpy as npimport matplotlib.pyplot as pltdef get_data(): x1_train = np.linspace(0,100,50).reshape(-1,1) x2_...

2020-04-03 10:10:18 1221

原创多元线性回归分析问题

什么是多元线性回归在回归分析中，如果有两个或两个以上的自变量，就称为多元回归。**事实上，一种现象常常是与多个因素相联系的，由多个自变量的最优组合共同来预测或估计因变量，比只用一个自变量进行预测或估计更有效，更符合实际。**因此多元线性回归比一元线性回归的实用意义更大。y=β0＋β１x1+β2x2+ … +βpxp+ε # 公式今天讲一个例子这里有个excel 文件数据，我们来研究...

2020-04-03 10:00:26 1605

原创从简单的一元线性回归分析入门机器学习

什么是回归分析回归分析（regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。运用十分广泛，回归分析按照涉及的变量的多少，分为一元回归和多元回归分析；按照因变量的多少，可分为简单回归分析和多重回归分析；按照自变量和因变量之间的关系类型，可分为线性回归分析和非线性回归分析。如果在回归分析中，只包括一个自变量和一个因变量，且二者的关系可用一条直线近...

2020-04-03 09:48:05 1052

原创四十、Linux和ViM的使用

关于虚拟机的安装，首先安装VMware或者Vbox，然后去官方网站下载iso镜像，导入iso镜像文件，设置对应的网络配置和内存配置，对应其具体操作，百度搜索。

2020-04-03 09:32:33 1127

原创一个简单的线性拟合问题，到底有多少种做法

一个简单的线性拟合问题，到底有多少种做法相信大家都做过线性拟合问题吧，其实就是给很多点，来求线性方程的斜率和截距。早在高中数学就有这类问题，我记得很清楚，如果出现在试卷中，一般出现在解答题的第二题左右，高中中的做法就是最小二乘法，代入公式，求斜率和截距，说句好听，就是送分题。在科学计算中，也是采用ols(普通最小二乘法)进行回归分析。OLS 全称ordinary least squares,是...

2020-04-02 15:49:25 3501

原创 Python用泰勒公式模拟函数

泰勒公式数学中，泰勒公式是一个用函数在某点的信息描述其附近取值的公式。如果函数足够平滑的话，在已知函数在某一点的各阶导数值的情况之下，泰勒公式可以用这些导数值做系数构建一个多项式来近似函数在这一点的邻域中的值。泰勒公式还给出了这个多项式和实际的函数值之间的偏差。泰勒公式是将一个在x=x0处具有n阶导数的函数f（x）利用关于（x-x0）的n次多项式来逼近函数的方法。若函数f（x）在包含x0的某...

2020-04-02 10:16:15 2770

原创十二、爬了CSDN，我发现了这些

最近，有点兴趣爬下自己在CSDN 的博客，并做出词云图来看下自己究竟写了什么。最近，有点兴趣爬下自己在CSDN 的博客，并做出词云图来看下自己究竟写了什么说起，就开干，下面是博客主页：https://blog.csdn.net/weixin_44510615环境操作系统：WindowsPython版本：3.7.2模块本文涉及到的Python第三方模块，共计五个：分词模块...

2020-04-01 19:05:09 1107 2

原创节能原理（能量平衡）

节能原理1Kg标准煤的发热量为29270kj/kg热平衡热平衡（thermal equilibrium ），指同外界接触的物体，其内部温度各处均匀且等于外界温度的状况。在热平衡时，物体各部分以及物体同外界之间都没有热量交换。在热工和化学中，如物体在同一时间内吸收和放出的热量恰好相抵消，也称该物体处于热平衡。焦炉热平衡焦炉热平衡 (heat balance of coke oven...

2020-04-01 16:39:05 1693

原创 10 | 元组（Tuple）序列

在 Python 中，元组和列表都是序列类型，但元组是不可变的，而列表是可变的。因为元组是不可变的，所以 Python 可以对元组进行优化，例如，将元组存储在内存中的固定位置，这可以更有效地利用缓存。此外，元组的不可变性使得它们可以用作字典的键或集合的元素，而列表则不能。Python 元组（Tuple）是一种不可变序列，它可以存储多个项目，这些项目可以是不同类型（包括整数、浮点数、列表，甚至其他元组）。由于元组是不可变的，所以你不能改变元组中的元素。和列表一样，你也可以使用切片操作从元组中获取元素的子集。

2020-04-01 11:48:03 1209

原创 8 | Python 的基本语法

Python 是一种易读性强、高效而强大的编程语言。以下是关于 Python 基本语法的教程。

2020-04-01 11:46:37 1757

原创 11 | 字典

哈希表使字典的主要操作（插入、查找和删除）在大多数情况下都能在常数时间内完成，这意味着操作的时间不会随着字典大小的增加而增加。Python 字典（Dictionary）是一个可变的、无序的数据集合，用于存储键值对。字典中的键必须是唯一的，而值则可以是任何类型的数据 - 数字，字符串，列表，甚至其他字典。在Python的字典中，我们还可以执行其他的一些操作，比如添加键值对、合并两个字典、获取所有的键或值，等等。以上的代码会分别打印出字典的所有键、所有值以及所有的键值对。要访问字典中的值，可以使用键作为索引。

2020-04-01 11:44:13 1751 1

019 - backtrader回测布林带突破策略

布林带指标：通过 bt.indicators.BollingerBands 创建布林带指标，参数包括计算移动平均线的周期（period）和标准差倍数（devfactor）。买入和卖出信号：当价格突破布林带的上轨时，策略生成买入信号；当价格跌破下轨时，策略生成卖出信号。持仓管理：当持有多头头寸时，如果价格回落到布林带的中轨下方，则卖出平仓。对于空头头寸，价格回升至中轨上方时买入平仓。

2024-08-11

018 - backtrader回测反转策略

代码详解： RSI 指标：RSI 是相对强弱指数，用于衡量资产价格的超买和超卖状态。通常，当 RSI 超过70时，认为市场超买；当 RSI 低于30时，认为市场超卖。买入信号：当 RSI 低于30，进入超卖区，策略生成买入信号，预期价格将反转上涨。卖出信号：当 RSI 高于70，进入超买区，策略生成卖出信号，预期价格将反转下跌。退出信号：当持仓时，如果 RSI 回到中性区间（50附近），则考虑平仓。

2024-08-11

017 - backtrader回测趋势跟随策略

趋势跟随策略是一种经典的交易策略，通过识别并跟随市场趋势来获取利润。尽管在震荡市场中可能表现不佳，但在明确的趋势市场中，该策略往往能带来可观的收益。成功的趋势跟随策略需要严格的纪律性、有效的风险管理措施，以及对市场趋势的敏锐识别能力。

2024-08-11

016 - backtrader回测波动率策略

交易盈亏点（Trades - Net Profit/Loss）：中间部分用红色和蓝色圆点表示每次交易的盈亏情况。蓝色圆点表示盈利交易，红色圆点表示亏损交易。从图中可以看出，策略产生了相对较多的盈利交易点，同时也有一些亏损交易点。但整体来看，盈利的交易点多于亏损交易点。总结：起始资金：100,000元最终资金：102,712元策略表现：该波动率策略在回测期间实现了小幅盈利，资金增加了2,712元。图中显示，策略在市场波动性增加时能够有效捕捉到机会并产生一定的收益。然而，该策略的表现仍然受限于市场环境，尤其是在波动性较低或趋势不明显的市场中，策略可能表现不如预期。这张图表提供了一个波动率策略的实际应用示例，展示了该策略如何利用市场波动性来进行交易，并最终对资金产生影响。

2024-08-11

015 - backtrader回测动量策略

动量指标（Momentum）：图表底部展示了动量指标的变化情况。动量指标基于一定的时间周期（此处为10天），反映了价格的变化趋势。当动量指标为正时，价格趋势向上，策略产生买入信号；当动量指标为负时，价格趋势向下，策略产生卖出信号。总结：起始资金：100,000元最终资金：101,831.91元策略表现：回测结果显示，动量策略在此段时间内实现了小幅盈利，资金增加了约1,831.91元。尽管策略频繁买卖，最终的盈利结果表明该策略在这个特定时间段内有效。然而，动量策略的表现取决于市场的趋势性。在强趋势市场中，动量策略通常表现较好，但在震荡或反转市场中可能会面临更大的风险和挑战。

2024-08-11

014 - backtrader回测均值回归策略

1. **价格走势（主图）**： - 图表的主部分显示了标的资产的价格走势。价格走势曲线伴随着一个布林带（Bollinger Bands），其中蓝色实线代表20日简单移动平均线（SMA），蓝色虚线代表布林带的上下轨。 - 绿色的三角形表示策略在布林带下轨附近生成的买入信号，红色的倒三角形表示在布林带上轨附近生成的卖出信号。 2. **成交量（Volume）**： - 图表底部显示了对应时间段的成交量，以柱状图的形式展现。成交量的变化有助于了解市场活跃程度，特别是在触发买卖信号时。 3. **资金与资产价值变化（上方部分）**： - 上方部分显示了策略回测期间账户资金的变化情况。红色线条表示现金，蓝色线条表示总资产价值（包括未平仓的头寸）。起始资金为100,000元，最终资金为98,306.92元。 - 从图中可以看到资金曲线的波动，最终的资金略有减少，表明策略在整个回测期间总体上产生了亏损。 4. **交易盈亏点（Trades - Net Profit/Loss）**： - 中间部分用红色和蓝色圆点展示了每次交易的盈亏情况。蓝色圆点表示盈利交

2024-08-11

013 - backtrader回测沪深300指数简单移动平均线交叉策略

价格走势（主图）：图表的主部分显示了标的资产的价格走势。价格走势曲线伴随了两条简单移动平均线（SMA）：蓝色线为30天的SMA，绿色线为10天的SMA。当绿色的短期SMA上穿蓝色的长期SMA时，形成了买入信号（标注为绿色三角形），而当短期SMA下穿长期SMA时，形成了卖出信号（标注为红色倒三角形）。成交量（Volume）：图表底部显示了对应时间段的成交量，表现为柱状图。成交量的大小可以帮助了解市场参与度和可能的价格动量。资金与资产价值变化（上方部分）：图表的上方部分显示了初始资金（红线）和最终资金（蓝线）的变化情况。起始资金为100,000元，最终资金为101,865.98元。这部分展示了随着策略执行过程中账户资金的波动。交易盈亏点（Trades - Net Profit/Loss）：这一部分用红色和蓝色圆点展示了每次交易的盈亏情况。蓝色圆点表示盈利交易，红色圆点表示亏损交易。可以看到，交易信号频繁出现，且盈亏点的分布较为平均。总结：起始资金：100,000元最终资金：101,865.98元策略表现：策略在回测期间实现了一定的盈利，但从图中可以看到策

2024-08-11

012 - akshare分析NYBOT棉花历史数据

展示了纽约期货交易所（NYBOT）棉花历史价格数据与两条简单移动平均线（SMA）的关系。 **图表描述：** 1. **价格走势**： - 蓝色曲线代表棉花的每日收盘价格，从2020年1月到2024年8月。 - 价格在2020年初经历了较低的水平，随后在2021年开始上涨，并在2022年达到高峰，之后有所回落。 2. **简单移动平均线（SMA）**： - 红色线表示50天的简单移动平均线（SMA50）。 - 绿色线表示200天的简单移动平均线（SMA200）。 - 可以看到，SMA50较快地反映了价格的短期变化，而SMA200则反映了价格的长期趋势。 3. **买入与卖出信号**： - 绿色三角形（向上）代表买入信号。 - 红色三角形（向下）代表卖出信号。 - 买入信号通常出现在SMA50向上穿过SMA200的位置（即黄金交叉），而卖出信号出现在SMA50向下穿过SMA200的位置（即死亡交叉）。 4. **时间轴与价格轴**： - X轴表示时间，日期从2020年1月到2024年8月。 - Y轴表示价格，从50左右

2024-08-11

011 - efinance分析豆一主连期货

展示了豆一（大豆期货主力合约）从早期到近期的价格历史走势，并结合了两条重要的技术分析指标——简单移动平均线（Simple Moving Average, SMA）进行分析。这些指标用于识别价格趋势并生成买卖信号。价格走势蓝色线条代表了豆一的历史收盘价格。可以看到，这条线条随着时间的推移呈现出明显的波动性，包括多个价格高峰和低谷。这种波动反映了市场对大豆的供需变化、全球经济环境以及其他相关因素的反应。简单移动平均线（SMA）红色线条（SMA50）：这条线代表的是50天的简单移动平均线（即过去50天收盘价格的平均值）。SMA50是一种中期趋势指标，常用于识别价格的中期走势。由于它对较短时间内的价格变化更为敏感，因此通常比SMA200波动更大。绿色线条（SMA200）：这条线代表的是200天的简单移动平均线。作为一个长期趋势指标，SMA200被广泛用于识别长期的市场趋势。由于计算时间较长，它能够有效平滑价格波动，提供更稳定的趋势信号。买卖信号绿色三角形（买入信号）：这些符号标注了一个重要的技术信号，即“金叉”。金叉是指短期移动平均线（在此为SMA50）向上突破长期移动平均

2024-08-11

010 - 东方财富帖子标题情绪分析

东方财富网股吧是一个投资者交流平台，用户在这里讨论股票、分享投资心得、发布市场预测。通过分析股吧中的帖子标题，可以了解市场情绪，对投资决策提供参考。本项目旨在通过爬取东方财富网股吧的帖子标题，进行情绪分析，并将结果可视化，帮助投资者更好地理解市场情绪的变化。 #### 项目目标 1. **数据收集**：爬取东方财富网股吧的帖子标题。 2. **情绪分析**：对爬取的帖子标题进行情绪分类，分为正面、负面和中性。 3. **数据可视化**：将情绪分析结果通过柱状图、折线图和饼图进行可视化展示。 #### 技术路线 1. **网页爬取**： - 使用 `requests` 库发送 HTTP 请求，获取东方财富网股吧的网页内容。 - 使用 `BeautifulSoup` 库解析网页内容，提取帖子标题。 2. **情绪分析**： - 使用 `TextBlob` 或 `NLTK` 等自然语言处理库对帖子标题进行情绪分析。 - 将情绪分为正面、负面和中性三类。 3. **数据可视化**： - 使用 `matplotlib` 和 `seaborn` 库生成柱状图、

2024-08-10

009 - 上证50ETF基金数据分析及预测

#### 项目目标 1. 获取并处理上证50ETF基金的历史数据。 2. 通过分析股票指标，探讨其与基金价格变化的关系。 3. 应用多种时间序列预测模型（如LSTM, GRU, 双向LSTM）对基金未来走势进行预测。 4. 对比不同模型的预测效果，选择最佳模型。

2024-08-10

008 - 基于RNN和LSTM的贵州茅台股票开盘价预测

本项目旨在通过使用Tushare下载贵州茅台的股票数据，并基于这些历史数据，使用TensorFlow 2.0实现循环神经网络（RNN）和长短期记忆网络（LSTM）来预测股票的开盘价。本项目提供了完整的数据获取、处理、模型构建和预测的流程。

2024-08-10

005 - 马科维茨投资组合理论实现

python基于tushare实现马科维茨投资组合理论实现

2024-08-10

002 - 常见的金融量化指标计算

Tushare 是一个用于获取中国市场数据的开源Python包。我们将使用 Tushare 下载股票数据并计算常见的指标。

2024-08-10

74- 前程无忧python岗位信息爬取和分析

74| 前程无忧python岗位信息爬取和分析

2024-08-09

73 - 基于Python的上海二手房数据爬取及分析

链家二手房数据分析（爬虫+jupyter+报告）

2024-07-24

本项目旨在通过对智联招聘网站上发布的数据分析岗位信息的分析和可视化，帮助应届毕业生和希望进入数据分析行业的专业人士更好地理解当前

技术栈项目运用了Python的pandas库进行数据清洗和分析，通过pyecharts库创建了多种交互式图表，增强了数据的表现力和用户的交互体验。最终，使用Flask框架将分析结果通过Web页面形式呈现，使得数据分析结果更加直观且易于理解。数据分析目标地域分布：通过地图展示不同省份和城市的数据分析岗位数量，分析地区差异。薪资和学历关系：通过环形图和柱状图探索不同学历要求对薪资范围的影响。行业需求：分析数据分析需求最高的行业和公司规模，以及技能要求，帮助求职者针对性准备。关键问题解答哪些地区对数据分析专业人才的需求最大？影响数据分析岗位薪资的主要因素有哪些？求职数据分析岗位通常需要哪些技能和资质？数据来源与处理项目的原始数据来源于智联招聘网，涵盖了全国范围内的6263条数据分析岗位信息。在数据清洗过程中，我们对数据进行了去重、填充缺失值、异常值处理等，确保数据的准确性和分析的有效性。项目成果项目成功构建了一个包含多个交互式图表的Web应用，提供了一种直观、易于理解的方式来查看数据分析岗位的市场趋势和关键洞察。此外，该项目的完成不仅加深了我对数据分析行业的理解

2024-07-23

70 - 双十一美妆数据分析可视化

双十一，作为全球最大的购物狂欢节，提供了丰富的数据资源，特别是在美妆产品类别中。美妆品牌在这一天提供各种优惠和折扣，吸引了大量消费者。本项目旨在分析和可视化双十一期间淘宝美妆品类的销售数据，帮助消费者洞察不同品牌的折扣策略，并评估各品牌产品的性价比。数据源本项目使用的数据源为双十一期间的淘宝美妆销售数据，包括商品分类、品牌、价格、折扣率等信息。数据收集自淘宝平台的公开销售记录，整理成Excel表格进行详细分析。分析目标在售商品占比分析：识别双十一期间在售的美妆商品类别和其在市场上的占比。品牌折扣率分析：比较不同美妆品牌的折扣率，找出提供最大折扣的品牌。商品数量分布：分析参与双十一活动的各品牌商品数量，评估品牌活动的广泛程度。折扣套路解析：揭示不同品牌的折扣策略，帮助消费者识别可能的营销套路，例如虚高的原价或者“买一赠一”等促销活动。商品折扣率：深入分析商品的折扣深度，为消费者提供购买决策支持。数据分析工具项目主要使用以下工具进行数据分析和可视化： DataFrame：利用Pandas库构建和处理表格型数据，便于数据清洗、整理和分析。 Matplotlib、Ec

2024-07-23

71 - 去哪儿旅游数据分析

是关于旅游出行数据分析的，具体内容涵盖了对各省市景点的数据分析和可视化。下面是该笔记本的详细描述： 1. 数据概览笔记本开始于对数据集的导入与基本处理，包括清洗和整理，确保数据质量。数据集涵盖了景点名称、星级、评分、介绍、所在地区、儿童旅客量、销售量及门票价格等信息。 2. 省份数据分析接下来的分析按照省份进行，例如对海南、江苏和四川的景点数据进行了详细的分析。计算了各省的景点好评率、中评率、差评率，并通过公式进行了四舍五入处理以便更加直观。 3. 价格与评分分析分析还涉及到根据不同价格区间和星级筛选景点，对数据进行排序，从而找到每个价格区间中销售量最高的景点。此外，还对门票价格进行升序排序，并筛选出评分高于4分的景点。 4. 可视化展示最后，使用Pyecharts库，笔记本展示了一些基于液态球（Liquid）的动态图表，用于可视化四川等地景点的好评和差评比例。这种图表形式提供了一个直观且互动的方式来展示数据。

2024-07-23

本报告所选数据集下载自kaggle 数据集包含美国 2,392 名高中生的全面信息，详细介绍了他们的人口信息、学习习惯、父母参与

图2-1是以人种分类的GPA箱线图，可以看出，白种人（0）的成绩相对最低，而非裔美籍学生（1）和其他人种（3）的成绩相对更高，但各人种成绩分布基本相同，无显著差异。图2-2是以父母受教育程度为分类的GPA箱线图，数值越高代表父母受教育程度越高，从图中可以看出，学生GPA并未与父母受教育程度呈线正相关性，受教育程度为最高的那一批父母的孩子在GPA上的表现甚至是最差的。图2-3为父母对孩子的支持程度与孩子为分类的GPA箱线图，从图中可以明显的看出，父母对孩子的支持程度与孩子的GPA呈显著正相关，父母对孩子支持程度越高，孩子的成绩越好。图2-4中更是明显的看出在GPA最高的那部分学生，父母的支持是必不可少的。而图2-5则是研究父母的受教育程度与父母对孩子的支持程度是否有关系，从图中可以看出，父母的受教育程度与对孩子的支持程度无显著的关系，受教育程度低的父母也可以给孩子足够的支持。图2-6中，性别对GPA的影响也是微乎其微的，而请家教则对孩子的

2024-07-21

68 - 深圳链家二手房房源数据分析

本项目主要对链家二手房房源数据进行分析，通过数据可视化了解深圳的二手房源情况，对人们购房做出指导。二、背景随着经济的发展，北、上、广、深这四大都市迅速发展，在经济、政治等方面有突出的表现，而且工作机会多，生活质量较高，是大多数人所向往的地方。但是要在这些城市定居是一件不容易的事情，这样来说购买二手房是一个可以选择的方案，说到这我们一定会想了解这些地区的房源大概情况。所以本项目是对深圳链家二手房房源进行的分析，希望可以帮助部分人解决购房问题，从多维度出发分析，帮助买家拿定主意，实现合理的购房。

2024-07-21

67- 上海市互联网行业招聘数据集的构建与可视化分析

上海市互联网行业招聘数据集的构建与可视化分析期末报告，可以作为期末论文

2024-07-21

基于YOLO5细胞检测实战.zip

在进行基于YOLOv5的细胞检测实战时，完成以下的事情： 1. **数据采集与标注**：详细描述如何采集细胞图像数据，并进行标注。说明采集设备、图像分辨率、标注工具以及标注过程中的质量控制措施。 2. **数据预处理**：解释在输入模型之前对数据进行的预处理步骤，例如图像尺寸的调整、归一化和数据增强方法的选择。强调预处理的重要性以及如何影响模型的性能。 3. **模型选择与调优**：描述为什么选择YOLOv5作为细胞检测的模型，并说明如何调整模型的超参数以适应特定的细胞检测任务。可以讨论模型的架构、损失函数选择以及训练策略。 4. **训练过程**：详细说明模型的训练过程，包括数据集的划分、训练参数的设置、学习率调度方法以及监控训练过程中的性能指标。可以提供训练代码片段或脚本。

2024-02-19

天池-新闻推荐推荐系统

零基础入门推荐系统 - 新闻推荐赛题以新闻APP中的新闻推荐为背景，要求选手根据用户历史浏览点击新闻文章的数据信息预测用户未来点击行为，即用户的最后一次点击的新闻文章，测试集对最后一次点击行为进行了剔除。通过这道赛题来引导大家了解推荐系统中的一些业务背景，解决实际问题，帮助竞赛新人进行自我练习、自我提高。

2024-02-19

27 - Titanic 乘客生存决策树预测

Titanic 乘客生存预测流程数据获取 --> 数据探索 --> 数据清理 --> 特征选择 --> 决策树模型 --> 模型预测和评估 --> 决策树可视化

2024-02-19

SVM对文档进行分类：

## SVM对文档进行分类： `流程：` 文档输入 --> 对文档进行分词 --> 加载停用词 --> 计算单词权重 (准备阶段) --> 生成分类器 --> 分类器做预测 --> 计算正确率 (分类阶段)

2024-02-19

16 - Pytorch构建Logistic二分类模型

在逻辑回归中预测的目标变量不是连续的，而是离散的。可以应用逻辑回归的一个示例是电子邮件分类：标识为垃圾邮件或非垃圾邮件。图片分类、文字分类都属于这一类。

2024-02-03

11 - Tensorflow实现卷积神经网络

11 | Tensorflow实现卷积神经网络

2024-02-03

13 - 使用代理ip爬取安居客房源信息

这段Python爬虫代码旨在从安居客网站爬取房地产信息。其中使用了代理IP的技术，主要目的是应对反爬虫机制、提高隐私保护、伪装地理位置、避免频率限制和提升稳定性。

2024-01-14

手动爬取天天基金网基民评论与东方财富网股市行情的资讯，从基民评论、重仓股票、市场行情三个方面LDA模型进行分析

这是一个基金评论与股票市场的情感分析项目，目的是手动爬取天天基金网基民评论与东方财富网股市行情的资讯，从基民评论、重仓股票、市场行情三个方面出发，使用情感词典与LDA模型进行分析，从而做出是否值的购买基金的决策。带有标签clean的是清洗后的爬虫数据，没有带标签的是原始数据或者某个分析后的结果。具体的工作代码放在了“基于情感词典与LDA模型的基金文本研究.ipynb”中，使用的是python 的jupyter notebook。

2023-11-03

03.04 Requests豆瓣.ipynb

对豆瓣单个电影页面元数据进行获取元数据结构：<br> 1. 导演 2. 编剧 3. 主演 4. 类型 5. 制片国家/地区 6. 语言 7. 上映日期 8. 片长 9. 又名 10. IMDb 11. 豆瓣评分 - 评分 - 评价人数 - 5星评价占比 - 4星评价占比 - 3星评价占比 - 2星评价占比 - 1星评价占比 12. 好于 13. 好于 ## Step 1 找到250部电影的页面依次解析具体的页面爬取1292052...;爬取1292052成功爬取1291546...;爬取1291546成功爬取1292720...;爬取1292720成功爬取1292722...;爬取1292722成功爬取1295644...;爬取1295644成功爬取1291561...;爬取1291561成功爬取1292063...;爬取1292063成功爬

2023-11-01

SpringBoot+Mybatius图书管理系统语言：Java 开发工具：IntelliJIDEA-2019.3 JDK版

SpringBoot+Mybatis图书管理系统是一个用于管理图书信息的Web应用程序。它使用Java作为编程语言，IntelliJ IDEA作为开发工具，JDK 8作为Java开发环境，Maven用于项目管理，MySQL数据库用于存储数据，前端使用HTML、CSS、jQuery、Layui和Vue，后端采用Spring Boot、Mybatis以及TkMapper框架。下面将描述一些主要功能和组件以帮助你更好地理解这个系统： **主要功能：** 1. **图书管理**：用户可以添加、编辑、删除图书信息，包括书名、作者、出版日期等。 2. **借阅管理**：用户可以借阅图书并设置还书日期，系统会自动跟踪图书的借阅状态。 3. **用户管理**：管理系统用户，包括添加、编辑、删除用户信息，以及分配权限等。 4. **搜索和过滤**：提供搜索功能，可以根据关键字搜索图书信息，并可以根据不同条件进行过滤。 5. **权限管理**：不同用户具有不同的权限，例如管理员和普通用户，管理员可以管理图书和用户，而普通用户只能借阅图书。

2023-10-30

通用的Java工具类，主要包括基础工具类（时间、正则表达式、字符串、随机数等等），excel解析生成、word解析生成、文件操作

2023-10-22

基于Java的学生管理系统，旨在提供学生信息的管理和查询功能

这项目是一个基于Java的学生管理系统，旨在提供学生信息的管理和查询功能。 **1. 数据库连接和初始化：** - 项目使用Java数据库连接（JDBC）来建立与数据库的连接。 - 在系统初始化时，通过`DatabaseConnector`类创建了一个数据库连接，以便执行数据库操作。 **2. 添加学生信息：** - 系统提供了添加学生信息的功能。 - 用户可以输入学生的ID、姓名和年龄，然后系统将这些信息插入到数据库的`student`表中。 - 成功插入后，系统会显示学生已被添加的消息。 **3. 查找学生信息：** - 学生管理系统允许用户根据学生的ID来查找学生信息。 - 用户输入要查找的学生ID，系统执行SQL查询操作，如果找到匹配的学生，将显示学生的ID、姓名和年龄。 - 如果未找到匹配的学生，系统会显示未找到的消息。 **4. 更新学生信息：** - 系统允许用户根据学生ID更新学生信息。 - 用户输入学生ID，然后输入新的姓名和年龄，系统执行SQL更新操作，将学生信息更新为新提

2023-10-22

基于Python编程的RFM细分聚类案例

本文将深入探讨一个基于Python编程的RFM细分聚类案例。通过代码实现，我们将学习如何加载和预处理电商历史订单数据，计算RFM指标，使用KMeans算法进行聚类分析，以及如何将用户分为不同的价值层级。最终，我们将通过可视化展示来解释不同价值层级用户的分布情况，帮助企业更好地理解其客户群体，为未来的决策提供更多见解。

2023-08-21

65 - python增长模型案例

在一个具体的案例中，我们使用了一个关于用户行为的数据集，探讨了如何利用增长模型来优化业务决策。通过数据分析、可视化和机器学习建模，我们深入挖掘了用户的操作历史、设备类型、城市类型以及其他特征。我们通过构建预测模型，预测了用户是否会对不同类型的促销方式做出响应，从而实现了精准的目标用户选择。在实际操作中，我们不仅关注转化率的提升，还需要考虑成本与效益的平衡。我们将重点放在那些有潜力的用户身上，通过合理的营销策略来提升他们的转化率，从而在有限的资源下实现业务增长。

2023-08-21

A/B测试展示如何运用Python进行数据分析、可视化和统计显著性检验

探讨A/B测试的概念、原理以及其在实际业务中的应用。通过一个案例，详细展示如何运用Python进行数据分析、可视化和统计显著性检验，以揭示不同页面版本在用户购买转化率方面的差异。通过对比新旧页面的转化率，我们将探讨如何从统计学的角度评估这些差异是否具有显著性。从而，读者将深入了解如何通过A/B测试来为业务决策提供有力的数据支持，进而优化用户体验和提升业务成果。

2023-08-21

63 - 留存分析在现代商业中的关键作用 python 案例

我们以一个案例为例，展示了如何通过数据驱动的方法识别影响留存率的因素。首先，我们载入了一个会员数据集，对数据进行了预处理，包括转换字段、处理缺失值等。然后，我们使用Kaplan-Meier生存分析方法绘制了整体的留存曲线，从中可以看出会员的留存率随着入会月数的增加逐渐下降，这提醒我们需要关注新会员的留存情况。接着，我们对不同因素进行了分析，比如会费支付方式、会员卡类型以及性别对留存率的影响。通过绘制不同分类的Kaplan-Meier曲线，我们可以看到这些因素对留存率的影响情况。例如，不同的会费支付方式和会员卡类型对留存率产生了不同的影响，这提示我们可以针对不同的客户群体制定不同的留存策略。接着，我们采用Cox比例风险模型来进行生存分析，这种方法可以同时考虑多个因素对留存的影响。通过打印模型的摘要信息，我们可以得到不同因素的系数，从而了解每个因素对留存的影响程度。此外，我们还绘制了系数和置信区间的图表，更直观地展示了各因素的影响情况。最后，我们展示了如何使用逻辑回归模型对留存进行预测。通过构建特征集和标签集，我们将数据集拆分为训练集和测试集，然后使用逻辑回归模型进行拟合和预测

2023-08-21

62 - Python 漏斗分析案例

漏斗分析是一种重要的数据分析方法，用于跟踪和优化用户在某个过程中的转化率。无论是在线购物、注册流程还是应用下载，漏斗分析都能帮助您了解用户在不同阶段的行为，找出瓶颈，优化用户体验。

2023-08-20

61 - 归因渠道分析案例 python

归因分析（Attribution Analysis）是一种用于评估不同营销渠道推广效果的方法，它的主要目标是合理地将转化路径中的功劳分配给各个接触点，也就是不同的营销渠道。这帮助营销人员更准确地了解各个渠道对最终转化所产生的影响，从而更有效地分配资源和优化营销策略。

2023-08-20

TA关注的人

019 - backtrader回测布林带突破策略

018 - backtrader回测反转策略

017 - backtrader回测趋势跟随策略

016 - backtrader回测波动率策略

015 - backtrader回测动量策略

014 - backtrader回测均值回归策略

013 - backtrader回测沪深300指数简单移动平均线交叉策略

012 - akshare分析NYBOT棉花历史数据

011 - efinance分析豆一主连期货

010 - 东方财富帖子标题情绪分析

009 - 上证50ETF基金数据分析及预测

008 - 基于RNN和LSTM的贵州茅台股票开盘价预测

005 - 马科维茨投资组合理论实现

002 - 常见的金融量化指标计算

74- 前程无忧python岗位信息爬取和分析

73 - 基于Python的上海二手房数据爬取及分析

本项目旨在通过对智联招聘网站上发布的数据分析岗位信息的分析和可视化，帮助应届毕业生和希望进入数据分析行业的专业人士更好地理解当前

70 - 双十一美妆数据分析可视化

71 - 去哪儿旅游数据分析

本报告所选数据集下载自kaggle 数据集包含美国 2,392 名高中生的全面信息，详细介绍了他们的人口信息、学习习惯、父母参与

68 - 深圳链家二手房房源数据分析

67- 上海市互联网行业招聘数据集的构建与可视化分析

基于YOLO5细胞检测实战.zip

天池-新闻推荐 推荐系统

27 - Titanic 乘客生存决策树预测

SVM对文档进行分类：

16 - Pytorch​​构建Logistic二分类模型

11 - Tensorflow实现卷积神经网络

13 - 使用代理ip爬取安居客房源信息

手动爬取天天基金网基民评论与东方财富网股市行情的资讯，从基民评论、重仓股票、市场行情三个方面LDA模型进行分析

03.04 Requests豆瓣.ipynb

SpringBoot+Mybatius图书管理系统 语言：Java 开发工具：IntelliJIDEA-2019.3 JDK版

通用的Java工具类，主要包括基础工具类（时间、正则表达式、字符串、随机数等等），excel解析生成、word解析生成、文件操作

基于Java的学生管理系统，旨在提供学生信息的管理和查询功能

基于Python编程的RFM细分聚类案例

65 - python增长模型案例

A/B测试 展示如何运用Python进行数据分析、可视化和统计显著性检验

63 - 留存分析在现代商业中的关键作用 python 案例

62 - Python 漏斗分析案例

61 - 归因渠道分析案例 python

gitcode 可以搭建gitpage

启动CDH，报错ERROR StatusLogger No log4j2 configuration file found. Using default configuration...ogging.

cloudera-manager-agent.x86_安装报错

Sqoop导入数据到Hbase报错

Centos7运行Elasticsearch6.5.4报错

Centos7运行elasticsearch-6.5.4报错

为什么在腾讯云服务器测试uwgis老是失败

为什么在腾讯云服务器测试uwgis老是失败

return load_dynamic(name, filename, file) tensorflow安装这个报错半年也没有解决

npm安装全局怎么使用加速？

npm安装全局怎么使用淘宝源加速？

npm这种情况，nodejs是不是安装好了

nodejs环境安装出现这个问题npm报错安装nodejs，出现这个npm 报错，问下大佬怎么搞定

天池-新闻推荐推荐系统

16 - Pytorch构建Logistic二分类模型

SpringBoot+Mybatius图书管理系统语言：Java 开发工具：IntelliJIDEA-2019.3 JDK版

A/B测试展示如何运用Python进行数据分析、可视化和统计显著性检验