- 博客(36)
- 资源 (171)
- 问答 (12)
- 收藏
- 关注
原创 Centos7搭建Kubernetes集群
@Author:By RunsenKubernetesKubernetes 及其整个生态系统(工具、模块、插件等)均使用 Go 语言编写,从而构成一套面向 API、可高速运行的程序集合,这些程序文档精良、易于参与贡献或在其上构建应用程序。(百度百科)那么 Kubernetes有什么用?其实很简单,Docker是部署我们的项目的容器,可是一个容器部署不够,如果在多个Linux服务器中使用Doc...
2020-04-28 12:35:55 1279
原创 Python北京空气质量数据处理
北京空气质量数据处理这是我接单的一个单,看了数据源,马发现很有印象,马上就知道来源kaggle中国北京上海广州成都,沈阳的Pm2.5数据集,对应的链接:https://www.kaggle.com/uciml/pm25-data-for-five-chinese-cities,数据集去kaggle下载,在kaggle上就是一个时间序列的问题。他们老师的要求:将源码与生成的数据(rar或zip格...
2020-04-27 12:06:18 2377
原创 七、Python简单爬取学堂在线合作院校页面内容
这是一个大学生的爬虫作业,我是收钱干活的,比较简单,来过来分享一下。就是要爬取到合作院校的名称及该所院校在学堂在线开课的数量,将爬取到的数据保存到一个json文件中!例如:“{“清华大学”:308}”直接用xpath就可以了,保存为字典,然后转化成json就OK了。dict(zip(course,nums))将两个列表变成字典,这个需要知道。爬取代码如下。'''@Author: R...
2020-04-23 14:49:19 3343
原创 五十二、Python北京美团汉堡外卖数据分析实战
前言@Author:By Runsen今天肚子饿了,我突然想点一个外卖,最近迷上了香辣鸡腿堡,打开美团外卖竟然发现周围没有店家,有的店家离我非常远,气得我不行了,送过来要2个小时,说好的美团外卖,送啥都快。于是,我不得不跑去支付宝下的饿了么去下单,发现半小时就可以给我送到了,神速。吃上香辣鸡腿堡,顺便点了薯条和可乐,真香!突然间,做了一个小梦,梦到了负责北京的美团老板私信我,说北京各...
2020-04-23 14:41:28 2739 1
原创 八、爬虫解析利器 PyQuery 的使用
@Author: Runsen每个网页,都有一定的特殊结构和层级关系,而且很多节点都有 id 或 class 作为区分,我们可以借助它们的结构和属性来提取信息。如果你用惯了xpath和bs4,学习Pyquery是一个不错的选择。pyquery 是 Python 的第三方库,我们可以借助于 pip3 来安装,安装命令如下:pip install pyquery下面,我以CSDN首页为例。...
2020-04-23 14:23:23 1127
原创 二十九、接了一单Python数据分析的私活,心痛
前言大家好,我是润森。在很早之前,2020-03-29接到一个非常简单的单子,是重本大学大学生的作业,就是有test1和test2.csv下图是test1的csv,数据比较多。下图是test2的csv,数据比较少,一共12条数据。他的要求是通过test1中的A列中有多个数据,使用A列中的F列减去对于的test2中的D列,再用A列中的G列减去对于的test2中的E列。y使用下面的计...
2020-04-18 18:39:10 6185 5
原创 四十一、完成scrapy爬取官方网站新房的数据
在前几天,接到一个大学生的作业的爬虫单子,要求采用scrapy爬取链家官方网站新房的数据(3-5页即可,太多可能被封禁ip),网址:https://bj.fang.lianjia.com/loupan/,将楼盘名称、价格、平米数等(可以拓展)数据保存到一个json文件中。
2020-04-17 19:27:55 2954 3
原创 股市永不过时的黄金铁律:零下金叉疯狂买,零上死叉立即卖
MACD和RSI技术分析指标在前面详细介绍了Talib,谈到期货交易软件中常用的技术分析指标,如MACD、RSI、KDJ、动量指标、布林带等等。(1)MACDMACD指标是所有技术指标里最经典的一个技术指标,正确运用这个指标,通过结合K线(日K线、周K线)、个股走势、量、大盘走势、利空利好消息等,基本上就可以达到较好地买卖效果。MACD有四大元素,分别是DIFF,DEA,红绿柱线和零轴线...
2020-04-15 10:31:06 1326
原创 Python爬虫加密
加密在开发爬虫的过程中,我们经常遇到的一种反爬措施是数据加密。常见的加密算法可以分为三类:对称加密算法,非对称加密算法和Hash算法(事实上不是加密算法而是摘要算法)一、对称加密1.定义采用单钥密码系统的加密方法,同一个密钥可以同时用作信息的加密和解密,这种加密方法称为对称加密,也称为单密钥加密。由于其速度快,对称性加密通常在消息发送方需要加密大量数据时使用。但是,加解密双方使用同样的密钥...
2020-04-09 10:15:48 1370
原创 三十、Pyspider爬虫框架总结,爬取Scrapy文档
安装好pyspider后,创建一个项目文件夹用来存放相关文件,进入文件夹后运行pyspider命令,默认情况下会运行一个web服务端监听5000端口,通过http://localhost:5000即可访问pyspider的web管理界面。
2020-04-09 10:14:33 1128
原创 js调试微博登录案例
js调试五、微博登录案例1.分析流程手动操作流程访问首页https://weibo.com输入用户名和密码点击登录如果有验证码,就输入验证码验证成功跳转到微博首页面请求流程分析过程根据上面的手动操作流程,我们要分析出网站的http请求逻辑。1.首页面请求分析首先,打开谷歌浏览器开发者调试工具,查看在请求首页面时,请求回的响应是否包含cookie,也即是看首页面的响应头中...
2020-04-09 10:13:20 1207 3
原创 五十五、手把手教你从零到一,完成淘宝数据分析案例
淘宝数据分析案例假设,老板是做服装的行业的。某一天,老板想上市自己T-shirt的产品,但在上市前需要知道,在我国主要的竞争对手在哪个省份以及T-shirt的主要定价属于什么区间。拿到任务的你,进行第一步数据采集。思考了下,我应该先把淘宝网上卖T-shirt的卖家的信息爬取一遍,于是开心的打开淘宝官方网站,搜索T恤。下面,你决定先明确爬取的目标的数据,决定爬取每个商品的标题,价格,位置和销...
2020-04-08 18:08:16 1594
原创 三十三、自从我会了Python中的PIL,发现了其实超级简单
PIL全称是Python Image Library,顾名思义,是用来做图像处理的。我们可以用PIL干嘛呢?第一,可以将两张图片合并在一起Image.blend(image1,image2,alpha)合成公式为:out=image1(1.0- alpha)+image2alphafrom PIL import Imageim1 = Image.open("1.jpg")im2 = ...
2020-04-08 11:08:24 1435
原创 我是Python小玩家,一行代码能做哪些炫酷的事情 (三十一)
python之禅一行代码启动一个Web服务python -m SimpleHTTPServer 8080python3 -m http.server 8080一行代码实现变量值互换a, b = 1, 2; a, b = b, a一行代码打印迷宫print(''.join(__import__('random').choice('\u2571\u2572') for i in r...
2020-04-08 10:46:18 1130
原创 手把手教你插入数学公式,妈妈再也不用担心我写不了论文了
LaTeX是专为学术写作开发的语言和编纂程序,拥有强大的package资源,这意味着用LaTeX写作可以避免Word带来的令人头疼的排版问题,而且世界上有很多人已经写好了针对各种写作格式的coding package,我们只需要套用这些package就行了。行间公式 (inline):用$...$将公式括起来。块间公式 (displayed),用$$...$$将公式括起来是无编号的形式...
2020-04-07 23:50:03 1674
原创 AHP层次分析法解决用户价值评估
前言@Author : Runsen现在互联网都有得到用户,那用户到底有没有价值需要评估。通过各种指标来给用户综合打分,每个用户最后会得到一个分值,分值越高,说明用户的价值越高。这是一个总的目标,一个用户可以创造的价值由两部分决定:创造价值的能力和创造价值的意愿,前者是能不能的问题、后者是愿不愿意的问题。定了两个主线以后再次进行目标拆解,根据业务经验分别找到那些能够判断用户创造价值的能力和意...
2020-04-07 23:40:42 1578
原创 Python在window平台打包工具pyinstaller (三十五)
Java 一次编译到处运行,Python没有这么好本事,但是也有一个pyinstaller可以打包exe,在window平台下运行pyinstaller安装pip install pyinstaller参数参数含 义-F只生成一个exe文件–distpath指定生成的exe存放的目录–workpath指定编译中临时文件存放的目录-i创建一个目录...
2020-04-07 12:03:42 1077
原创 二十二、 深入Python的进程和线程(上篇)
进程(Process)和线程(Thread)都是操作系统中的基本概念,它们之间有一些优劣和差异,那么在Python中如何使用进程和线程?
2020-04-07 11:12:00 1158
原创 Python中的itchat模块使用大全
Python中有一个itchat实现微信的分析和登录。itchat是一个开源的微信个人号接口,使用python调用微信从未如此简单。使用不到三十行的代码,你就可以完成一个能够处理有信息的微信机器人。当然,该api的使用远不止一个机器人,更多的功能等着你来发现。#实现微信消息的获取import itchat@itchat.msg_register(itchat.content.TEXT)...
2020-04-06 11:11:55 7106 6
原创 65 | 邮件发送
在Python中,我们可以使用smtplib和email两个库来实现发送邮件的功能。smtplib库用于发送邮件,而email库用于构建邮件内容。
2020-04-06 10:49:15 1337
原创 Python读写docx文件(三十五)
Python读写docx文件Python读写word文档有现成的库可以处理pip install python-docx安装一下。https://python-docx.readthedocs.io/en/latest/学习官网: http://python-docx.readthedocs.org/en/latest/import docx# 新建,打开,保存文件。import ...
2020-04-06 10:40:06 1010
原创 26 | logging模块
模块在Python中提供了一个灵活的框架用于发出日志信息。这个模块提供了许多功能,比如更改日志消息的输出格式,指定日志消息的级别等。这段代码将输出类似’2023-07-27 12:15:27 - WARNING - 这是 warning 级别的消息’的日志信息。这段代码将只输出级别为INFO及以上的日志消息。因此,'这是 debug 级别的消息’将不会被打印出来。这段代码将所有级别的日志消息都输出到’example.log’文件中。:请将日志信息同时输出到控制台和文件。:请捕获并记录一个运行时错误。
2020-04-06 10:31:42 1126
原创 27 | pickle、json 和 shelve
在Python中,pickle、json和shelve是用于数据序列化的常见模块。相比于pickle模块,json模块的优势在于其生成的 JSON 字符串是人可读的,并且可以被 Python 以外的语言(如 JavaScript)读取和写入。Pickle 模块是 Python 提供的用于序列化和反序列化的标准接口,它能够将 Python 对象转换为一种可以传输或存储的格式,同时还能够进行反向操作。注意,Pickle模块的序列化和反序列化过程可能存在安全风险,不应该处理来自不可信的或未经验证的源的数据。
2020-04-06 10:26:37 1118
原创 13 | 常见关键字
在上面的代码中,我们使用 assert 关键字检查变量 a 和 b 是否相等。在上面的代码中,我们使用 class 关键字定义了一个名为 Person 的类,它有两个属性 name 和 age,并且有一个方法 greet,用于打印出人的姓名和年龄。在上面的代码中,我们使用 def 关键字定义了一个名为 greet 的函数,它接受一个参数 name,并在屏幕上打印出 “Hello, name!在上面的代码中,我们使用 finally 关键字定义了一个必须执行的代码块,并打印出 “Done” 的消息。
2020-04-03 19:28:04 1459
原创 17 | 逻辑回归
逻辑回归是一种监督学习算法,用于解决二元分类问题。它的目标是预测一个二元变量的结果,例如预测一个人是否会购买某个产品,或者预测某个病人是否患有某种疾病。逻辑回归的输出是一个介于0和1之间的概率值,表示给定输入数据属于正类的概率。如果概率大于或等于一个预定义的阈值,则将该输入数据分类为正类,否则将其分类为负类。逻辑回归(Logistic Regression)是一种广泛用于二分类问题的回归模型,尽管它的名称里包含“回归”二字,但它实际上是用于分类的一种算法。原理。
2020-04-03 10:19:51 1088 1
原创 总结Python机器学习中的回归算法
下面我带大家整理下机器学习的回归算法基本回归方法(线性、决策树、SVM、KNN)和集成方法(随机森林,Adaboost和GBRT)下面是源码import numpy as npimport matplotlib.pyplot as pltdef get_data(): x1_train = np.linspace(0,100,50).reshape(-1,1) x2_...
2020-04-03 10:10:18 1221
原创 多元线性回归分析问题
什么是多元线性回归在回归分析中,如果有两个或两个以上的自变量,就称为多元回归。**事实上,一种现象常常是与多个因素相联系的,由多个自变量的最优组合共同来预测或估计因变量,比只用一个自变量进行预测或估计更有效,更符合实际。**因此多元线性回归比一元线性回归的实用意义更大。y=β0+β1x1+β2x2+ … +βpxp+ε # 公式今天讲一个例子这里有个excel 文件数据,我们来研究...
2020-04-03 10:00:26 1605
原创 从简单的一元线性回归分析入门机器学习
什么是回归分析回归分析(regression analysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的变量的多少,分为一元回归和多元回归分析;按照因变量的多少,可分为简单回归分析和多重回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近...
2020-04-03 09:48:05 1052
原创 四十、Linux和ViM的使用
关于虚拟机的安装,首先安装VMware或者Vbox,然后去官方网站下载iso镜像,导入iso镜像文件,设置对应的网络配置和内存配置,对应其具体操作,百度搜索。
2020-04-03 09:32:33 1127
原创 一个简单的线性拟合问题,到底有多少种做法
一个简单的线性拟合问题,到底有多少种做法相信大家都做过线性拟合问题吧,其实就是给很多点,来求线性方程的斜率和截距。早在高中数学就有这类问题,我记得很清楚,如果出现在试卷中,一般出现在解答题的第二题左右,高中中的做法就是最小二乘法,代入公式,求斜率和截距,说句好听,就是送分题。在科学计算中,也是采用ols(普通最小二乘法)进行回归分析。OLS 全称ordinary least squares,是...
2020-04-02 15:49:25 3501
原创 Python用泰勒公式模拟函数
泰勒公式数学中,泰勒公式是一个用函数在某点的信息描述其附近取值的公式。如果函数足够平滑的话,在已知函数在某一点的各阶导数值的情况之下,泰勒公式可以用这些导数值做系数构建一个多项式来近似函数在这一点的邻域中的值。泰勒公式还给出了这个多项式和实际的函数值之间的偏差。泰勒公式是将一个在x=x0处具有n阶导数的函数f(x)利用关于(x-x0)的n次多项式来逼近函数的方法。若函数f(x)在包含x0的某...
2020-04-02 10:16:15 2770
原创 十二、爬了CSDN,我发现了这些
最近,有点兴趣爬下自己在CSDN 的博客,并做出词云图来看下自己究竟写了什么。最近,有点兴趣爬下自己在CSDN 的博客,并做出词云图来看下自己究竟写了什么说起,就开干,下面是博客主页:https://blog.csdn.net/weixin_44510615环境操作系统:WindowsPython版本:3.7.2模块本文涉及到的Python第三方模块,共计五个:分词模块...
2020-04-01 19:05:09 1107 2
原创 节能原理 (能量平衡)
节能原理1Kg标准煤的发热量为29270kj/kg热平衡热平衡(thermal equilibrium ),指同外界接触的物体,其内部温度各处均匀且等于外界温度的状况。在热平衡时,物体各部分以及物体同外界之间都没有热量交换。在热工和化学中,如物体在同一时间内吸收和放出的热量恰好相抵消,也称该物体处于热平衡。焦炉热平衡焦炉热平衡 (heat balance of coke oven...
2020-04-01 16:39:05 1693
原创 10 | 元组(Tuple)序列
在 Python 中,元组和列表都是序列类型,但元组是不可变的,而列表是可变的。因为元组是不可变的,所以 Python 可以对元组进行优化,例如,将元组存储在内存中的固定位置,这可以更有效地利用缓存。此外,元组的不可变性使得它们可以用作字典的键或集合的元素,而列表则不能。Python 元组(Tuple)是一种不可变序列,它可以存储多个项目,这些项目可以是不同类型(包括整数、浮点数、列表,甚至其他元组)。由于元组是不可变的,所以你不能改变元组中的元素。和列表一样,你也可以使用切片操作从元组中获取元素的子集。
2020-04-01 11:48:03 1209
原创 11 | 字典
哈希表使字典的主要操作(插入、查找和删除)在大多数情况下都能在常数时间内完成,这意味着操作的时间不会随着字典大小的增加而增加。Python 字典(Dictionary)是一个可变的、无序的数据集合,用于存储键值对。字典中的键必须是唯一的,而值则可以是任何类型的数据 - 数字,字符串,列表,甚至其他字典。在Python的字典中,我们还可以执行其他的一些操作,比如添加键值对、合并两个字典、获取所有的键或值,等等。以上的代码会分别打印出字典的所有键、所有值以及所有的键值对。要访问字典中的值,可以使用键作为索引。
2020-04-01 11:44:13 1751 1
019 - backtrader回测布林带突破策略
2024-08-11
018 - backtrader回测反转策略
2024-08-11
017 - backtrader回测趋势跟随策略
2024-08-11
016 - backtrader回测波动率策略
2024-08-11
015 - backtrader回测动量策略
2024-08-11
014 - backtrader回测均值回归策略
2024-08-11
013 - backtrader回测沪深300指数简单移动平均线交叉策略
2024-08-11
012 - akshare分析NYBOT棉花历史数据
2024-08-11
011 - efinance分析豆一主连期货
2024-08-11
010 - 东方财富帖子标题情绪分析
2024-08-10
009 - 上证50ETF基金数据分析及预测
2024-08-10
008 - 基于RNN和LSTM的贵州茅台股票开盘价预测
2024-08-10
本项目旨在通过对智联招聘网站上发布的数据分析岗位信息的分析和可视化,帮助应届毕业生和希望进入数据分析行业的专业人士更好地理解当前
2024-07-23
70 - 双十一美妆数据分析可视化
2024-07-23
71 - 去哪儿旅游数据分析
2024-07-23
本报告所选数据集下载自kaggle 数据集包含美国 2,392 名高中生的全面信息,详细介绍了他们的人口信息、学习习惯、父母参与
2024-07-21
68 - 深圳链家二手房房源数据分析
2024-07-21
基于YOLO5细胞检测实战.zip
2024-02-19
天池-新闻推荐 推荐系统
2024-02-19
27 - Titanic 乘客生存决策树预测
2024-02-19
SVM对文档进行分类:
2024-02-19
16 - Pytorch构建Logistic二分类模型
2024-02-03
13 - 使用代理ip爬取安居客房源信息
2024-01-14
手动爬取天天基金网基民评论与东方财富网股市行情的资讯,从基民评论、重仓股票、市场行情三个方面LDA模型进行分析
2023-11-03
03.04 Requests豆瓣.ipynb
2023-11-01
SpringBoot+Mybatius图书管理系统 语言:Java 开发工具:IntelliJIDEA-2019.3 JDK版
2023-10-30
通用的Java工具类,主要包括基础工具类(时间、正则表达式、字符串、随机数等等),excel解析生成、word解析生成、文件操作
2023-10-22
基于Java的学生管理系统,旨在提供学生信息的管理和查询功能
2023-10-22
基于Python编程的RFM细分聚类案例
2023-08-21
65 - python增长模型案例
2023-08-21
A/B测试 展示如何运用Python进行数据分析、可视化和统计显著性检验
2023-08-21
63 - 留存分析在现代商业中的关键作用 python 案例
2023-08-21
62 - Python 漏斗分析案例
2023-08-20
61 - 归因渠道分析案例 python
2023-08-20
gitcode 可以搭建gitpage
2022-08-25
启动CDH,报错ERROR StatusLogger No log4j2 configuration file found. Using default configuration...ogging.
2020-03-16
cloudera-manager-agent.x86_安装报错
2020-03-15
Sqoop导入数据到Hbase报错
2020-03-01
Centos7运行Elasticsearch6.5.4报错
2020-01-13
Centos7运行elasticsearch-6.5.4报错
2020-01-09
为什么在腾讯云服务器测试uwgis老是失败
2019-11-17
为什么在腾讯云服务器测试uwgis老是失败
2019-11-17
npm安装全局怎么使用加速?
2019-04-23
npm安装全局怎么使用淘宝源加速?
2019-04-22
npm这种情况,nodejs是不是安装好了
2019-04-18
TA创建的收藏夹 TA关注的收藏夹
TA关注的人