自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

ChenKai_164的博客

原创金融量化分析基础（二）—— 套利

欢迎关注公众号K的笔记阅读博主更多优质学习内容量化投资与策略思想什么是量化投资量化投资是借助金融学、数学、计算机等方法，将人的投资理念（投资习惯）程序化，从而完成机器自动数据处理、分析建模以及下单选股的操作，用数学模型选股能够避免人的主观因素的影响，避免在市场极度狂热或悲观的情况下使人做出非理性的投资决策。投资者自己往往有多套策略，但每次使用的都未必相同，比如有时用均线交叉，有时用布林带，有时用横盘突破，但无法准确预知风险和收益，较为主观，量化投资恰能避免这种人性的弱点，能较好地反应逻辑的有效性并

2020-12-14 00:44:57 3384

原创金融量化分析基础（一）—— 名词大赏

股票股票是股份公司发给出资人的一种凭证，股票的持票者就是股份公司的股东股票的面值与市值：面值表示票面金额市值表示市场价值上市/IPO：企业通过证券交易所公开向社会增发股票以募集资金股票的作用出资证明、证明股东身份、对公司经营发表意见公司分红、交易获利股票的分类股票按业绩分类：蓝筹股：资本雄厚、信誉优良的公司的股票绩优股：业绩优良的公司的股票ST股：特别处理股票，连续两年亏损或每股净资产低于股票面值股票按上市地区分类A股：中国大陆上市，人民

2020-12-14 00:43:37 372

原创 Kubernetes 核心原理及实战中使用方法

认识 kubernetes 架构及应用场景kubernetes（k8s) 在企业中的应用场景构建自动化运维平台（1）中小型企业，使用 k8s 构建一套自动化运维平台（降本增效）（2）大型互联网公司更要使用，实现更高效的运作方式充分利用服务器资源服务无缝衔接服务部署模式变迁&服务部署模式变化的思考云架构 & 云原生kubernetes 架构原理深入认识 kubernetes 核心组件原理kubernetes 的服务的注册与发现...

2020-06-03 10:31:50 485

原创 Python爬虫初级（十四）—— Scrapy爬虫基础

Scrapy库不是一个简单的函数，而是一个爬虫框架。爬虫框架就是实现爬虫功能的一个软件结构和功能组件集合爬虫框架就是一个半成品，能够帮助用户实现专业网络爬虫。Scrapy爬虫框架结构“5+2”结构：Engine模块Spider模块Downloader模块ItemPipelines模块Scheduler模块下图为嵩天教授讲授爬虫课程时的Scrapy框架图截图：[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-wyuKncYV-1591115592471)(./

2020-06-03 00:33:51 646

原创半小时掌握Bert模型

自然语言处理通用解决方案需要熟悉 word2vec，RNN 网络模型，了解词向量如何建模重点在于 Transform 网络架构，BERT训练方法，实际应用开源项目都是现成的，提供预训练模型，基本任务拿过来直接用就成Transformer做了什么事其基本组成仍是机器翻译中常见的Seq2Seq网络，也就是类似输入一串中文，输出对应的英文，输入输出都很直观，其核心架构就是中间的网络设计(Transformer)了。传统架构中中间的网络设计就是一个RNN，但是RNN不能并行计算，比如输入x0,x1

2020-06-01 15:34:44 361

原创 Python算法实现（二）—— 堆排序算法

二叉堆二叉堆本质上是一种完全二叉树，它分为两个类型：最大堆和最小堆。最大堆：最大堆任何一个父节点的值，都大于等于它左右孩子节点的值最小堆：最小堆任何一个父节点的值，都小于等于它左右孩子节点的值。二叉堆的根节点叫做堆顶，最大堆的堆顶是最大元素，最小堆的堆顶是最小元素。堆的自我调整插入节点我们首先有一个最大堆，我们希望给这个堆插入一个元素，我们首先直接将这个新元素放置到堆的最下部，此时发现最下面的子堆不满足最大堆的定义，依次向上调整：首先交换80和45，然后交换80和72，最终满足条件，此时插

2020-06-01 14:58:14 307

原创 Python算法实现（一）—— 快速排序算法

快速排序是我们在面试时常常遇到的算法，我们接下来首先介绍快速排序的基本思想，然后手撸一遍快速排序算法，最后我们介绍一些特殊情景的应用。快速排序介绍快速排序算法是冒泡排序算法的一种改进，其主要思想是通过一趟排序将要排序的数据分割成独立的两部分，其中一部分的所有数据比另一部分所有数据小，整个过程可以递归进行，最终使整个数据变成有序序列。但快速排序是一种不稳定的排序算法，即相同元素不能保序，因此在一些实际场景中不能进行使用。快排实现步骤在数据集之中，选择一个元素作为“基准”（pivot）· 可以选择第

2020-05-11 23:44:48 1011

原创 Python爬虫初级（十三）—— 水木社区论坛爬取实战

我们首先打开待爬取页面 —— 水木社区的首页：http://www.newsmth.net/nForum/#!mainpage，进入后页面如下：

2020-04-30 00:06:26 3454

原创 Python爬虫初级（十二）—— 新闻消息爬取实战

上一篇内容：Python爬虫初级（十一）—— Selenium 详解链接介绍我们需要爬取的链接是：https://news.qq.com/我们最终的爬取目标是将所有标题及其内容罗列出来存储为表格文档爬取过程其实这个爬虫的代码特别简单，就是使用我们前面学的 Selenium教程，下面拆分代码进行讲解：首先自然就是导入所需的所有库：from bs4 import BeautifulSo...

2020-04-28 10:00:16 389

原创 Python爬虫初级（十一）—— Selenium 详解

上一篇内容：Python爬虫初级（九）—— ajax 详解Selenium 库的安装Selenium 的安装比起其他 python 库的安装稍显复杂，下面对此做简要介绍：首先自然是 pip install selenium，然后我们需要安装对应的浏览器 driver，driver是什么呢，在介绍怎么安装之前，我们先看下面这两行代码：from selenium import webdrive...

2020-04-27 21:21:00 374

原创 Python爬虫初级（十）—— Session 和 Cookie 详解

上一篇内容：Python爬虫初级（九）—— ajax 详解Session 和 Cookie我们先介绍 Session 和 Cookie 的区别：Cookie在网站中，http 请求是无状态的。也就是说即使第一次和服务器连接后并且登录成功后，第二次请求服务器依然不能知道当前请求是哪个用户。cookie 的出现就是为了解决这个问题，第一次登录后服务器返回一些数据（cookie）给浏览器，然后浏...

2020-04-27 16:06:57 610

原创 Python爬虫初级（九）—— ajax 详解

上一篇内容：Python爬虫初级（八）—— lxml 详解及代理IP爬取ajax 介绍我们看到 ajax 这个词，大多数人都会觉得这个词和以前的不太一样，似乎听的更少了更陌生了，我们要怎么理解 ajax 呢？我们先看看它的英文全称：AJAX = Asynchronous JavaScript and XML，翻译成中文就是异步的 JavaScript 和 XML，异步也就是说，它可以在不重新加...

2020-04-27 14:48:18 935

原创 Python爬虫初级（八）—— lxml 详解及代理IP爬取

上一篇内容：Python爬虫初级（七）—— 丁香园评论留言板爬取前一篇文章的末尾我们提到，可以使用 lxml + xpath 提取文章内容，在这篇文章中，我们将对 lxml 与 xpath 进行详细阐述。...

2020-04-25 14:13:24 527

原创 Python爬虫初级（七）—— 丁香园评论留言板爬取

观察待爬取页面，判断爬取可行性上一篇内容：Python爬虫初级（六）—— 正则表达式库入门我们首先查看待爬取页面：http://www.dxy.cn/bbs/thread/626626#626626，具体形式为下图：我们查看源代码信息：可以发现留言板块的内容在页面源代码全部直接显示了出来，那么我们可以尝试直接进行爬取，我们采取的思路首先是 requests 库 + bs4 库，这两者的具体...

2020-04-25 11:25:48 1133 1

原创机器学习入门+实战初级（二）—— 朴素贝叶斯

前一篇内容：机器学习入门+实战初级（一）—— 线性回归注：本文假定读者已有概率论基础数据设定：我们首先假定我们已有的数据为：(x1(1),x2(1),…xn(1),y1),(x1(2),x2(2),…xn(2),y2),…(x1(m),x2(m),…xn(m),ym)\left(x_{1}^{(1)}, x_{2}^{(1)}, \ldots x_{n}^{(1)}, y_{1}\righ...

2020-04-23 21:45:49 283

原创 Python爬虫初级（六）—— 正则表达式库入门

上一篇文章：Python爬虫初级（五）—— “中国大学排名定向爬虫”正则表达式，即 RE，是 regular expression 的简称，是用来简洁表达一组字符串的表达式。正则表达式的语法操作符说明正则表达式样例.匹配任何字符（换行符除外）b.b[…]匹配字符组里出现的任意一个字符[abcd]*匹配前面出现的正则表达式零次或多次...

2020-04-22 11:08:46 463

原创机器学习入门+实战初级（一）—— 线性回归

线性回归的概念及数学推导一般假定首先我们假定机器学习数据集的一般形式为：{(x1,y1),(x2,y2),…,(xn,yn)}\left\{\left(x_{1}, y_{1}\right),\left(x_{2}, y_{2}\right), \ldots,\left(x_{n}, y_{n}\right)\right\}{(x1,y1),(x2,y2),…,(xn,yn)}，其...

2020-04-21 21:47:31 322

原创 Python爬虫初级（五）—— 中国大学排名定向爬虫

实例介绍我们准备从上海交大设计的最好大学网获得大学的排名，由下面链接打开就能直接看到中国最好大学的基本信息：http://www.zuihaodaxue.com/zuihaodaxuepaiming2016.html我们要写一段程序，从网上获得大学的排名，然后以此输出，具体的功能描述就是：输入：大学排名 URL 链接输出：大学排名信息的屏幕输出（排名，大学名称，总分）技术路线：...

2020-04-20 21:30:23 858

原创 Python爬虫初级（四）—— 信息组织与提取方法

信息标记的三种形式信息的标记：标记后的信息可形成信息组织结构，增加信息维度标记后的信息可用于通信、存储或展示标记的结构和信息一样具有重要价值标记后的信息更利于程序理解和运用国际公认的信息标记的三种形式分别是 XML、JSON、YAML，下面分别介绍这三者：XML 即 eXtensible Markup Language，采用了以标签为主来构建信息和表达信息的方式，比如：<...

2020-04-20 18:14:03 481

原创 Python爬虫初级（三）—— Beautiful Soup 库入门

beautiful soup 库的安装安装beautiful soup 库可以直接使用命令 pip install beautifulsoup4，安装完成之后可以通过演示 HTML 页面地址：http://python123.io/ws/demo.html 进行测试。我们打开这个网址，查询源代码，得到下面的结果：<html><head><title>This...

2020-04-20 10:52:21 397

原创 Python爬虫初级（二）—— Requests 网络爬虫实战

前面我们讲了网络爬虫常用库——Requests，具体可参见Python爬虫初级（一）—— Requests库入门，下面我们直接通过几个实例实现网络爬虫：实例一：京东商品页面的爬取首先我们打开京东页面选择商品：https://item.jd.com/100008348530.html，我们要做的事情是通过网络爬虫获取该商品的有关信息，该页面内容如下：下面我们对网页进行简单爬取测试：imp...

2020-04-19 23:05:36 1000

原创 Python爬虫初级（一）—— Requests 库入门

requests 模块的导入request 函数的导入可以直接使用 import requests 来实现，当然，若事先没有安装可以直接在命令行输入 pip install reqeusts 来进行安装。requests 模块中包含了七个主要的方法，下面将进行一一解析和尝试调用。requests.get() 函数requests.get() 函数是一个用于向服务器构造请求资源的 Reque...

2020-04-19 15:09:40 821 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除