ZJ_Frank
码龄5年
关注
提问 私信
  • 博客:58,086
    58,086
    总访问量
  • 63
    原创
  • 1,076,310
    排名
  • 9
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:德国
  • 加入CSDN时间: 2019-12-23
博客简介:

ZJ_11701的博客

查看详细资料
个人成就
  • 获得19次点赞
  • 内容获得4次评论
  • 获得73次收藏
  • 代码片获得834次分享
创作历程
  • 15篇
    2021年
  • 47篇
    2020年
  • 2篇
    2019年
成就勋章
TA的专栏
  • Measure Theory
    4篇
  • 数据结构与算法
    28篇
  • 其他
    4篇
  • 语法拾遗
    6篇
  • 力扣题解
    2篇
  • 爬虫
    5篇
  • python科学计算库
    1篇
  • git
    1篇
  • 随机过程
    1篇
兴趣领域 设置
  • 数据结构与算法
    排序算法推荐算法
  • 人工智能
    scikit-learn
创作活动更多

如何做好一份技术文档?

无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

182人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Measure Theory (4): Caratheodory theorem

In last lecture, we have shown we have a unique way of extending μ\muμ, σ\sigmaσ-additive defined in a semi-algebra S\mathscr{S}S to ν
uν, σ\sigmaσ-additive defined in an algebra A(S)\mathcal{A}(\mathscr{S})A(S), algebra generated by S\mathscr{S}SIn this
原创
发布博客 2021.08.04 ·
376 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

小于n的质数数量 --- 埃氏筛 (Eratosthenes)

问题给定一个整数 n,请你找到小于等于它的所有质数数目。下面给出几种不同复杂度的解法,难度依次递增。最出彩的是第三种该算法,由希腊数学家厄拉多塞(Eratosthenes)提出,称为厄拉多塞筛法,简称埃氏筛,可以在接近线性时间内解决问题。Brutal Force O(n2)O(n^2)O(n2)def primeNumbers(n): cnt = 0 for i in range(1, n+1): if isPrime(i): cnt += 1 return cnt def is
原创
发布博客 2021.08.02 ·
386 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Dijkstra algorithm - implemented using priority_queue

经典图论算法。用于计算两点之间的最短距离。也可以用于计算某一点 (source)到其他所有点的最短距离。伪代码Dijstra (graph, n, src) initialize dist := [...inf...] with dist[src] = 0 initialize priority queue pq; add (0, src) to pq while pq is not emtpy u = pq.top()[1] pq.pop() for neighbor, wei
原创
发布博客 2021.08.02 ·
311 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Fisher-Yates Shuffle Algorithm

今天我们介绍一种 Shuffle算法,它保证了对数组shuffle后,任何一个元素出现在数组中任何一个位置的概率是相等的。并且这个算法复杂度为 O(n)算法以及实现对于一个需要 Shuffle的数组 A,其长度为 n。假设我们有这样的一个函数 rand(0, n),它可以均匀地生成 [0,…,n]之间的随机整数。Fisher-Yates Shuffle Algorithm 这样给出解决方案:Let k = n-1, (A is 0-indexed)start from node k, swa
原创
发布博客 2021.07.28 ·
282 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

Measure Theory (3): set functions

Definitionsμ:C→R+∪{∞}\mu:\mathcal{C}\to\mathbb{R}_+\cup\{\infty\}μ:C→R+​∪{∞}DEFμ\muμ is continuous from below at E if ∀{Ei}i≥1,Ei∈C,En↑E\forall \{E_i\}_{i\ge1},E_i \in\mathcal{C}, E_n\uparrow E∀{Ei​}i≥1​,Ei​∈C,En​↑E andμ(En)→μ(E)\mu(E_n)\to\mu(E)μ(En​
原创
发布博客 2021.07.27 ·
143 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Measure Theory (2): semi-algebra, algebra, sigma-algebra

DefinitionsIn this post, we define the semi-algebra, algebra, sigma-algebra.Semi-algebraConsider Ω\OmegaΩ as the whole set (for example, Ω=R\Omega=\mathbb{R}Ω=R),S(Ω)\mathcal{S}(\Omega)S(Ω) is the collection of subset of Ω\OmegaΩDEF Semi-algebra S\ma
原创
发布博客 2021.07.25 ·
645 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Measure Theory (1): Why measure theory? The motivation

这个专栏计划开坑更完 Measure Theory by Claudio Landim的 Lecture Notes。此为第一个视频的笔记。用一个反例阐述了学习测度论的必要性。引入首先考虑这样一个问题:我们如何测量 R\mathbb{R}R的子集的长度?直观地,如果这个子集为 (a,b](a, b](a,b],那么用 b−ab-ab−a来定义这个区间的长度似乎是一个非常合理的想法。进一步的,我们对这个「测量函数」有如下的期待:这个函数的值域应该大于等于0特别地,对于区间 (a,b](a, b](
原创
发布博客 2021.07.23 ·
376 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

谈谈quick Sort: 两种实现方法(额外空间与 in-place)

快排是一个很经典的排序算法了,虽然它的 worst case 复杂度是 O(n2)O(n^2)O(n2),但是一般而言它的平均复杂度为O(nlog⁡n)O(n\log n)O(nlogn),并且在实际中常常是最快的排序算法。而它可以有两种版本可以实现:额外空间开销或者原地算法。一般我们提到的快排都是原地算法,而其实现难度也更高。In Placedef inPlaceQuickSort(nums, start, end): if end - start <= 1: return p = p
原创
发布博客 2021.05.30 ·
871 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

两个均匀分布的随机变量求和的分布

给定两个独立分布的随机变量 X, Y ~ uniform(0,1)求 Z = X+Y的分布先说结论:Z 取值范围在0到2之间,它的 cdf为:F(Z≤t)=t22,0≤t≤1F(Z\le t) = \frac{t^2}{2}, 0\le t\le 1F(Z≤t)=2t2​,0≤t≤1F(Z≤t)=−t22+2t−1,1≤t≤2F(Z\le t) = -\frac{t^2}{2}+2t-1, 1\le t\le 2F(Z≤t)=−2t2​+2t−1,1≤t≤2Derivation我们在学习知识
原创
发布博客 2021.05.30 ·
18660 阅读 ·
4 点赞 ·
2 评论 ·
12 收藏

[面经]快手搜索部门算法实习生二面

继续攒人品…二面的面试官人也蛮nice的,让我先介绍一下简历上的项目。然后我扯了一个深度学习balabala然后他兴趣就来了(哈哈哈哈哈哈),揪着我问了一堆相关问题:过拟合啦,sigmoid 函数啦,back propagation啦,erro rate vs training number啦…之后就说咱们来写个题吧。问的是,求一颗二叉树的最后一层节点数之和。我就说了遍历两次的思路,他说能不能只遍历一次?我想了想说可能需要额外空间,然后写了写,过了。(看起来手撕代码是非常常见的操作。这里手撕应该是A
原创
发布博客 2021.03.25 ·
739 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

[面经]快手搜索部门算法实习生一面

写写面筋攒攒人品~一面总体来说比较简单,首先是问简历上的项目经历/实习经历究竟做了什么,问得比较详细,并拓展问了很多问题。(比如在谈到深度学习的时候,问了很多深度学习的相关概念,比如为什么叫深度学习,与传统机器学习方法的区别,如何判断是否过拟合,过拟合有哪些解决方法)。总之是以吹水为主,面试官也比较温柔。然后就是喜闻乐见的手撕代码了,面试官问了两个链表问题,第一个是删除倒数第n个节点,这个题可能考点就是怎么做到一次遍历就能搞完。第二个是反转链表,大家应该都会做。反正写代码的时候不要闷头写,先把自己的思路
原创
发布博客 2021.03.24 ·
898 阅读 ·
1 点赞 ·
1 评论 ·
1 收藏

找到某年某月的第四个星期三

背景:etf50期权的交割日期为到期月的第四个星期三。calendar是一个很有用的包,话不多说直接上代码。import calendarc = calendar.Calendar(firstweekday=calendar.SUNDAY)year = 2020; month = 2monthcal = c.monthdatescalendar(year,month)fourth_wednesday = [day for week in monthcal for day in week i
原创
发布博客 2021.03.16 ·
536 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

ML(1) Linear Regression

IntroductionLinear regression is perhaps the most fundamental algorithm in machine learning. In this setting, given a dataset D={(xi,yi)∣xi∈Rn,yi∈R}i=1mD=\{(x^i,y^i)|x^i\in \mathbb{R}^n, y^i\in\mathbb{R} \}_{i=1}^mD={(xi,yi)∣xi∈Rn,yi∈R}i=1m​ (x is featur
原创
发布博客 2021.03.02 ·
180 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

PyMongo Tutorial

https://cloud.tencent.com/developer/article/1005552?from=article.detail.1151814https://cloud.tencent.com/developer/article/1151814
转载
发布博客 2021.02.05 ·
99 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

摩尔投票法

问题描述给定一个长度为n的数组,请找出其中出现次数大于 n/2的元素(假设一定存在)解决这个问题本身并不困难,大不了建个字典就行。麻烦的是如何在一次遍历、使用O(1)空间解决?这就引出了摩尔投票法。摩尔投票法伪代码如下:Given A of length n;function findMajorElement(A: array of length n): int cnt = 0, major = -1; for i in A: if cnt == 0: major = i
原创
发布博客 2021.01.14 ·
137 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Selenium 突破网站反爬虫

今天在使用 Selenium以及谷歌浏览器进行爬虫的时候被拦截了。在查阅资料后得出解决方法如下:方法一换用火狐浏览器from selenium import webdriverurl = "SOME URL YOU WANT TO SCRAPE"user_agent = "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/12.0.3 Safari/605
原创
发布博客 2020.11.24 ·
1758 阅读 ·
1 点赞 ·
0 评论 ·
21 收藏

Python 爬取新浪财经 7x24(1): 下载数据

前言最近在做一个需要很多财经数据的项目。于是想到可不可以通过爬虫来解决(尝试白嫖)。提供财经数据的网站有很多个,其中比较靠谱和更新比较及时的应该是新浪7x24 live数据。http://finance.sina.com.cn/7x24/?tag=0这个问题有一定的难度,因为这个网页是动态加载的。每一次只会加载部分数据,而只有拉到底部才可以加载新的数据。于是乎,我们要做的事情是:下载数据保存到数据库本篇介绍如何下载数据。代码闲言少叙书归正文,代码的实现如下:import reque
原创
发布博客 2020.11.20 ·
2172 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

Python 汉字转拼音

在这里分享一个很有用的包:pypinyin安装pip3 install pypinyin 或者使用镜像网站安装https://blog.csdn.net/ZJ_11701/article/details/109378174使用import pypinyin# 默认给出比较详细的注音In[14]: pypinyin.pinyin("我可真能耐")Out[14]: [['wǒ'], ['kě'], ['zhēn'], ['néng'], ['nài']]# 如果不想加音标,声明即可In[
原创
发布博客 2020.11.18 ·
154 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

bs4:按类别和按class获取信息

在BeautifulSoup的官方文档中,给出了 find和 find_all两种 method,如果按类别获取信息,有如下语法:soup.find_all('a') # 获取所有形如 <a> ... </a>的信息如果我们想要按class得到呢?比如某一个信息在 div容器里面,它所对应的 class是 listBlk。例如<div class="listBlk"> <!-- 分页 begin --> <table cell
原创
发布博客 2020.11.16 ·
3725 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

python 使用 requests爬取网站出现格式错误的解决方案

编码的历史这里就不再赘述,直接上解决方案:res = requests.get(url)res.encoding = res.apparent_encoding
原创
发布博客 2020.11.16 ·
451 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏
加载更多