自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(77)
  • 资源 (9)
  • 收藏
  • 关注

原创 python实践入门课程作业答案与答疑

第一天课程作业答案python与sublime的安装使用pip从豆瓣源安装第三方模块使用you-get命令下载B站周杰伦专题常见疑问MAC如何运行you-get程序命令行和解释器的区别...

2020-03-25 09:17:40 13739 18

原创 python初学者学习路线整理

python基础知识目录第一部分 基础篇1. 1基本概念变量的值和类型表达式和语句函数的使用1.2.重要数据类型字符串列表元组集合1.3 基本程序结构顺序分支循环1.4 面向对象的编程类和对象类和函数类和方法继承1.5 文件操作第二部分 项目篇2.1 入门级小项目2.2 python数据分析numpy基础pandas之Series...

2020-03-07 22:48:58 1435

原创 统计托福高频词汇

punc_list = [',','.','\n','?','\'','\"','(',')',':']with open('./tofel100.txt',encoding='utf-8') as f: p = f.readlines() all_words = [] for s in p: for punc in punc_list: s = s.replace(punc,'...

2020-03-31 23:19:48 288

原创 计算pi的其他方法

方法一:HPI = 1for i in range(1,10000): HPI *= (4*i*i)/(2*i-1)/(2*i+1) PI = 2*HPI print(PI,end = '\r',flush=True)方法二:import mathSPIS = 0for i in range(1,10000000): SPIS += 1/(i*i) PI = math....

2020-03-31 16:05:06 370

原创 程序员提问的流程图

程序员不仅要学会百度,更要懂得提问,以下这个流程图很好的描述了程序猿在编程过程中遇到问题并且尝试解决问题的方法,分享给大家,大家也可以点击链接查看原文了解更多关于程序猿提问方法和艺术的细节。...

2020-03-31 12:52:25 682

原创 机器学习第五周笔记(神经网络)

神经元模型M-P神经元模型简单的说,神经元就是存放数据的一个存储单元过程关键词:输入、权重、阈值、激活函数激活函数理想的激活函数是阶跃函数,但是数学特性不理想(在(0,1)点,不连续、不光滑、不可导),所以我们经常使用sigmoid函数来作为激活函数。感知机和多层网络感知机简单的感知机模型:由多个神经元组成,包含输入与输出层。感知机的学习能力有限,仅在线性可分问题上收敛,可...

2020-03-31 12:41:13 1710

原创 使用for循环计算圆周率

圆周率计算公式如下:我们可以观察以上公式,并且根据规律使用if语句和for循环进行计算。fourth_pi = 0iter_times = 1000000for i in range(1,iter_times): if i%2: fourth_pi += 1/(2*i-1) else: fourth_pi -= 1/(2*i-1)prin...

2020-03-26 23:15:16 6834 8

原创 运行课程的代码的两种方式

方法一:在sublime中直接运行快捷键:Ctrl+B(也可以在Tools中找到Buid按钮点击运行)方法二:在命令提示符中运行步骤一:打开命令行、切换到.py文件所在的目录步骤二:输入python 文件名.py 运行...

2020-03-26 17:34:41 350

原创 windows下打开命令提示符的方式

方法一:先按快捷键“Win+R”,然后在弹出的运行输入框中输入“cmd”,回车或者确定就可以了。方法二:直接在搜索框中输入cmd,然后选择命令提示符即可。如下图:方法三:资源管理器中你想打开的路径下上方的输入框中输入cmd即可,如下图:最终,我们可以得到命令提示符界面如下:...

2020-03-26 14:08:54 1698 3

原创 操作系统的绝对路径和相对路径

如果把OS的文件管理系统比喻成一张大地图,那么每个文件、文件夹都有一个自己的地址,我们把这个地址成为路径(path),我们要去找某个文件的时候,往往需要根据路径去找,不然就会“迷路”,我们可以使用两种方法来指定路径:一、绝对路径以wendows为例,我们可以在资源管理器的输入框中方便的找到绝对路径,如下图:以下字符串,就是这个文件夹的绝对路径(相当于我们生活中把地址写完整:中国-浙江-杭州...

2020-03-26 11:35:11 2753

原创 sublime高亮问题

有同学反映sublime中代码没有高亮,这是因为没有保存为.py文件,这样sublime就没法识别这是python的程序,就没法根据python的语法进行高亮显示,解决的方法其实很简答,保存(快捷键Ctrl+S),然后文件名命名为xxx.py即可,注意不要保存在中文路径下。保存前截图:保存后截图:...

2020-03-25 18:29:13 1128

原创 如何找到you-get可以使用的B站视频url

B站近期对url进行了改版,所以原来直接可以使用的浏览器窗口url不能直接使用you-get进行下载了,但是我们依然可以使用开发者工具来找到能用的(available)url。方法如下:一、使用Chrome浏览器进入你希望下载的视频页面。二、在chrome浏览器中使用快捷键(Ctrl+Shift+I)进入开发者模式。三、在右侧的Element选项卡中找到视频列表的带av编号的url。...

2020-03-25 10:48:10 8848 1

原创 用you-get下载JayChou专辑

- 第一步 找到B站中周杰伦专辑的av编号url:https://www.bilibili.com/video/av1415480 - 第二步 导入os模块为后续向操作系统发指令做准备 - 第三步 通过os.system()方法向操作系统发出you-get指令。注意you-get命令的格式。system函数的参数是一个字符串,我们可以使用变量来的方法来存储这个字符串,也可以通过字符串拼接的方...

2020-03-25 09:14:21 838 5

原创 命令行和解释器的区别

命令行是用户和操作系统交互输入命令的地方(如windows的cmd和mac的终端),使用的是操作系统的指令;解释器是用户和python交互的地方,使用的是python语言。我们在命令行中输入python之后会出现(>>>),这个时候,我们就进入了python解释器了。我们可以理解为命令行是一个大城市(操作系统即OS),在这个城市中我们使用普通话(命令行指令)进行交流,而解释...

2020-03-25 09:11:36 1382

原创 mac电脑用python下载B站视频教程

1.打开终端(terminal)2.在终端中输入以下指令(注意使用pip3):pip3 install you-get3.用sublime新建文件(command键+N),输入以下代码:import oscommand = 'you-get --playlist -o ./jaychou https://www.bilibili.com/video/av1415480'os.syst...

2020-03-24 22:20:47 965 1

原创 机器学习第四周笔记(决策树)

决策树决策树模型树结构:根节点、叶节点内部节点:对应属性上的测试(相当于分支结构判定器)叶节点:对应一个预测结果(相当于结论)分支:对应测试的某种可能结果(即属性的取值)策略:分而治之、划分属性递归返回:同一类别、无法划分、样本为空基本算法:感觉就像是一系列if else语句的嵌套划分选择信息熵:度量样本纯度的一种指标;节点的信息熵可以通过公式计算;信息增益:通过信息熵...

2020-03-24 14:15:27 180

原创 西瓜书机器学习笔记(第三课):线性模型

线性模型的基本形式向量表现形式:y=w’x+b目标:求均方误差最小的w和b线性回归线性回归问题的闭合解线性回归的矩阵表示对数几率回归将线性模型稍作变化: ln(y) = w’t+b如果我们把ln函数抽象为一种广义的函数(联系函数g()),就可以得到广义线性模型:g(y)=w’t+b寻找单调可微分的函数来实现二分类任务,这样可以使得计算结果从0和1的离散跳跃问题编程连续的...

2020-03-24 09:51:36 265

原创 jupyter notebook的安装和启动以及启动路径的修改

在学习深度学习的时候,经常会用到jupyter notebook来运行python代码,jupyter和sublime类似,也是一个编辑器,只不过它内嵌在浏览器中,使用起来会比较方便。下面讲一下jupyter notebook的安装和使用。1.安装类似于其他的python模块,在cmd中输入pip安装指令即可安装jupyter notebook:pip install jupyter_con...

2020-03-23 23:03:22 310

原创 python基础知识验证哥德巴赫猜想

哥德巴赫猜想:任何大于2的偶数都能够写成两个质数相加的形式。验证思路:编写哥德巴赫分解程序,输入一个数,输出他的两个子质数,如果找不到,返回False。遍历整数,查看是否有False的情况,如果有False的情况,我们认为哥德巴赫猜想不成立,如果没有False,我们认为歌德巴赫猜想是不能证伪的。第一步:质数的判定:我们可编写函数通过if语句和for循环来判断一个数是否为质数def i...

2020-03-21 15:24:34 28153 1

原创 用python打印九九乘法表

考察知识点:1.for循环的使用;2.range函数的使用;3.print函数的使用;4.字符串的使用;代码:for i in range(1,10) : for j in range(i,10): print(i,' ',j,'得',i*j,end='\t;') print('')运行结果:...

2020-03-21 14:09:34 992

原创 用python自动生成.docx格式的邀请信提高10倍以上办公效率

完成这个任务,我们需要有以下预备工作:1.安装python-docx库2.了解docx的doc/paragraph/run层次模型3.字符串的处理方法4.使用内置模块调用当前日期并且转换成字符串from docx import Documentfrom docx.shared import Pt, RGBColor #字体大小和颜色from docx.enum.text import...

2020-03-18 15:41:31 704

原创 土法筛选出世界城市表中符合英文缩写要求的城市

我们可以从互联网上下载到世界城市数据库,然后通过规则设计从其中筛选出符合要求的城市名字,并且存储在表格中。代码如下:import pandas as pdimport rechr1 = '[Oo]'df_data = pd.read_csv('worldcities.csv')empty_df = pd.DataFrame({'city_ascii':'','country':'','i...

2020-03-16 21:51:32 355

原创 pyperclip模块将字符串拷贝到剪贴板中(相当于是用python进行了Ctrl+C操作)

今天优化了一波OCR工具,发现其实不需要把ocr识别的文字放入到文件中,再去复制粘贴,只需要直接把文字放入到windows操作系统的clipboard(也就是我们常说的剪贴板中),就相当于用python执行了Ctrl+C命令,我们在使用的时候,是需要使用Ctrl+V就是粘贴这段文字了。这需要一个名为pyperclip的库来提供服务,我们使用以下命令可以安装该模块:pip install pyp...

2020-03-16 12:19:19 1137 3

原创 sublime快捷键设置:将ctrl+D快捷键设置为为删除一行

参考这篇:sublime text3 中能不能设置ctrl+D删除一行,要怎么设置具体步骤如下:1.打开sublime ,依次点击菜单栏的Preferences->Key Bindings2.会弹出按键设定的窗口,这时候左边就是sublime的默认按键设置,格式是json的,然后右边的空数组就是你的用户自定义配置3.在右边的[]里粘贴如下内容{ “keys”: [“ctrl+d”...

2020-03-15 23:16:27 1191

原创 28行python代码做出截图文字识别OCR小工具方便做网课笔记

最近上网课,很多老师都不共享PPT,自己打字的速度又跟不上老师说话的速度,所以导致记笔记记不下来。于是想到了用python做一个辅助工具。做这个工具主要需要以下预备工作:1.安装截图软件snipaste;2.通过keyboard模块调用snipaste的快捷键:f1截图和Ctrl+C保存;3.通过百度AipOCR调用百度OCR接口(需要在百度官网申请并且获得APP_ID/API_KEY/SE...

2020-03-15 18:32:12 910

原创 用python求解考研数学真题

考研数学中会涉及到很多微积分的题目。微积分是高等数学最重要的概念,对于这么重要的数学工具,python肯定不会错过。我们不难找到,在sympy这个python数学计算模块中,存在Derivative和Integral两个方法,可以用来计算微分和积分,我们可以使用Symbol方法来定义代数式中的符号。以下,我选择了两道真题来进行演示:一、求高阶导数from sympy import Deriv...

2020-03-15 11:53:23 649

原创 最简单的量化交易:以05-07年中国大牛市为例分析

在python分析股票MACD指标一文中,我介绍了如何使用python画出股市中的均线图。均线图的意义在于提供了除了指数之外的另外一种曲线,两条曲线的交点可以用来进行决策的判断条件。比如我们可以设定5日均线(sma5)向上穿越20日均线(sma20)时刻为买入点(bpoint),向下穿越为卖出点(spoint),这样就可以使用程序来进行交易了。以下,我们读取了2007年大牛市时期青岛啤酒这只股票的...

2020-03-13 19:13:32 783

原创 python分析股票MACD指标

股民朋友肯定熟悉股票中的MACD指标,比如5日均线、10日均线、15日均线等等。通过这些指标可以辅助进行交易的决策(比如经典的金叉、死叉理论),下面就以5日均线和20日均线为例,用python来画出指标曲线。在coding之前,我们需要做好以下准备工作:1.使用ts.pro_daily()接口获得沪深个股历史行情2.安装matplotlib模块,并会使用它画图。pip install mat...

2020-03-13 13:33:54 2657

原创 如何使用ts.pro_daily()接口获得沪深个股历史行情

为了完成标题任务,我们需要首先做好以下准备工作:1.安装tushare2.安装pandas3.从tushare官网获得token信息(登录后在个人主页可以找到)之后,我们就可以使用以下python代码来完成标题任务。import tushare as tsimport pandas as pdpro = ts.pro_api()ts.set_token('XXXXXX') #第一次...

2020-03-13 09:05:58 5154

原创 梯度更新方式

批量梯度下降优化目标:误差平方梯度更新:θn=θo-ηδ随机梯度下降和批量梯度下降相比,不需要对每个数据求梯度计算做平均对比批量梯度下降:更快地更新参数,但是在学习中不定性或震荡小批量梯度下降算法思想:批量梯度下降和随机梯度下降的结合,批量梯度下降优秀的稳定性和随机梯度下降的快速更新小批量梯度下降很容易做并行化,通过不同的线程去执行然后加和这些梯度基本搜索步骤随机...

2020-03-11 19:49:31 1260

原创 机器学习中的判别模式和生成模式

判别模型对可观测变量和未知变量的关联性建模又称条件模型确定性判别(显性函数)vs随机判别(概率分布)直接建模预测标签与已知对象之间的关系易于定义特定依赖的特征和模型实际上产生更高的预测性能线性回归、逻辑回归、k邻近、支持向量机、多层感知机、决策树、随机森林#生成模型(高级版的概率论)建立数据的联合概率分布给定一些隐参数和隐变量进行条...

2020-03-11 19:13:19 302

原创 机器学习的数学基础:概率论篇

和机器学习相关的数学知识域统计学:概率论、统计推断、验证、误差估计、置信区间线性代数:降维技术、数据线性变换的紧凑表示最优化理论概率空间输出集合Ω可能事件E的集合F概率分布P概率论公理概率非负所有概率相加为1不想交事件可加离散概率空间(抛硬币)连续投掷3枚硬币,有8中可能的结果可能的结果有258种组合(事件E)连续概率空间(老美的身高)有无数种取值...

2020-03-11 17:16:51 423

原创 西瓜书机器学习笔记(第一课):绪论

发展历程诞生的标志:达特茅斯会议,1956年,麦卡锡、明斯基、香农、西蒙、纽厄尔等;机器模仿人类表现其他方面的智能。第一阶段:推理期(Logic Reasoning)1956-1960s,西蒙、纽厄尔的逻辑理论家、通用问题求解;第二阶段:知识期(Knowledge Engineering)1970s-1980s,费根鲍姆的专家系统;第三阶段:学习期(Machine Learning)19...

2020-03-11 10:48:08 206

原创 4个numpy知识点实现K折验证数据集划分

K折数据集验证是机器学习中的一个常用的方法,原理简单的说就是把一个大的数据集切成k个小部分,然后每次迭代使用其中的1个小部分作为测试集,这样可以实现一个数据集的多次使用,解决机器学习中的样本问题。在sklearn这个库中,已经封装好了cross_val_score这个库可以直接调用。不过我们我们需要自力更生,采用numpy(简称np)来实现对数据集的k折划分。实现这个功能需要的知识点如下:使用...

2020-03-11 08:54:45 559

原创 对PR图的理解

在学习分类问题的性能度量中,提出了查准率P和查全率R两个概念,可以根据模型结果测算出P值和R值绘制PR曲线,那么PR曲线是怎么绘制出来的呢?首先我们要理解分类结果混淆矩阵如下:其中T=True表示真,F=False表示假,P=Positive表示正例,N=Negative表示反例。这样就可以定义查准率P=TP/TP+FP(准确性)和查全率R=TP/TP+FN(完整性)了。查全率和查准率也是此...

2020-03-10 13:17:09 7011

原创 西瓜书机器学习笔记(第二课):模型选择与评估

模型选择与评估经验误差与过拟合经验误差vs泛化误差本质上就是训练集上的误差vs“未来”样本上的误差;经验误差并非越小越好,因为会出现过拟合过拟合与欠拟合通俗理解,欠拟合就是太粗了(把不符合要求的也放进来了),比如把树叶识别成了大树;而过拟合是太细了(要求太苛刻了把符合要求的也淘汰了),比如误以为有锯齿的树叶才是树叶,而误杀了没有锯齿的树叶。评估方法评估方法:关键在于如...

2020-03-10 12:02:33 236

原创 局域网的妙用:艰难实现两台电脑键的文件传输(文件共享)

今天遇到了一个囧事,就是想把我原来win7电脑中的文件拷贝到win10中,结果发现我的优盘坏了。情急之下我眉头一皱计上心来,发现他们两台机子都连接这同一个局域网,所以理论上可以通过网上邻居的方式来相互访问。然而事情并没有那么简单,我按照网上的教程进行一通操作猛如虎之后,突然发现我win10的电脑没有访问权限,非常的沮丧。最后通过各种百度之后终于找到了原因:win10家庭版不支持入域功能(翻译成人...

2020-03-09 21:55:09 229

原创 python与sublime的安装

在新的计算机上安装python和sublime的注意事项安装3.6.5就够了,新版本暂时没有必要用到,高手进阶可以去官网下载最新版本(https://www.python.org/);在安装python的时候务必点选 add to path按钮,如果不选的话要手动到环境变量里面去添加;安装后在命令行中运行python --version,可以看到安装python的版本;sublime的升...

2020-03-09 10:46:21 1233 10

原创 python的分支结构

分支结构是程序需要进行决策决定走向的语句,一定程度上体现了程序的智能型,和C语言等常规语言一样,python提供了if/else/elif等语句来实现程序的分支结构。我们来分类看一下各种分支结构。一、单分支结构1.1 基本语句结构if <条件> : <执行语句块>1.2 示例代码input_number = 12if input_number%2 == 0...

2020-03-08 11:13:46 2627

原创 python的while循环和for循环

循环结构是编程的三大结构之一。python和其他语言一样,提供了非常多的关键字来支持for循环和while循环。下面整理一下:1.while循环1.1 while循环的基本格式while循环的基本格式如下: while 条件表达式 : 条件满足,执行循环语句;不满足,则退出循环1.2.while循环示例程序count = 0while (count<9): print(...

2020-03-08 10:39:54 494

surnames.csv

中文名字取名中常用的姓氏用字,从中随机抽取可以完成网络游戏中的取名问题,其实中国的汉字也就几千个,取名的数量在2-4范围之内,所以中文名字其实是从一个有限集合中选取文字组合而成的,完全可以通过程序设计的方式从有限集中随机选择。

2020-07-03

girlsnames.csv

中文名字取名中常用的女名用字,从中随机抽取可以完成网络游戏中的取名问题,其实中国的汉字也就几千个,取名的数量在2-4范围之内,所以中文名字其实是从一个有限集合中选取文字组合而成的,完全可以通过程序设计的方式从有限集中随机选择。

2020-07-03

boysnames.csv

中文名字取名中常用的男名用字,从中随机抽取可以完成网络游戏中的取名问题,其实中国的汉字也就几千个,取名的数量在2-4范围之内,所以中文名字其实是从一个有限集合中选取文字组合而成的,完全可以通过程序设计的方式从有限集中随机选择。

2020-07-03

Calculus and Applications.zip

计算机通信、人工智能、机器学习等技术中的数学基础,包括极限、微分、积分、微分方程等基本概念、运算及其应用。

2020-05-15

worldcities.csv

里面包含了世界上1万多个主要城市的基本信息,包括城市名、所在国家、所在区域、是否为首府、人口数、经纬度等等。

2020-03-16

vivid_alphabet.csv

存储了a-z26个字母代表的形象意义,为了后续背单词做准备,比如cata,在我这里就可以拆成c+a+t+a,意思是:the Cyan Ant of the Tired Anthony,这样一下子就记住了字母的组合。

2020-02-14

rating.txt

douban上10000本书的得分,包括“评分人id”、“书本id”、“评分”三个数字,数据量高达597万,所以说是比较难的用来练习海量数据的数据库。

2020-02-09

ChineseColorTable.csv

用python从jason格式中提取了中国颜色名称及其数据信息,用于网页制作前端设计的配色和颜色调和。

2020-01-10

colors.json

用于此代码的json源文件,内含中文颜色名称、CMYK、RGB、hex、name、hex等值,一共包含500多种颜色

2019-12-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除