weixin_40444270的博客

私信 关注
可大侠
码龄3年

真好

  • 249,163
    被访问量
  • 64
    原创文章
  • 41,002
    作者排名
  • 65
    粉丝数量
  • 于 2017-09-29 加入CSDN
获得成就
  • 获得53次点赞
  • 内容获得78次评论
  • 获得187次收藏
荣誉勋章
TA的专栏
  • 配置环境
    7篇
  • 数据分析笔记
    6篇
  • pytorch笔记
    3篇
  • 自然语言处理
    3篇
  • 机器学习
    3篇
  • 深度学习模型
    1篇
  • sklearn学习
    4篇
  • python基础知识
    1篇
  • 爬虫
    18篇
  • 数据库
    1篇
  • 小技巧
    9篇
  • 自动化
    1篇
  • 常用命令
    1篇
  • tensorflow
    1篇
  • win命令
    1篇
  • linux命令
    4篇
  • 最近
  • 文章
  • 资源
  • 问答
  • 课程
  • 帖子
  • 收藏
  • 关注/订阅

将文本格式转为kindle可用格式

前言这里的kindle是指kindle app,在上面看书,但是其对格式要求比较苛刻主要讲述将txt文件、epub文件转化为mobi格式文件txt转mobi首先下载软件,百度云链接在下,失效可以联系我提取码:58he1 打开软件效果如图所示2 举例按照正则表达式时要根据txt的内容来写规则,规则也非常简单,按照我的模板套就行这里每个章节的格式为:第x章,那么正则表达式就可以写为第.*?章这里.*?表示匹配尽可能少的内容这里举一个简单的案例epub转mobiepub文件转化为
原创
30阅读
0评论
0点赞
发布博客于 11 天前

python爬取B站视频2.0

参考文章爬取B站视频 - m4s文件的相关研究Python实现B站MP4格式音频与视频的合并!超详细的教程!环境win10+requests+chrome浏览器唠嗑初衷是为了下载B站微信8.0状态视频,B站是将视频和音频分开的,需要自己进行合并,方法就是Python实现B站MP4格式音频与视频的合并!超详细的教程!开始讲解之前第一次的B站爬取视频教学,当时视频格式是flv,可以直接请求下载这次视频格式换成了m4s这种片段,一个视频由许多的m4s小块组成,将所有的m4s小块拼接出来肯定就是完
原创
163阅读
1评论
1点赞
发布博客于 25 天前

Pycharm远程调试服务器程序

参考文章如何通过pycharm实现远程代码的调试和开发环境pycharm:专业版2020.1(对于社区版是否支持远程调试暂且不知)本机:win10服务器:centos,安装anaconda3远程调试的简单流程简单来说就是一个与服务器进行文件传送。先从服务器下载源程序,然后本地修改,然后再上传到服务器…开始准备第一步首先在本地创建一个文件夹来存放服务器上的代码D:/code/remote_service/pytorch_test点击file->settings,找到如图示所示的页
原创
18阅读
0评论
0点赞
发布博客于 1 月前

将win10修改全局字体为苹方字体

文章目录字体分享使用软件注册表修改获取字体名称效果展示字体分享百度云链接提取码:loyr若是失效的化可以私信我。使用软件noMeiryoUI使用这个软件,直接选择合适的字体,然后统一设定,这样其实只能修改系统上部分的字体为苹方字体,例如网页上的字体,注册表修改这种方式基本上可以实现全局修改,这个方法的原理就是"偷梁换柱",win中的字体默认是微软雅黑,通过注册表方式将其替换为苹方字体这是百度云分享的文件内容,我安装了多个,但是使用了三个使用win+R,输入regedit来打开注
原创
629阅读
2评论
0点赞
发布博客于 1 月前

Microsoft Edge、Chrome 常用快捷键(含MAC系统)

参考地址微软官网地址因为使用 Chromium 内核的新版Edge,所以快捷键和Chrome基本相同常用快捷键操作快捷键Crtl + D将此网页存储为书签Crtl+E在地址栏中打开搜索查询Crtl+F页面查找Crtl+G与页面查找相配合,匹配到下一项Crtl+Shift+G匹配上一项Crtl+H打开历史记录Crtl+J打开下载列表Crtl+L对地址栏URL进行编辑Crtl+M对当前标签页静音(页面播放视频或音乐时有
原创
92阅读
0评论
0点赞
发布博客于 2 月前

Visio常用快捷键

快捷键含义操作1. 复制按ctrl+拖动2. 水平/垂直复制按ctrl+shift+ 拖动(水平/垂直)3. 水平/垂直移动按shift+拖动4. 放大ctrl+滚轮5. 键拖动幕布ctrl+alt+鼠标右6. 水平滚动画布shift+滚轮7. 垂直滚动画布alt+滚轮8. 选择工具ctrl+19. 文字工具ctrl+210. 连接线ctrl+311. 图章工具crtl+shift+312. 铅笔工
原创
164阅读
0评论
1点赞
发布博客于 2 月前

VSCode常用快捷键

编辑器与窗口管理含义操作新建文件Ctrl+N文件之间切换Ctrl+Tab打开一个新的VS Code编辑器Ctrl+Shift+N关闭当前窗口Ctrl+W关闭当前的VS Code编辑器Ctrl+Shift+W切出一个新的编辑器窗口(最多3个)Ctrl+\切换左中右3个编辑器窗口的快捷键Ctrl+1 Ctrl+2 Ctrl+3代码编辑格式调整含义操作代码行向左或向右缩进Ctrl+[ 、 Ctrl+]
原创
22阅读
0评论
0点赞
发布博客于 2 月前

terminal采用公钥免密访问服务器

在使用ssh远程访问服务器一般都要输入密码,这次将此主机生成的公钥放入到服务器上,即可直接登录,无需输入密码,我这里是指使用terminal或者cmd等终端进行ssh登陆,并不是使用xshell6的登陆参考连接【GIT】git连接通过ssh连接githubWindowsTerminal内添加阿里云服务器(SSH)本机(win系统)本机生成rsa的私钥和公钥因为这个rsa准备也用于github,所有输入以下命令,然后一路enter就行Enter passphrase是设置密码用于保护私钥,你可
原创
68阅读
0评论
0点赞
发布博客于 2 月前

Ubuntu18.04配置Jupyter

这个教程主要是在一个全新的服务器上,从账号创建到配置环境,再安装anaconda,配置jupyter环境Ubuntu 18.041. 配置环境创建用户useradd -r -m -s /bin/bash docker参数说明:-r:建立系统账号-m:自动建立用户的登入目录-s:指定用户登入后所使用的shell设置密码passwd kedaxia将用户加入到sudoers中sudo vi /etc/sudoers2. 安装anaconda2.1下载anaconda从清华源
原创
42阅读
0评论
0点赞
发布博客于 2 月前

Pytorch的可视化工具tensorboardX

推荐直接看我写的两个链接,GitHub地址Pytorch使用tensorboardX可视化。超详细!!!Tensorboard的Github安装pip install tensorboardX示例建议直接将Github下载到本地,然后运行examples文件夹中的示例import torchimport torchvision.utils as vutilsimport numpy as npimport torchvision.models as modelsfrom torch
原创
18阅读
0评论
0点赞
发布博客于 2 月前

爬虫常用的浏览器请求头

USER_AGENTS = ['Mozilla/5.0 (Macintosh; U; Intel Mac OS X 10_6_8; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50', 'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50',
原创
329阅读
0评论
0点赞
发布博客于 3 月前

BERT模型原理的详细介绍

【NLP】Google BERT模型原理详解 - rumor的文章 - 知乎1. BERT模型BERT的全称是Bidirectional Encoder Representation from Transformers,即双向Transformer的Encoder,因为Decoder是不能获要预测的信息的。BERT = Encoder of Transformer模型的主要创新点都在pre-train方法上,即用了Masked LM和Next Sentence Prediction两种方法分别捕捉词
原创
422阅读
0评论
0点赞
发布博客于 3 月前

详解Transformer

Transformer中完全抛弃了传统的CNN和RNN,整个网络结果完全是由Attention机制组成。更准确地讲,Transformer由且仅由self-Attention和Feed Forward Neural Netword组成。一个基于Transformer的可训练的神经网络通过堆叠Transformer的形式进行搭建,作者的实验是通过搭建编码器和解码器各6层,总共12层的Encoder-Decoder,并在机器翻译中取得了BLEU值的新高。采用attention机制的原因RNN(或者LST
原创
332阅读
0评论
2点赞
发布博客于 3 月前

pytorch 方法笔记

torch.Tensor.scattersc官网地址pytorch中torch.Tensor.scatter用法scatter_(dim, index, src, reduce=None) → Tensor参数dim:维度,可以是0,1,2…,表示只在第dim维进行修改index:索引数组,tensor,数据类型为整数,表示位置src:原数组,reduce示例import torch >>>input = torch.randn(2, 4)>>&g
原创
247阅读
0评论
0点赞
发布博客于 3 月前

pytorch.max()的详细解释

网上大多数对max的解释只停留在二维数据,在三维及以上就没有详述,我将对二维数据和三维数据进行详细解释,让你不再有疑虑并没有总结具体意思,直接根据详细示例也就明白含义了参考文章torch.max()使用讲解torch.max(input, dim, keepdim=False, *, out=None) -> (Tensor, LongTensor)在分类问题中,通常使用max()函数对softmax函数的输出值进行操作,求出预测值索引参数input:softmax函数输出的一个t
原创
243阅读
0评论
0点赞
发布博客于 3 月前

centos7 配置anaconda及anaconda常用命令

参考文章CentOS7上安装anaconda3及其遇到的问题Linux系统Anaconda环境的安装/创建/激活/删除/管理安装anaconda下载包wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-4.3.0-Linux-x86_64.sh会将anaconda下载到当前路径,读者可以在希望的路径上运行此命令安装bash anaconda3.5.2.0-Linux-x86_64.sh遇到问题
原创
334阅读
0评论
0点赞
发布博客于 3 月前

Deep Learning中的Attention Mechanism介绍

文章目录参考文章Attention 机制的解析1. 为什么引入attention机制?2. Attention机制有哪些?3. Attention机制的计算流程是怎么样?4. Attention机制的变种有哪些?①. 硬性注意力②.键值对注意力③. 多头注意力5. 为什么自注意力模型(self-Attention model)在长距离序列中如此强大?卷积或循环神经网络难道不能处理长距离序列吗?自注意力模型(self-Attention model)计算过程6. Attention机制的应用参考文章目前主
原创
412阅读
0评论
0点赞
发布博客于 3 月前

pandas.DataFrame将行(index)和列(column)进行转置

原始数据data = [['AMB_TEMP', '14', '14', '14', '13', '12', '12', '12', '12', '15', '17', '20', '22', '22', '22', '22', '22', '21', '19', '17', '16', '15', '15', '15', '15'], ['CH4', '1.8', '1.8', '1.8', '1.8', '1.8', '1.8', '1.8', ...
原创
467阅读
0评论
0点赞
发布博客于 3 月前

基于二阶近似方法的优化算法

参考文章深度学习(花书)梯度下降法、牛顿法和拟牛顿法 - Eureka的文章 - 知乎梯度下降法与牛顿法比较 - 王多鱼的文章 - 知乎【最优化】无约束优化方法-牛顿法 - 忆臻的文章 - 知乎泰勒公式-百度百科二阶梯度方法使用二阶导数改进了优化,最广泛使用的时牛顿法牛顿法思想用目标函数的二阶泰勒展开近似该目标函数,通过求解这个二次函数的极小值来求解凸优化的搜索方向牛顿法的主要应用在两个方面:1.求方程的根;2. 最优化预备知识一元泰勒展开式此次使用一元泰勒展开式
原创
385阅读
1评论
0点赞
发布博客于 3 月前

netstat命令详解

命令是一个监控tcp/ip网络的工具,他可以显示路由器、世纪的网络连接以及每一个网络接口设备的状态信息netstat 【选项】-a或--all:显示所有连线中的Socket; -A<网络类型>或--<网络类型>:列出该网络类型连线中的相关地址; -c或--continuous:持续列出网络状态; -C或--cache:显示路由器配置的快取信息; -e或--extend:显示网络其他相关信息; -F或--fib:显示FIB; -g或--groups:显示多重广播功能群组
原创
217阅读
0评论
0点赞
发布博客于 3 月前

sklearn学习笔记之metrics

213
原创
382阅读
1评论
0点赞
发布博客于 3 月前

sklearn笔记之preprocessing

这个模块主要是对数据的预处理,例如标准化,中心化,scaling,二值化等官方文档介绍此模块的作用sklearn的中文文档StandardScaler官方地址sklearn.preprocessing.StandardScaler(*, copy=True, with_mean=True, with_std=True)对数据进行标准化z=x−μσz = \frac{x-\mu}{\sigma}z=σx−μ​参数with_mean:bool,default=True是否使用平均值,Fa
原创
885阅读
1评论
0点赞
发布博客于 3 月前

Word2Vec 与 Word Embedding的关系

文章目录0、参考文章一、 DeepNLP的核心二、 NLP词的表示方法类型1. One Hot Representation2、 Distributed Representation如何将语义融入到词表示中?如何利用上下文三、 NLP语言模型四、词的分布式表示1. 基于矩阵的分布表示2. 基于聚类的分布表示3. 基于神经网络的分布表示五、 词嵌入(Word Embedding)1、概念2、理解六、 神经网络语言模型与word2vec七、扩展知识0、参考文章秒懂词向量Word2vec的本质通俗理解wo
原创
385阅读
1评论
1点赞
发布博客于 3 月前

TF-IDF算法的介绍

文章目录1、TF-IDF算法介绍TF词频(Term Frequency)1、TF-IDF算法介绍    ~~~~     TF-IDF(term frequency-inverse document frequency,词频-逆向文件频率)是一种用于信息检索(infomation retrieval)与文本挖掘(test mining)的常用加权技术。    ~~~~ &n
原创
254阅读
0评论
1点赞
发布博客于 3 月前

机器学习之特征选择(feature_selection)

文章目录选取特征子集选择过程1. 子集搜索(subset search)2. 子集评价(subset evaluation)特征选择方法1. 过滤式(Filter)ReliefRelief-F2.包裹式(wrapper)LVM3.嵌入式(embedding)岭回归(ridge regression)LASSO选取特征子集当前存在的问题从初始的特征集合选取包含所有重要信息的特征子集,若没有任何领域知识作为先验假设,那只好遍历所有可能的子集,这实际上并不可行,会遇到组合爆炸,特证数稍多就不行可行
原创
286阅读
0评论
0点赞
发布博客于 3 月前

降维--PCA学习笔记

目录向量表示与基变换1.1 内积1.2 基1.3 基变换的矩阵表示参考文章https://www.zhihu.com/search?type=content&q=PCAPCA(Principal Component Analysis)是一种常见的数据分析方式,常用于高维数据的降维,可用于提取数据的主要特征分量。PCA 的数学推导可以从最大可分型和最近重构性两方面进行前者的优化条件为划分后方差最大,后者的优化条件为点到划分平面距离最小这里我将从最大可分性的角度进行证明。向量表示
原创
255阅读
0评论
0点赞
发布博客于 4 月前

pandas及numpy笔记

概述此博客将会持续更新,会将numpy、pandas、matplotlib等库进行函数解释,以及示例演示.这博客更像是一个笔记,让你在某些函数记不住的时候来查一下,而不是一本书一样,给你详细的讲解附上官方文档地址数据 所使用的数据集将从下列作为目标使用,可以用这些数据自己实验数据1.1[ ['青绿', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', '是'], ['乌黑', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', '是'],
原创
237阅读
0评论
0点赞
发布博客于 4 月前

sklearn学习笔记之feature_selection(特征选择)

sklearn中文链接:http://www.scikitlearn.com.cn/0.21.3/14/sklearn官网链接:https://scikit-learn.org/stable/modules/classes.html?highlight=feature_selection#module-sklearn.feature_selection本模块主要是对样本集进行feature_selection(特征选择)和dimensionality reduction(降温),这将会提高估计器的准确度
原创
309阅读
0评论
0点赞
发布博客于 4 月前

pandas.DataFrame对根据某些列对某些列进行修改

df.loc[((df.money< 95) | (df.money> 110)) & (df.type== '2'), 'total'] = 1- 判断条件无论大小一定要用括号括起来,不然会报错- 这样的方式是不正确的,只可以如上所示df.loc[((df.money< 95) | (df.money> 110)) & (df.type== '2')]['total'] = 1...
原创
579阅读
0评论
0点赞
发布博客于 4 月前

sklearn学习笔记之preprocessing

官方文档地址参考链接sklearn中文翻译地址:http://www.scikitlearn.com.cn/0.21.3/40/这个模块的主要内容是数据的预处理:scaling:缩放化normalization:标准化binarization 二值化centering:中心化APIBinarizersklearn.preprocessing.Binarizer(*, threshold=0.0, copy=True)作用:将数据进行二值化,若是特征值(feature value)
原创
226阅读
0评论
0点赞
发布博客于 4 月前

matplotlib,seaborn等画图工具

概述此博客将会持续更新,会将numpy、pandas、matplotlib等库进行函数解释,以及示例演示.这博客更像是一个笔记,让你在某些函数记不住的时候来查一下,而不是一本书一样,给你详细的讲解数据所使用的数据集将从下列作为目标使用,可以用这些数据自己实验数据1.1[ ['青绿', '蜷缩', '浊响', '清晰', '凹陷', '硬滑', '是'], ['乌黑', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑', '是'], ['乌黑', '
原创
271阅读
0评论
1点赞
发布博客于 4 月前

数据分析--异常值处理

原文链接:https://blog.csdn.net/qq_41080850/article/details/866958461 什么是异常值?模型通常是对整体样本数据结构的一种表达方式,这种表达方式通常抓住的是整体样本一般性的性质,而那些在这些性质上表现完全与整体样本不一致的点,我们就称其为异常点异常点在某些场景下极为重要,如疾病预测,通常健康人的身体指标在某些维度上是相似,如果一个人的身体指标出现了异常,那么他的身体情况在某些方面肯定发生了改变,当然这种改变并不一定是由疾病引起(通常被称为
原创
351阅读
0评论
0点赞
发布博客于 4 月前

VS Code 配置C/C++环境

本文在此基础上进行编辑https://www.cnblogs.com/lsgxeva/p/11115650.html前言这一篇博客配置的环境确实是最好用的,之前看过很多博客关于vs配置C环境,看的我晕头转向,但是这篇绝对让大家明明白白楼主环境:win10 64位,LLVM 10.0.0,MinGW-w64 是7.1环境准备下载最新版Visual Studio Code,链接根据自己系统版本选择相应版本下载LLVM,链接如上图所示,选择Pre-Built Binaries中的相应
原创
362阅读
0评论
2点赞
发布博客于 5 月前

python题目(1)

一、选择题1.Python语言属于( )。C A. 机器语言 B. 汇编语言 C.高级语言 D.科学计算语言2.下列选项中,不属于Python特点的是( )。B A.面向对象 B.运行效率高 C.可读性好 D.开源3.Python程序文件的扩展名是( )。D A..python ...
原创
1651阅读
1评论
1点赞
发布博客于 9 月前

python选择题.rar

1.对python基础知识的选择题,填空题,以及其他问题 2.选择题,填空题含有答案,其他可能没有答案,需要自行查阅 3.资源绝对良心
rar
发布资源于 9 月前

jupyter快捷键、markdown语法及markdown的算式语法

1. jupyter notebook的快捷键2.markdown的符号表示,会继续更新
原创
465阅读
0评论
2点赞
发布博客于 1 年前

四川大学874计算机综合资源

包含四川大学874学科的参考资源,例如数据结构,计算机网络,操作系统等教学课件,习题等中多资源,绝对超值,值的下载。
txt
发布资源于 2 年前

linux的ps命令

##PS 命令是什么查看它的man手册可以看到,ps命令能够给出当前系统中进程的快照。它能捕获系统在某一事件的进程状态。如果你想不断更新查看的这个状态,可以使用top命令。ps命令支持三种使用的语法格式UNIX 风格,选项可以组合在一起,并且选项前必须有“-”连字符BSD 风格,选项可以组合在一起,但是选项前不能有“-”连字符GNU 风格的长选项,选项前有两个“-”连字符我们能够混用这...
原创
2284阅读
1评论
1点赞
发布博客于 2 年前

linux的vi详细命令

讲述vi操作文件的几种命令退出保存命令:w 保存文件但不退出vi:w file 将修改另外保存到file中,不退出vi:w! 强制保存,不推出vi:wq 保存文件并退出vi:wq! 强制保存文件,并退出vi:q 不保存文件,退出vi:q!不保存文件,强制退出vi:e! 放弃所有修改,从上次保存文件开始再编辑##进入vi的命令vi filename :打开或新建文件,并将光标...
原创
2267阅读
1评论
1点赞
发布博客于 2 年前

linux主要的文件和目录的作用(详细版)

在 Linux 下,我们看到的是文件夹(目录): 在早期的 UNIX 系统中,各个厂家各自定义了自己的 UNIX 系统文件目录,比较混乱。Linux 面世不久后,对文件目录进行了标准化,于1994年对根文件目录做了统一的规范,推出 FHS ( Filesystem Hierarchy Standard ) 的 Linux 文件系统层次结构标准。FHS 标准规定了 Linux 根目录各文件夹的名...
原创
2833阅读
1评论
1点赞
发布博客于 2 年前

cmd命令大全

命令简介cmd是command的缩写.即命令行 。  虽然随着计算机产业的发展,Windows 操作系统的应用越来越广泛,DOS 面临着被淘汰的命运,但是因为它运行安全、稳定,有的用户还在使用,所以一般Windows 的各种版本都与其兼容,用户可以在Windows 系统下运行DOS,中文版Windows XP 中的命令提示符进一步提高了与DOS 下操作命令的兼容性,用户可以在命令提...
转载
2246阅读
0评论
0点赞
发布博客于 2 年前

selenium直接"刚"淘宝登录

     现在爬取淘宝商品必须要登录,不登录爬取商品的时候会自动重定向到登录页面,也看过许多人用selenium等自动化框架模拟登录淘宝,但是淘宝可以检测出你使用的是selenium,然后无论怎么滑块验证都失败。然后前几天看到使用pyppeteer这个异步登录淘宝,确实是可以躲过淘宝的检测,就是不是很熟悉,这个语法,导致我看不动例子,在这里问问大家,这个是什么意思,知道的评论下,谢谢。sli...
原创
7603阅读
7评论
1点赞
发布博客于 3 年前

python操作redis数据库

https://www.cnblogs.com/melonjiang/p/5342505.html
转载
2275阅读
1评论
0点赞
发布博客于 3 年前

爬取裁判文书网(一个很神奇的网站)

   昨天晚上爬取文书网,需要具体的文书内容,我就觉得去看看,发现这个文书网就是不简单,速度是真的慢,而且请求多次就返回502,刷新一次就卡的一批,而且他加密参数还不少,难度也相当的大......   JS加密的两个地方,首先他每个点击的连接都加密,简直丧心病狂,一般都是请求的AJAX进行加密,这个简直了。然后我就调试一下这个加密的函数,发现需要5,6个加密的JS文件,我就全都拷贝到本...
原创
18519阅读
14评论
1点赞
发布博客于 3 年前

神奇的反爬措施--大众点评

大众点评的店面详细信息比如地址,电话号码,评分等一系列的数字在f12下都找不到 只有1这个数字显示,其他的都被莫名其妙的标签占据。其实破解这个很简单,我开始以为是在页面源代码中显示(script标签内),发现并么有,只有地址是在页面内源代码显示;然后我觉得是请求ajax,就寻找新的请求里的看看是否返回了相应的信息,发现也没有;再然后我觉得是在js的加密,使...
原创
4127阅读
3评论
0点赞
发布博客于 3 年前

加速爬虫:异步加载asyncio

         之前就一直想学习asyncio,然后就去网上查,发现讲的花里胡哨而且异常难懂,就放弃了一段时间,今天来重新学习一下,发现了一个大佬的文章,根据例子来理解就容易多了,文章最后放上大佬的连接。             传统的单线程下载处理网页可能就像下图(来源)左边蓝色那样, 计算机执行一些代码, 然后等待下载网页, 下好以后, 再执行一些代码… 或者在等待的时候, 用另...
原创
2732阅读
1评论
0点赞
发布博客于 3 年前

爬虫的post提交表单

今天很难受,因为一个简单的post问题困扰了很久,就是post失败,在一些测试网站和火狐浏览器的编辑重发进行模拟都可以成功,我就知道应该是我提交的表单格式问题。在这里分享模拟表单请求的网站和方法。 1.测试网站http://coolaf.com/,这个网站还可以给你生成测试文档,以及其他的信息,非常详细 2.火狐浏览器的开发者模式,点击链接查看详情,...
原创
3875阅读
3评论
1点赞
发布博客于 3 年前

tensorflow reduction_indices理解

在tensorflow的使用中,经常会使用tf.reduce_mean,tf.reduce_sum等函数,在函数中,有一个reduction_indices参数,表示函数的处理维度,直接上图,一目了然:需要注意的一点,在很多的时候,我们看到别人的代码中并没有reduction_indices这个参数,此时该参数取默认值没有限制,将把input_tensor降到0维,也就是一个数。 ...
转载
2272阅读
0评论
0点赞
发布博客于 3 年前

anaconda各个版本下载资源

   最新版的水蟒不是很放心,就决定下载之前版本的水蟒的英文网址https://repo.anaconda.com/archive/    下载的时候注意是下载anaconda2还是anaconda3,下图是各个版本对应关系    清华镜像:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=N&amp;O=D     ...
原创
18926阅读
2评论
10点赞
发布博客于 3 年前

pip配置国内镜像

今天为了得到徽章就准备发篇原创博客, 这是在win平台下,其他平台的自行百度吧 win+r输入%APPDATA% 创建pip文件夹 进入文件夹内 创建pip.ini文件 内容为:[global]timeout = 6000index-url = http://pypi.douban.com/simple...
原创
2254阅读
1评论
0点赞
发布博客于 3 年前

Flask运行时Unicode编码错误

    前几天将自己的系统升级为企业版,抛弃了最垃圾的家庭版,闲着没事将电脑的主机名字给改成了中文名字,结果今天开始学习flask运行就报错,只需要将主机名改为英文就行了。。。。。。。。。。。。...
原创
3251阅读
1评论
1点赞
发布博客于 3 年前

python大战机器学习pdf

内容简介 · · · · · · 数据科学家是当下炙手可热的职业,机器学习则是他们的必备技能。机器学习在大数据分析中居于核心地位,在互联网、金融保险、制造业、零售业、医疗等产业领域发挥了越来越大的作用且日益受到关注。 Python 是最好最热门的编程语言之一,以简单易学、应用广泛、类库强大而著称,是实现机器学习算法的首选语言。 《Python大战机器学习:数据科学家的第一个小目标》以快速上手、四分理论六分实践为出发点,讲述机器学习的算法和Python 编程实践,采用“原理笔记精华+ 算法Python 实现+ 问题实例+ 代码实战+ 运行调参”的形式展开,理论与实践结合,算法原理与编程实战并重。 《Python大战机器学习:数据科学家的第一个小目标》从内容上分为13 章分4 篇展开:第一篇:机器学习基础篇(第1~6 章),讲述机器学习的基础算法,包括线性模型、决策树、贝叶斯分类、k 近... (展开全部) 作者简介 · · · · · · 华校专,计算机专业硕士。毕业后曾在部队从事专业相关工作,并研读了大量专业书籍在,从操作系统底层到应用APP开发,并且仿照 C++ STL 的风格实现了各种算法(算法导论的C++实现已经放在个人的github上),目前已从部队退役,并顺利拿到了阿里的算法工程师offer。 目录 · · · · · · 第一篇机器学习基础篇 1 第 1章线性模型 .................................................. 2 1.1概述 2 1.2算法笔记精华 2 1.2.1普通线性回归 2 1.2.2广义线性模型 5 1.2.3逻辑回归 5 1.2.4线性判别分析 7 1.3 Python实战 10 1.3.1线性回归模型 11 1.3.2线性回归模型的正则化 12 1.3.3逻辑回归 22 1.3.4线性判别分析 26 第 2章决策树 .................................................... 30 2.1概述 30 2.2算法笔记精华 30 2.1决策树原理 30 2.2构建决策树的 3个步骤 31 CART算法 37 2.4连续值和缺失值的处理 42 2.3 Python实战 43 2.3.1回归决策树(DecisionTreeRegressor) 43 2.3.2分类决策树(DecisionTreeClassifir) 49 2.3.3决策图 54 第 3章贝叶斯分类器.............................................. 55 3.1概述 55 3.2 算法笔记精华55 3.2.1 贝叶斯定理55 3.2.2 朴素贝叶斯法56 3.3 Python 实战59 3.3.1 高斯贝叶斯分类器(GaussianNB) 61 3.3.2 多项式贝叶斯分类器(MultinomialNB) 62 3.3.3 伯努利贝叶斯分类器(BernoulliNB) 65 3.3.4 递增式学习partial_fit 方法69 第4 章k 近邻法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 4.1 概述70 4.2 算法笔记精华70 4.2.1 kNN 三要素70 4.2.2 k 近邻算法72 4.2.3 kd 树73 4.3 Python 实践74 第5 章数据降维. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 5.1 概述83 5.2 算法笔记精华83 5.2.1 维度灾难与降维83 5.2.2 主成分分析(PCA) 84 5.2.3 SVD 降维91 5.2.4 核化线性(KPCA)降维91 5.2.5 流形学习降维93 5.2.6 多维缩放(MDS)降维93 5.2.7 等度量映射(Isomap)降维96 5.2.8 局部线性嵌入(LLE) 97 5.3 Python 实战99 5.4 小结118 第6 章聚类和EM 算法. . . . . . . . . . . . .
txt
发布资源于 3 年前

爬虫实战项目

  转载Python 爬虫进公司必会项目
原创
2429阅读
0评论
0点赞
发布博客于 3 年前

数据分析需要的数据集

       详情看这里https://blog.csdn.net/linqianbi/article/details/78626130,这些数据的网站在http://dataju.cn/Dataju/web/home这里下载,github上https://github.com/awesomedata/awesome-public-datasets,这些的数据集需要翻墙下载。...
原创
2882阅读
0评论
0点赞
发布博客于 3 年前

利用mitmproxy进行抓包

  这几天在利用mitmdump抓取手机app包的时候,一直连接不上去,非常坑,首先我是在window平台,只能使用mitmdump,当时找主机的ip的时候,没有找到我主机的ip。后来才知道怎么找到,然后找到正确的主机ip之后,要将防火墙关闭,并在手机上配置相应的信息。     1.寻找正确的ip        打开控制面板:              (1)直接点击图标打开(普通程序...
原创
5044阅读
2评论
0点赞
发布博客于 3 年前

爬取qq音乐

今天早上闲着没事,看看qq音乐的评论爬取,当然我也没有具体的爬取哪些内容,只是分析了他的请求网址。 我总结出爬取网页信息的几个方式。首先直接查看网页源代码,查看网页源代码是否有你想要的信息,如果有的话直接请求网页然后解析就行了,这是最简单的方式。不过大多数的网站都是异步加载,这时候就需要使用谷歌或者火狐浏览器的开发者模式(f12),查看请求,然后找到相应的请求网址,这样的请...
原创
4448阅读
0评论
0点赞
发布博客于 3 年前

git命令的使用(1)

    开始学习使用git命令     在centos7.3的环境,git的安装就不多说。     首先创建一个文件夹,用作实验的文件夹     创建文件夹:mkdir learngitcd learngit进入文件夹git init 命令,将当前文件夹初始化为一个git库这时候输入命令 ll -a,发现多处这个文件这是.git文件的内容:具体是...
原创
2230阅读
0评论
0点赞
发布博客于 3 年前

跟着老齐学Django

第1章 简单的博客系统 1 1.1 Django起步 1 1.1.1 Django简介 1 1.1.2 安装Django 3 1.1.3 创建项目 4 1.1.4 创建应用 6 1.1.5 网站配置 11 1.1.6 知识点 12 1.2 编写博客的数据模型类 12 1.2.1 数据模型类 13 1.2.2 发布博客文章 17 1.2.3 知识点 21 1.3 显示博客信息 23 1.3.1 显示文章标题 24 1.3.2 查看文章内容 28 1.3.3 知识点 32 第2章 用户管理 35 2.1 自定义模板和静态文件位置 35 2.1.1 自定义模板位置 36 2.1.2 自定义静态文件位置 36 2.1.3 通用静态文件和基础模板 37 2.1.4 重置管理后台模板 40 2.1.5 知识点 42 2.2 用户登录 43 2.2.1 创建应用 44 2.2.2 理解表单类 45 2.2.3 登录的视图函数 47 2.2.4 登录的前端界面 49 2.2.5 知识点 53 2.3 用内置方法实现登录和退出 54 2.3.1 内置的登录方法 55 2.3.2 判断用户是否登录 58 2.3.3 内置的退出方法 59 2.3.4 知识点 60 2.4 用户注册 62 2.4.1 简单注册 62 2.4.2 增加注册内容 65 2.4.3 管理新增的注册内容 70 2.4.4 知识点 71 2.5 关于密码的操作 72 2.5.1 修改密码 73 2.5.2 重置密码 78 2.5.3 利用第三方应用重置密码 84 2.5.4 知识点 87 2.6 维护个人信息 88 2.6.1 个人信息的数据模型类和表单类 88 2.6.2 展示个人信息 90 2.6.3 编辑个人信息 93 2.6.4 上传和裁剪头像图片 97 2.6.5 优化头像上传功能 105 2.6.6 对个人信息进行管理 107 2.6.7 知识点 108 第3章 文章管理和展示 110 3.1 管理文章栏目 110 3.1.1 设置栏目 110 3.1.2 编辑栏目 118 3.1.3 删除栏目 120 3.1.4 知识点 122 3.2 发布和显示文章 125 3.2.1 简单的文章发布 126 3.2.2 使用Markdown 131 3.2.3 文章标题列表 133 3.2.4 知识点 140 3.3 删除和修改文章 141 3.3.1 删除 142 3.3.2 修改 143 3.3.3 设置分页功能 147 3.3.4 知识点 149 3.4 文章展示 151 3.4.1 新写文章标题列表 151 3.4.2 重新编写“查看文章”功能 155 3.4.3 知识点 156 第4章 拓展网站功能 158 4.1 梳理已有功能 158 4.1.1 修改导航栏 158 4.1.2 修改登录和注册后的跳转 159 4.1.3 知识点 161 4.2 查看作者全部文章 161 4.2.1 查看某作者的文章列表 162 4.2.2 知识点 165 4.3 为文章点赞 167 4.3.1 修改数据模型类 167 4.3.2 编写视图函数 168 4.3.3 修改模板文件 169 4.3.4 知识点 172 4.4 文章的阅读次数 173 4.4.1 安装Redis 174 4.4.2 在Python中使用Redis 175 4.4.3 记录阅读次数 176 4.4.4 显示最“热”文章 177 4.4.5 知识点 179 4.5 文章的评论功能 180 4.5.1 数据模型类和表单类 180 4.5.2 实现评论功能 181 4.5.3 知识点 184 4.6 多样化显示 185 4.6.1 统计文章总数 186 4.6.2 最新发布的文章 188 4.6.3 评论最多的文章 189 4.6.4 自定义模板选择器 192 4.6.5 知识点 193 4.7 管理和应用文章标签 195 4.7.1 管理文章标签 195 4.7.2 发布文章时选择标签 200 4.7.3 在文章中显示文章标签 202 4.7.4 推荐相似文章 202 4.7.5 知识点 204 第5章 收集和展示图片 206 5.1 收集网络图片 206 5.1.1 创建图片相关类 207 5.1.2 收集和管理图片 210 5.1.3 完善图片管理功能 214 5.1.4 知识点 218 5.2 展示图片 219 5.2.1 瀑布流方式展示图片 219 5.2.2 查看图片的详细信息 223 5.2.3 知识点 224 第6章 中场休整 226 第7章 创建在线学习应用 227 7.1 基于类的视图 227 7.1.1 最简类视图 228 7.1.2 读取数据 230 7.1.3 初步了解Mixin 232 7.1.4 知识点 233 7.2 管理课程标题 234 7.2.1 判断用户是否登录 235 7.2.2 创建课程 237 7.2.3 删除课程 239 7.2.4 知识点 243 7.3 发布和学习课程内容 245 7.3.1 课程内容的数据模型 246 7.3.2 课程内容的表单类 249 7.3.3 课程内容的视图 250 7.3.4 查看课程内容 252 7.3.5 注册学习课程 257 7.3.6 知识点 260 第8章 结束和开始 262
txt
发布资源于 3 年前

在pycharm运行正常,在命令行窗口出现引包错误

     这个问题很常见,想知道详细原因,见这个https://my.oschina.net/leejun2005/blog/109679,我只是说一下简单的解决方法。     简单的解决方法:                     在出现错误的那个py文件,找到需要引入的包错误的工程路径,然后sys.path.append(相应的路径)   例如:我在2包中调用1包中的fi...
原创
4947阅读
2评论
2点赞
发布博客于 3 年前

appnium连接夜神模拟器

     本来想使用安卓的原生模拟器,结果一直出问题,真的麻烦,就决定使用夜神模拟器了    将安卓模拟器与appnium进行连接:     https://blog.csdn.net/jixiangrurui/article/details/79140756      https://www.cnblogs.com/my-blogs-for-everone/p/7751596.htm...
原创
4151阅读
0评论
1点赞
发布博客于 3 年前

使用fiddler抓取安卓模拟器包

               如图1所示,先设置好提琴手              配置路径:               工具 - &gt; Fiddler选项 - &gt; HTTPS - &gt;三个选项全部勾选                如下图所示:             重启软件    2配置模拟器 长按WLAN信号,点击修改网络    点击显示...
原创
22341阅读
3评论
2点赞
发布博客于 3 年前

爬取优酷的短视频,部分电影

     今天上午爬b站,下午头条,晚上优酷,头条的视频和优酷爬取差不多,都是在播放页面中给出连接,只需要获取到那个连接就行,根据下午爬取头条的经验,我们直接上selenium来爬取             他尽然要进行登录才可以,那就开始模拟登录,点击右上角头像,出现这个登录框,基础的操作不多说了,登录成功保存cookie,这样下次模拟登录就不用这样输入密码账号了,我在模拟登录的时候,不...
原创
7781阅读
3评论
0点赞
发布博客于 3 年前

爬取今日头条短视频

   这几天闲来无事,想爬取视频,上午爬取b站(很简单),下午爬取头条上的小视频,爬取还是比较麻烦的,我是通过selenium获取的网页源代码,因为requests没有get到,而且selenium直接获取通过ajax加载的信息,但就是非常的慢,而且必须使用有头浏览器进行get链接,我在尝试使用无头浏览器时,发现他不能获取链接的代码,所以直接使用selenium获取源代码,虽然慢,但是好用。 ...
原创
7279阅读
0评论
2点赞
发布博客于 3 年前

爬取b站排行视频

      这个b站之前一直想爬,看了几篇关于这个的博客,发现好难,今天耐不住就找了比较新的一篇博客讲述爬取b站视频。本来以为还要破解js加密获取加密参数,发现并没有这么复杂,视频下载的连接都在网页里保存,ε=(´ο`*)))唉。话不多说开始搞起。       所需环境:pycharm+python3.6+requests+re+pyquery+fiddler (re是提取网页里面下载的连...
原创
6879阅读
2评论
1点赞
发布博客于 3 年前

python进行数据可视化时,中文是方块显示

默认是不可以显示中文,会将一个中文用两个框框替代。写上这个代码就可以from pylab import mplmpl.rcParams['font.sans-serif'] = ['SimHei']就可以了。
原创
6106阅读
0评论
4点赞
发布博客于 3 年前

fiddler实现将http请求的js转为本地的js文件

首先你要下载fiddler,下载地址自己百度,一些配置百度一下。 右边那栏的autoresponse,底下两个输入框分别是http请求的和你本地的,点击save之后,清除浏览器数据,然后刷新网页,再次寻找js网页就发现是你本地的js文件,这时候你就可以为所欲为了,得到自己想要的参数。window.console,info(参数),显示的信息是在console里面 ...
原创
3907阅读
0评论
0点赞
发布博客于 3 年前

python爬取今日头条新闻,js解密

       这几天一直在研究js解密的问题,学会了不少新东西,以前见到那些加密的参数基本直接放弃,现在也可以琢磨一会进行尝试一番。我先分享一下心得,首先找到参数是在哪个js文件里面加密的,然后看看都调用了那些函数,我们自己尝试调用这些函数,我一般采用两种方式,这两种方式一般也都结合在一起。首先将js文件下载到本地,然后打开webStorm(IDE,其他jetbrains公司产品基本上都可以支持j...
原创
6949阅读
10评论
2点赞
发布博客于 3 年前

python爬取网易云音乐评论

    js加密的数据爬取一直都是非常困难的,本来水平就不咋地,决定爬取网易云音乐的评论进行练习。花费了半天功夫才弄好,真的太难了,幸亏有大佬的参考https://www.zhihu.com/question/36081767/answer/386606315,不然根本不可能完成。这篇文章主要是将个解密的思想,当然每个步骤我都会详细说明,从分析api到爬取代码。学习到思路才是最重要的。    ...
原创
3903阅读
3评论
0点赞
发布博客于 3 年前

python中安装包出现Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))…………

https://blog.csdn.net/qq_25964837/article/details/80295041
原创
11360阅读
0评论
0点赞
发布博客于 3 年前

大数据相关技术学习视频

一共四十多天课程,详细教学,从基础进行授课。大小修改日期 08.文件常用操作命令.avi 450.9M2018-07-20 10:45 05.vmware虚拟网络的配置介绍.avi 252.8M2018-07-20 10:45 01.基础部分课程介绍.avi 187.6M2018-07-20 10:45 06.linux网络配置及CRT远程连接.avi 140.8M2018-07-20 10:45 02.linux系统安装过程.avi 471M2018-07-20 10:45 03.linux图形界面及文件系统结构介绍.avi 143.3M2018-07-20 10:45 07.回顾上午的ip地址配置.avi 63.7M2018-07-20 10:45 11.ssh免密登陆配置.avi 133M2018-07-20 10:45 10.常用系统操作命令.avi 352.3M2018-07-20 10:45 09.文件权限的操作.avi 214.2M2018-07-20 10:45 04.局域网工作机制和网络地址配置.avi 315M2018-07-20 10:45
txt
发布资源于 3 年前

hadoop段海涛老师八天实战视频

第一天 hadoop的基本概念 伪分布式hadoop集群安装 hdfs mapreduce 演示 01-hadoop职位需求状况.avi 02-hadoop课程安排.avi 03-hadoop应用场景.avi 04-hadoop对海量数据处理的解决思路.avi 05-hadoop版本选择和伪分布式安装.avi 06-hadoop版本选择和伪分布式安装2.avi 07-hdfs&mapreduce;测试.avi 08-hdfs的实现机制初始.avi 09-hdfs的shell操作.avi 10-hadoop集群搭建的无密登陆配置.avi
txt
发布资源于 3 年前

redis在window下的启动

进入安装redis的文件夹,输入redis-server.exe redis.windows.conf,启动服务这样代表启动成功。若是无法成功,可以试试以下几个步骤第一条指令:redis-cli.exe,第二条指令:shutdown第三条指令:exit再重新输入第一条语句,就好了...
原创
2421阅读
0评论
0点赞
发布博客于 3 年前

关于selenium获取cookie然后实现免登陆

    这几天一直想搞明白cookie的爬虫使用,结果从昨天晚上开始试验,selenium获取的cookie怎么也无法实现直接登录,气的想打人。在刚才终于发现一些问题,在和浏览器中的cookie对比发现格式不一样,然后对着他进行格式改变,结果终于成功了,现在以一个模拟登录扣扣空间的例子:这是模拟点击登录扣扣空间我请求的这个网址是在分析的时候发现的,发现登录二维码是在一个这样的页面里,这...
原创
52679阅读
9评论
10点赞
发布博客于 3 年前

计算机视觉:一种现代方法

《计算机视觉:一种现代方法》是近年较为成功的一本计算机视觉教材,内容涉及几何摄像机模型、光照与着色、彩色、线性滤波器、局部图像特性、纹理、立体视觉、从运动求取结构、聚类分割、组合与模型拟合、跟踪、配准、平滑曲面及其轮廓、距离数据、分类、图像分类、图像目标检测、目标识别专题、基于图像的建模与渲染、图像中人的研究、图像搜索与检索、优化技术等。全书条理清楚,系统性强,且各章相对独立;此外,全书理论联系实际,并纳入了近年来该领域的最新研究成果
docx
发布资源于 3 年前