- 博客(44)
- 收藏
- 关注
原创 感知机模型的初步理解(参考统计学习方法)
超平面: 方程表达:a1x1+a2x2+…………+anxn = bL2范数:其定义为向量所有元素的平方和的开方感知机模型是二分类的线性分类模型,其思想是找出一个超平面将两类别很好的区分开 1)感知机模型:f(x) = sign(wx + b) 其中sign(x)为符号函数,当x>=0时,y=1;当x<0时,y=-1; 2)感知机是一种线性分类模型,它的假设空间是满足条件的所有线性分类模型,即满足条件的超平面的集合 (一个线性可分的数据集可以有多种超平面的划分方式) 线性方程wx+b=0 对应
2020-07-03 21:51:11 635
原创 插入排序
直接插入排序类似整理扑克牌的过程,将之后待排序的关键字插入到之前已经排序完成的序列中特点:边插入边排序,保证子序列随时都是排好序的 def InsertSort(array): length = len(array) for i in range(1, length): j = i - 1 x = array[i] # 为方便循环条件,可以采用哨兵位 while (..
2020-07-02 20:16:45 173
原创 查找
顺序查找:从头开始查找到尾端python中的实现def order_search(array,x): i = 0 while(i<len(array)): if array[i] == x: break else: i += 1 if (i<len(array)): return i els..
2020-07-01 22:42:37 289
原创 逻辑斯蒂回归、朴素贝叶斯
逻辑斯蒂回归逻辑斯蒂分布(增长分布):F(X) = P(X<=x) = 1/(1+e^(-(X-u)/γ))该分布曲线以(u,1/2)作为中心对称点sigmod函数(亦称作Logistic函数)作用:将一个实数映射到(0,1)区间函数表达:s(X) = 1/(1+e^(-x)); 性质:当X趋近正无穷时,取值为1;当X趋近于负无穷时,取值为0;sigmod函数被用作激活函数:什么是激活函数?使用激活函数将非线性的特性引入到网络模型中;二项逻辑斯蒂回归思想:用线性回..
2020-07-01 13:54:18 327
原创 随机森林、GBDT的简单理解
集成思想boosting:通过使用将弱学习器提升为强学习器的方法来提高预测的精度(不断地拟合残差)它的下一个学习器需要依赖上一个学习器学习结束而产生残差;(而bagging的学习器之间是相互独立的)bagging:通过boostraping自助采样的方式生成众多的学习器,最后以投票(少数服从多数)确定类别这里的随机采样可以通俗理解为有放回采样,在bagging算法中,一般会随机采集和训练集样本数相同的数量,但是由于是有放回的数据采样,采样的集合和训练集数量相同但是内容不同;由于是有放..
2020-06-30 19:41:26 287
原创 KNN、决策树的初步认识
分类:K近邻分类器(KNN)算法思想:通过计算待分类点和已知类别数据点间的距离,选取距离最小的前k个值,根据少数服从多数的原则,将待分类点纳入到点出现最多的那个类别中去;算法分类器封装在sklearn.neighbors.KNeighborsClassifier中其中参数设置:n_neighbors:用于指定分类器中k的大小,与K_means算法不同,k-means中指定的是最后聚类结果中簇的个数,而KNN中的k表示的是选取之间距离最小的前k个点,依据少数服从多数的原则来进行分类;wei..
2020-06-29 16:03:14 319
原创 三种梯度下降方式
梯度梯度是一个向量,表示函数在该点处沿着该方向变化最快、变化率最大;在微积分中对多元函数的各个参数求偏导所形成的向量,即梯度向量;沿着梯度向量的方向增长,能寻找其最大值;沿着负梯度方向可以寻找其最小值;梯度下降、梯度上升最小化损失函数,我们可以通过梯度下降算法来进行迭代;反之可以利用梯度上升来计算f(θ) - loss_func 来求解最优参数梯度下降算法可以参考下山过程,考虑下山最快的、最陡的路径note:可能在一段山路中走到了较低点,但并非是全局最低点,这时候可以考虑多初始..
2020-06-28 22:59:51 353
原创 验证码识别
验证码识别(分类问题)首先利用PIL中的画布、画笔等工具制作出验证码图片获取随机RGB格式的颜色值 (xxx,xxx,xxx)获取验证码数字,该数字需要存储为label,该逻辑回归为有监督的学习使用Image创建画布、ImageDraw创建画笔note: 其中可以使用ImageFont实例化字体对象,但是需要将字体文件存储到虚拟环境的Script文件夹中在绘制验证码时需要绘制噪点和斜线,来模拟生产环境中的验证码识别验证码识别步骤首先将RGB图片转化为灰度图,它的每个像素用
2020-06-06 18:17:06 259
原创 Flask项目流程(四)
Flask项目流程(四)个人中心的设置用户名和电话的修改# forms.pyclass EditProfile(FlaskForm): username = StringField('用户名', validators=[DataRequired(message='请输入用户名'), Length(0, 10, message='用户名不能超过10位')]) phone = Stri
2020-05-21 21:24:00 163
原创 flask项目流程(三)
flask项目流程(三)任务模块的编写url_for传递参数方式{{ url_for('task.status',code=1) }}报错:RuntimeError: No application found. Either work inside a view function or push an application context. See http://flask-sqlalchemy.pocoo.org/contexts/.尽量不要再表单中执行数据库模型操作,将该操作转移至
2020-05-21 21:23:30 273
原创 flask项目流程(二)
flask项目流程(二)用户认证模块auth的实现首先需要创建蓝图及其应用注册三步骤创建蓝图运用蓝图注册蓝图创建蓝图# app\auth\__init__.pyfrom .models import dbfrom flask import Blueprintauth = Blueprint('auth', __name__)# 切记需要将视图函数导入,不然无法找到from . import views运用蓝图# app\auth\views.py
2020-05-21 21:22:50 145
原创 flask项目流程(一)
flask项目流程(一)搭建整体项目架构编辑配置文件# 配置的官方文档https://flask-sqlalchemy.palletsprojects.com/en/2.x/config/# config.pyimport osBASEDIR = os.path.dirname(__file__)print(BASEDIR)class Config(object): # 配置SECRET_KEY,其本质是一个加密盐,设计表单等敏感数据时需要设置 SECRE
2020-05-21 21:22:21 386
原创 支付宝沙箱的使用
支付宝沙箱的使用网址https://opendocs.alipay.com/open/200/105311支付宝会用SHA256withRsa算法进行接口调用时的验签(不限制密钥长度)。使用支付宝密钥生成器或OpenSSL(第三方工具)生成密钥Linux中使用第三方工具生成密钥OpenSSL> genrsa -out app_private_key.pem 2048 #...
2020-04-29 21:44:06 554
原创 Django电商平台
Django电商平台数据库设计用户数据库模型设计class UserProfile(AbstractUser): # 继承Django原先的用户基类 ''' Username and password are required. Other fields are optional. ''' gender_choice = [ ...
2020-04-29 21:43:15 544
原创 scrapyd和spiderkeeper实现scarpy项目的可视化操作
scrapy可视化管理工具scrapyd什么是scrapyd?Scrapyd是一个服务,用来运行scrapy爬虫的它允许你部署你的scrapy项目以及通过HTTP JSON的方式控制你的爬虫scrapyd官方文档https://scrapyd.readthedocs.io/en/stable/安装scrapyd服务$ pip install scrapyd如...
2020-04-22 16:14:17 286
原创 scrapy框架的简单理解
scrapy框架的简单应用什么是scrapy?Scrapy是适用于Python的一个快速、高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。scrapy的基本框架Scrapy Engine(引擎):负责Spider、ItemPipeline、Downloader、Scheduler中间的...
2020-04-22 15:08:22 380
原创 elasticsearch的安装
elasticsearch的安装首先需要安装JDKOracle安装JDK11及以上版本解压缩tar文件$ tar -xvzf 压缩文件路径配置JDK# vim /etc/profileexport JAVA_HOME="JDK解压的路径"export PATH="$JAVA_HOME/bin:$PATH"export CLASSPATH=".:$JAVA_HOM...
2020-04-22 12:14:00 153
原创 Xadmin后台配合MdEditoer编辑器
xadmin的使用安装xadmin$ pip install https://codeload.github.com/sshwsfc/xadmin/zip/django2github地址https://github.com/sshwsfc/xadmin/tree/django2注册到配置文件中INSTALLED_APPS = [ # 记得放在原来admin的前面...
2020-04-22 12:12:31 219
原创 python 多线程
python 多任务编程单核CPU 其在实现多任务时候,实质上是CPU交替执行多个任务A、B、C等,由于CPU执行速度较快,表象为多个任务同时进行。 宏观上是同时执行,微观上仍是顺序执行并发 并发,在操作系统中,是指一个时间段中有几个程序都处于已启动运行到运行完毕之间,且这几个程序都是在同一个处理机上运行,但任一个时刻点上只有一个程序在处理机上运行。在操作系统中是指,...
2020-04-21 08:01:02 140
原创 Django个人博客项目整理
Django框架安装Django$ pip install Django==2.2 执行manage.py可以看见创建子app的命令$ python manage.py startapp blog将创建的子app注册到配置文件中# settings.pyINSTALLED_APPS = [ 'django.contrib.admin', # …………...
2020-04-20 23:45:27 496
原创 SQLAlchemy与mysql连接
SQLAlchemy与mysql连接设置并且数据库引擎engine = create_engine("mysql+pymysql://数据库用户名:数据库密码@ip地址:3306/数据库名")创建缓存类Session = sessionmaker(bind=engine)# 实例化缓存类session = Session()声明映射# SQLAlchemy在中首先...
2020-04-19 09:43:57 295
原创 爬虫
爬虫频繁更换User-Agent# pip install fake_useragent # 使用其中UserAgent模块useragent = UserAgent()response = requests.get(url,headers={'User-Agent':useragent.random})使用IP代理proxies = { 'http': 'http:...
2020-04-19 09:27:54 769
原创 Django知识点
Django知识点整理HTTP常见的请求方式GET方法 用于使用给定的URI从给定服务器中检索信息,即从指定资源中请求数据。使用GET方法的请求应该只是检索数据,检索的数据在url上可见,并且不对数据产生其他影响。get请求是可以缓存的,且请求的长度有限制。注:因GET请求的不安全性,在处理敏感数据时,绝不可以使用GET请求。POST方法 该方法用于将数据发送到服务器以创建或更...
2020-03-30 13:12:27 149
原创 个人博客系统
创建Django项目创建完毕后,以新框口打开,项目结构中会出现manage.py该文件是为项目添加命令行操作; $ python manage.py查看命令操作 [auth] createsuperuser [django] makemigrations migrate shell startapp startproj...
2020-03-05 14:12:01 229
原创 Flask和数据库连接
flask-sqlalchemy的配置文件配置的时候常见的数据库URL在app.py中导入配置文件,并生成db数据库连接定义数据表对象,继承db.Model即首先定义模型定义模型需要注意模型列类型和模型列属性创建数据库表然后并进行增删改查操作,(记得session中的数据提交了才会起作用)在查询或其他操作的时候的过滤器数据库关系一对一...
2020-02-25 12:38:39 410
原创 Flask入门
Flask什么?Flask是一个轻量级Web框架,就是提供一个工具,库和技术来允许你构建一个Web应用程序.这个Web应用程序,可以是一些Web页面,博客, wiki ,基于 Web 的日历应用或商业网站简单使用若每次要固定路由,麻烦,我们采用动态路由;(用变量表示)url中带有参数...
2020-02-23 12:13:17 110
原创 微博Jquery案例
keyup事件:当对象框中输入内容时触发当需要隐藏一些对象时,为其添加或者移除属性disabled;html() 方法设置或返回被选元素的内容(innerHTML)当里面布不传入参数时,获取对象的html代码,当传入参数时,覆写对象的html代码val() 方法返回或设置被选元素的 value 属性(用法同上)发布的思路:将之前的代码块copy一份,其中需要修改的变...
2020-02-18 11:09:59 225
原创 JS
简单的数据用户登陆校验note:定义变量的时记得var声明校验案例优化图片切换案例复选框的全选和全不选动态添加城市省市二级联动电影排行榜...
2020-02-16 10:43:34 87
原创 CSS
CSSCSS 指层叠样式表 (Cascading Style Sheets)定义如何显示控制 HTML 元素,从而实现美化HTML网页。为了让网页元素的样式更加丰富,也为了让网页的内容和样式能拆分开,html只负责文档的结构和内容,表现形式完全交给CSS,html文档变得更加简洁。基本语法在头部head中声明CSS选择器,并且选择相应的选择器和样式CSS页面引用方式内联式:...
2020-02-14 18:41:46 128
原创 HTML
HTML超文本标记语言HTML基本结构note:页头的内容不会显示在浏览器中,一般包含编码格式等;HTML标签note:标题有6个等级,再往上不生效,即普通文本文字类型;...
2020-02-14 08:52:14 85
原创 基于Celery、Redis和Flower的异步邮件报警与监控
Celery(芹菜)是一个Python编写的异步任务队列/基于分布式消息传递的作业队列。用于处理数以百万计的任务。三大组件: 消息中间件 (Broker),任务执行单元(Worker)和 任务执行结果存储(Backend)Flower是基于web的 监控 和管理Celery的实时监控工具。Redis(Remote Dictionary Server)远程字典数据服务的缩写,由意大利人开...
2020-02-12 17:05:13 481
原创 网络编程
网络编程实际是进程间的通信TCP/IP 协议 (协议族)计算机都遵守的⽹络通信协议即TCP/IP 协议IP: Internet ProtocolICMP:网络层协议ip地址:⽤来标记地点的,在本地 局域⽹上是惟⼀的网络地址主机地址(私有ip)子网掩码:将某个IP地址划分成⽹络地址和主机地址两部分. ⼦⽹掩码的设定 必须遵循⼀定的规则, 用来判断两个IP是否在同一个...
2020-02-12 15:11:02 124
原创 多任务编程
1)多任务编程例如同时听歌和聊天;多任务即操作系统能同时运行多个任务。单核CPU实现多任务:实质上是多项任务交替执行,分别分配一些执行时间,逻辑上表现为并发执行,但物理上仍然是串行执行;多核CPU:真正的多任务并发执行,即多任务同时执行;但是任务数多于CPU数时,操作系统会把多任务轮流分配给CPU执行;单核实质上是并行,多核才能真正实现并发;2)多进程编程进程和程序的区别?完整...
2020-02-11 12:06:50 113
原创 python数据库编程及ORM
通过pymysql来连接数据库并操作这里需要commit来提交修改等危险性操作,也可以在建立连接的时候设置autocommit选项;上述代码中见出现问题的时候会导致最后关闭连接出现问题?我们可以采用with语句,因为有两个魔术方法,是一个上下文管理器;...
2020-02-09 20:17:52 155
原创 redis数据库
1. redis简介NoSQL,全名为Not Only SQL,指的是非关系型的数据库Redis是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API并提供多种语言的 API的非关系型数据库。redis的应用方面:缓存 排行榜 统计播放人数,在线量 消息队列 Session服务器等redis不太适合数据量较...
2020-02-08 15:14:53 116
原创 关系型数据库MySQL
1)为什么需要用到数据库?面对海量的数据,数据库系统能够持久化存储,优化读写,保证数据的有效性;(持久化存储简单说可以理解为存储在磁盘上,需要时可以读取出来;)2)常见的数据库类型3)关系型数据库的两大基本概念4)数据库设计根据三大范式,建立冗余较小、结构合理的数据库;当然,数据库设计最重要的是看需求跟性能,需求>性能>表结构。5)数据库操作创建数据库并指定编码格式...
2020-02-06 11:18:19 321
原创 关系型数据库作业
MySQL常见的三种存储引擎(InnoDB、MyISAM、MEMORY)的区别(至少5点)? 1)InnoDB的优势在于提供了良好的事务处理、崩溃修复能力和并发控制。缺点是读写效率较差,占用的数据空间相对较大。(磁盘表,支持事务处理,InnoDB还支持外键) 2)MyISAM是MySQL中常见的存储引擎,曾经是MySQL的默认存储引擎。MyISAM的表存储成3个文件。文件的名字与表名相同。拓...
2020-01-15 12:48:21 310
原创 python中的内存管理机制
python内存管理机制内存池机制python内存管理机制是什么? 1). 由于python中万物皆对象,内存管理机制就是对象的存储问题,Python会分 配一块内存空间去存储对象。 2) 对于整数和短小的字符等,python会执行缓存机制,即将这些对象进行缓存, 不会为相同的对象分配多个内存空间 3). 容器对象,如列表、元组、字典等,存储的其他对象,仅仅是其他对象的引...
2020-01-10 12:09:54 1069
原创 魔术方法
什么是模式方法呢?在Python中,所有用"__"包起来的方法,都称为【魔术方法】(eg: len, init)。魔术方法一般是为了让显示器调用的,你自己并不需要调用它们。特殊属性note:查看属性__dir__查看属性,返回类或者对象的所有成员名称列表。dir() 函数就是调用__dir__()1). 如果dir([obj]) 参数obj包含方法 __dir__(),该方法将被调用...
2020-01-10 11:40:56 149
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人