- 博客(22)
- 资源 (6)
- 收藏
- 关注
原创 解决matplotlib中文显示问题(windows版)
找到python的安装目录,比如我的安装目录是E:\anaconda3\Lib\site-packages\matplotlib\mpl-data然后打开文件C:\windows\Fonts,找到中文字体文件,将文件复制到E\anaconda3\Lib\site-packages\matplotlib\mpl-data\fonts\ttf下。接着找到matplotlibrc文件,将文件中的font...
2018-04-27 18:26:02
1453
原创 机器学习中最小二乘和梯度下降法的个人理解
提前说明一下,这里不涉及数学公式的推到,只是根据自己的理解来概括一下,有不准确的地方,欢迎指出。最小二乘:我们通常是根据一些离散的点来拟合出一天直线,这条直线也就是我们所说的模型,最小二乘也就是评价损失函数(loss)的一个指标。最小二乘就是那些离散的点与模型上拟合出的点做一个差的平方,然后将所有差的平方进行累加就得到了最小二乘的函数。梯度下降: 我们知道某一点的梯度也就是函数在该点的一个偏导数,...
2018-03-13 11:07:09
469
转载 一文读懂机器学习,大数据/自然语言处理/算法全有了……
作者注:本文生动形象,深入浅出的方式介绍了机器学习及其它算法,适合新人和想更加了解机器学习的读者阅读,此文属于转载,下面链接是原文出处,我们尊重原作者的版权保护。https://www.cnblogs.com/donaldlee2008/p/5224325.html从机器学习谈起 在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相...
2018-03-12 14:46:09
840
原创 numpy和pandas部分功能简介
numpy:是一个数组,底层用c语言实现,速度块。axis=0表示每一列axis=1表示每一行argmin是求最小索引值argmax是求最大索引值cumsum是累加求和diff是累差vstack表示上下合并hstack表示左右合并copy表示复制值,不复制地址pandas:numpy的加强版,用于读取数据,分析数据,整理数据,保存数据等,loc表示通过标签来定位iloc表示通过位置来定位ix表示通...
2018-03-12 10:00:22
756
转载 开放数据集
商业敏感数据虽然难以获取,但好在仍有相当多有用数据可公开访问。它们中的不少常用来作为特定机器学习问题的基准测试数据。常见的有以下几个:UCL机器学习知识库包括近300个不同大小和类型的数据集,可用于分类、回归、聚类和推荐系统任务。数据集列表位于:http://archive.ics.uci.edu/ml/Amazon AWS公开数据集包含的通常是大型数据集,可通过Amazon S3访问。这些数据集...
2018-03-02 10:14:34
1103
转载 python matplotlib.pyplot画图设置刻度
https://jingyan.baidu.com/article/7e44095324e4062fc1e2ef76.html
2018-02-27 21:54:03
3591
转载 Numpy中的tile方法
在讲tile方法之前,先要讲一下Numpy数组中的几个概念。在NumPy中,数组这一类又被称为ndarray。1、ndarray.ndim指数组的维度,即数组轴(axes)的个数,其数量等于秩(rank)。通俗地讲,我们平时印象中的数组就是一维数组,维度为1、轴的个数为1、秩也等于1;最常见的矩阵就是二维数组,维度为2、轴的个数为2(可以理解为由x轴、y轴组成)、秩等于2;我们所知的空间就相当于三...
2018-02-27 12:00:01
265
原创 SQL注入
嗯,有一段时间没写博客了,今天我们来讨论一下SQL注入先来简单概括一下SQL注入原理:由于程序的漏洞,使得当用户提交一些恶意请求时,数据库仍然会返回一些内容,从而使得一些敏感内容展示给用户或返回数据库的其它内容。好吧,这只是我的个人简单概述,详细介绍请自行google:https://www.google.com.hk现在进入主题,我们要测试的网址时http://testphp.vulnw
2017-09-12 18:44:23
188
原创 html基础篇第一弹
标题段落(一个容器,html是房子,div就是房间,id就是房间号)(表示强调,斜体)(表强调,粗体)(表强调,实际没什么效果,为了可以设置样式而插入)(表示引用,效果是双引号)(整段文本引用,效果是缩进)表示换行表示一条横线 表示空格(地址,效果,斜体,另起一段)(让计算机知道这是代码,防止被计算机执行,表示一行)(同上,表代码,多行
2017-07-30 20:55:19
359
1
转载 数据标准化 Normalization
再来转载一波,原文出处:http://www.cnblogs.com/CheeseZH/p/5250775.html 数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。 其中最典型的就是数据的归一化处理,即将数
2017-07-29 11:04:01
432
转载 scikit-learn主要模块和基本使用方法
转载一篇sklearn的文章,感觉还不错,先收下了~~~~引言对于一些开始搞机器学习算法有害怕下手的小朋友,该如何快速入门,这让人挺挣扎的。在从事数据科学的人中,最常用的工具就是R和Python了,每个工具都有其利弊,但是Python在各方面都相对胜出一些,这是因为scikit-learn库实现了很多机器学习算法。加载数据(Data Loading)我们
2017-07-29 10:35:28
447
转载 python机器学习
前段时间因为课程安排,了解了关于机器学习,现在闲一点了,准备好好来研究机器学习算法,先推荐一个链接http://python.jobbole.com/84326/,里面资源多多,链接多多,那就开始新的征程吧。
2017-07-25 09:53:53
281
原创 window10下安装Django
说实话,我是挺喜欢用linux系统,方便(用命令速度快),还能装逼(一不小心暴露了本性),可是吧,跟其他用window的人交流就不是很方便,所以,装双系统吧!回到主题,我的电脑是window10+python3.6(anaconda)安装django:cmd中直接pip install django(因为有anaconda,依赖库都不是问题),当然如果这样安装失败的话,去官网下载djang
2017-07-24 19:24:21
3955
原创 基于centos搭建wordpress个人博客
作为一个爱折腾的人,今天我们就自己搭个博客玩玩。环境:centoslet's goLNMP 是 Linux、Nginx、MySQL 和 PHP 的缩写,是 WordPress 博客系统依赖的基础运行环境。我们先来准备 LNMP 环境1.安装nginx:yum install nginx -y2.修改 /etc/nginx/conf.d/default.conf,去除对
2017-07-24 17:10:05
1159
转载 sublime text3下搭建Python IDE--Anaconda插件(自动补全)
今天自己想在sublime text3下装个python自动补全插件,当安装一个包管理器时(Package Contral)时,ctrl+shift+p输入Install Package时,总是报错说没有这个包,在网上也找了很多解决办法,有人说时ipv6的问题,etc...咕哝了一波后,最后还是没解决(尴尬),最后参考了一下这个博客,http://www.cnblogs.com/nx520zj/p
2017-07-22 17:35:45
9328
1
原创 win10下MongoDB安装与配置
1,下载mongodbhttps://www.mongodb.com/download-center?jmp=nav#community`选择自己需要的版本,我这里使用的是win10,选择了第一个 2.下载完后运行,在安装中选择自定义,我将路径换为F:\MongoDB,然后下一步下一步就完成了。so easy! 3.开始配置,MongoDB安装过程中不会给你建立data文件夹(存放数据的),所以
2017-07-19 21:38:31
615
原创 python的itchat模块
今天一不小心发现的python的好玩模块itchar 首先,安装:pip install itchat 1,搜索微信好友信息import itchatitchat.auto_login(hotReload=True) #登入friends_info = itchat.get_friends(update=Ture)for i in friends_info: print(i) #
2017-07-18 15:37:27
5286
2
转载 python爬取百度百科
来源于imooc教程实例,课程地址http://www.imooc.com/learn/563 以下是自己经过每一步分析,最后成功完成,代码模块化结构分明,不过自己一开始分析还是有点晕晕的,毕竟还不太习惯,以后多练习吧,每一份的收获都来之不易,但收获的喜悦总是弥足珍贵,好了,下面就开始我们的程序。 0,爬取目标1)百度百科词条标题和简介;2)链接页面的词条标题和简介;3)总共爬取1000个页面。
2017-07-15 14:12:19
1529
原创 python函数的参数问题
万能参数一(*args) 例子:def func1(*args): print(args,type(args))func1(34,56,23,'age')打印结果:(34,56,23,'age')<class 'tuple'>总结:万能参数一它的类型为元组万能参数二(**kwargs) 例子def func2(**kwargs): print(kwargs,type(kwa
2017-07-13 17:53:25
237
原创 python爬取花瓣妹子信息
因为花瓣妹子信息是动态加载的,所以如果用原始方法直接爬取网页的方法是爬不到的,这里我们用selenium来自动化处理。 import requests from bs4 import BeautifulSoup from selenium import webdriver import timeurl = ‘http://huaban.com/boards/favorite/beauty/’
2017-07-13 16:45:27
1084
1
转载 win10+mysql
在windows10上安装mysql详细图文教程环境:windwos 10(1511) 64bit、mysql 5.7.14一、下载mysql1. 在浏览器里打开mysql的官网http://www.mysql.com/2. 进入页面顶部的"Downloads"3. 打开页面底部的“Community(GPL) Downloads”4. 在页
2017-07-13 12:06:04
283
原创 python模拟爬虫
老规矩,向上库(requests,号称为人类而设计,这个库的作者长的还是很帅的,有兴趣的可以去看看)import requests headers = {“user-agent”: “Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari
2017-07-13 11:58:40
386
御剑后台扫描工具
2017-10-07
DirBuster网站目录扫描
2017-09-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人