uuyytg-CSDN博客

原创解决matplotlib中文显示问题(windows版)

找到python的安装目录，比如我的安装目录是E:\anaconda3\Lib\site-packages\matplotlib\mpl-data然后打开文件C:\windows\Fonts,找到中文字体文件，将文件复制到E\anaconda3\Lib\site-packages\matplotlib\mpl-data\fonts\ttf下。接着找到matplotlibrc文件，将文件中的font...

2018-04-27 18:26:02 1453

原创机器学习中最小二乘和梯度下降法的个人理解

提前说明一下，这里不涉及数学公式的推到，只是根据自己的理解来概括一下，有不准确的地方，欢迎指出。最小二乘：我们通常是根据一些离散的点来拟合出一天直线，这条直线也就是我们所说的模型，最小二乘也就是评价损失函数（loss）的一个指标。最小二乘就是那些离散的点与模型上拟合出的点做一个差的平方，然后将所有差的平方进行累加就得到了最小二乘的函数。梯度下降: 我们知道某一点的梯度也就是函数在该点的一个偏导数，...

2018-03-13 11:07:09 469

转载一文读懂机器学习，大数据/自然语言处理/算法全有了……

作者注：本文生动形象，深入浅出的方式介绍了机器学习及其它算法，适合新人和想更加了解机器学习的读者阅读，此文属于转载，下面链接是原文出处，我们尊重原作者的版权保护。https://www.cnblogs.com/donaldlee2008/p/5224325.html从机器学习谈起　　在本篇文章中，我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习，并且上手相...

2018-03-12 14:46:09 840

原创 numpy和pandas部分功能简介

numpy:是一个数组，底层用c语言实现，速度块。axis=0表示每一列axis=1表示每一行argmin是求最小索引值argmax是求最大索引值cumsum是累加求和diff是累差vstack表示上下合并hstack表示左右合并copy表示复制值，不复制地址pandas:numpy的加强版，用于读取数据，分析数据，整理数据，保存数据等，loc表示通过标签来定位iloc表示通过位置来定位ix表示通...

2018-03-12 10:00:22 756

转载开放数据集

商业敏感数据虽然难以获取，但好在仍有相当多有用数据可公开访问。它们中的不少常用来作为特定机器学习问题的基准测试数据。常见的有以下几个：UCL机器学习知识库包括近300个不同大小和类型的数据集，可用于分类、回归、聚类和推荐系统任务。数据集列表位于：http://archive.ics.uci.edu/ml/Amazon AWS公开数据集包含的通常是大型数据集，可通过Amazon S3访问。这些数据集...

2018-03-02 10:14:34 1103

转载 python matplotlib.pyplot画图设置刻度

https://jingyan.baidu.com/article/7e44095324e4062fc1e2ef76.html

2018-02-27 21:54:03 3591

转载 Numpy中的tile方法

在讲tile方法之前，先要讲一下Numpy数组中的几个概念。在NumPy中，数组这一类又被称为ndarray。1、ndarray.ndim指数组的维度，即数组轴（axes）的个数，其数量等于秩（rank）。通俗地讲，我们平时印象中的数组就是一维数组，维度为1、轴的个数为1、秩也等于1；最常见的矩阵就是二维数组，维度为2、轴的个数为2（可以理解为由x轴、y轴组成）、秩等于2；我们所知的空间就相当于三...

2018-02-27 12:00:01 265

原创 SQL注入

嗯，有一段时间没写博客了，今天我们来讨论一下SQL注入先来简单概括一下SQL注入原理:由于程序的漏洞，使得当用户提交一些恶意请求时，数据库仍然会返回一些内容，从而使得一些敏感内容展示给用户或返回数据库的其它内容。好吧，这只是我的个人简单概述，详细介绍请自行google:https://www.google.com.hk现在进入主题，我们要测试的网址时http://testphp.vulnw

2017-09-12 18:44:23 188

原创 html基础篇第一弹

标题段落(一个容器，html是房子，div就是房间,id就是房间号)(表示强调，斜体)(表强调，粗体)(表强调，实际没什么效果，为了可以设置样式而插入)(表示引用，效果是双引号)(整段文本引用，效果是缩进)表示换行表示一条横线表示空格(地址，效果，斜体，另起一段)(让计算机知道这是代码，防止被计算机执行，表示一行)(同上，表代码，多行

2017-07-30 20:55:19 359 1

转载数据标准化 Normalization

再来转载一波，原文出处:http://www.cnblogs.com/CheeseZH/p/5250775.html　数据的标准化（normalization）是将数据按比例缩放，使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到，去除数据的单位限制，将其转化为无量纲的纯数值，便于不同单位或量级的指标能够进行比较和加权。　　其中最典型的就是数据的归一化处理，即将数

2017-07-29 11:04:01 432

转载 scikit-learn主要模块和基本使用方法

转载一篇sklearn的文章，感觉还不错，先收下了~~~~引言对于一些开始搞机器学习算法有害怕下手的小朋友，该如何快速入门，这让人挺挣扎的。在从事数据科学的人中，最常用的工具就是R和Python了，每个工具都有其利弊，但是Python在各方面都相对胜出一些，这是因为scikit-learn库实现了很多机器学习算法。加载数据(Data Loading)我们

2017-07-29 10:35:28 447

转载 python机器学习

前段时间因为课程安排，了解了关于机器学习，现在闲一点了，准备好好来研究机器学习算法，先推荐一个链接http://python.jobbole.com/84326/，里面资源多多，链接多多，那就开始新的征程吧。

2017-07-25 09:53:53 281

原创 window10下安装Django

说实话，我是挺喜欢用linux系统，方便（用命令速度快），还能装逼（一不小心暴露了本性），可是吧，跟其他用window的人交流就不是很方便，所以，装双系统吧！回到主题，我的电脑是window10+python3.6(anaconda)安装django:cmd中直接pip install django(因为有anaconda,依赖库都不是问题)，当然如果这样安装失败的话，去官网下载djang

2017-07-24 19:24:21 3955

原创基于centos搭建wordpress个人博客

作为一个爱折腾的人，今天我们就自己搭个博客玩玩。环境：centoslet's goLNMP 是 Linux、Nginx、MySQL 和 PHP 的缩写，是 WordPress 博客系统依赖的基础运行环境。我们先来准备 LNMP 环境1.安装nginx:yum install nginx -y2.修改 /etc/nginx/conf.d/default.conf，去除对

2017-07-24 17:10:05 1159

转载 sublime text3下搭建Python IDE--Anaconda插件（自动补全）

今天自己想在sublime text3下装个python自动补全插件，当安装一个包管理器时（Package Contral）时，ctrl+shift+p输入Install Package时，总是报错说没有这个包，在网上也找了很多解决办法，有人说时ipv6的问题，etc...咕哝了一波后，最后还是没解决（尴尬），最后参考了一下这个博客，http://www.cnblogs.com/nx520zj/p

2017-07-22 17:35:45 9328 1

原创 win10下MongoDB安装与配置

1，下载mongodbhttps://www.mongodb.com/download-center?jmp=nav#community`选择自己需要的版本，我这里使用的是win10，选择了第一个 2.下载完后运行，在安装中选择自定义，我将路径换为F:\MongoDB,然后下一步下一步就完成了。so easy！ 3.开始配置，MongoDB安装过程中不会给你建立data文件夹（存放数据的），所以

2017-07-19 21:38:31 615

原创 python的itchat模块

今天一不小心发现的python的好玩模块itchar 首先，安装：pip install itchat 1,搜索微信好友信息import itchatitchat.auto_login(hotReload=True) #登入friends_info = itchat.get_friends(update=Ture)for i in friends_info: print(i) #

2017-07-18 15:37:27 5286 2

转载 python爬取百度百科

来源于imooc教程实例，课程地址http://www.imooc.com/learn/563 以下是自己经过每一步分析，最后成功完成，代码模块化结构分明，不过自己一开始分析还是有点晕晕的，毕竟还不太习惯，以后多练习吧，每一份的收获都来之不易，但收获的喜悦总是弥足珍贵，好了，下面就开始我们的程序。 0,爬取目标1)百度百科词条标题和简介；2)链接页面的词条标题和简介；3)总共爬取1000个页面。

2017-07-15 14:12:19 1529

原创 python函数的参数问题

万能参数一（*args）例子：def func1(*args): print(args,type(args))func1(34,56,23,'age')打印结果：(34,56,23,'age')<class 'tuple'>总结：万能参数一它的类型为元组万能参数二(**kwargs) 例子def func2(**kwargs): print(kwargs,type(kwa

2017-07-13 17:53:25 237

原创 python爬取花瓣妹子信息

因为花瓣妹子信息是动态加载的，所以如果用原始方法直接爬取网页的方法是爬不到的，这里我们用selenium来自动化处理。 import requests from bs4 import BeautifulSoup from selenium import webdriver import timeurl = ‘http://huaban.com/boards/favorite/beauty/’

2017-07-13 16:45:27 1084 1

转载 win10+mysql

在windows10上安装mysql详细图文教程环境：windwos 10（1511） 64bit、mysql 5.7.14一、下载mysql1. 在浏览器里打开mysql的官网http://www.mysql.com/2. 进入页面顶部的"Downloads"3. 打开页面底部的“Community(GPL) Downloads”4. 在页

2017-07-13 12:06:04 283

原创 python模拟爬虫

老规矩，向上库(requests,号称为人类而设计，这个库的作者长的还是很帅的，有兴趣的可以去看看)import requests headers = {“user-agent”: “Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari

2017-07-13 11:58:40 386