数据分析
文章平均质量分 85
网络毒刘
因为同样的坑不想踩两次而写博客,
也同样为了社会更好的进步...
其实 Python 已经是一个很老的编程语言了,到现在(2019年) Python 已经高龄 28 岁,比很多程序员的年龄都大。现在之所以这么流行和社区、人工智能AI的日益发展,有很大的关系。
千里之行始于足下,还不开始学习 Python编程吗
个人公众号:网络毒刘
一名热爱分享技术的宝藏博主。
公众号回复1024,有免费教程分享。
展开
-
【Mysql】数据库主从搭建-基于docker
后台可回复【1024】即可获取相关宝藏内容分享:)为什么基于Docker搭建? 资源有限 虚拟机搭建对机器配置有要求,并且安装mysql步骤繁琐 一台机器上可以运行多个Docker容器 Docker容器之间相互独立,有独立ip,互不冲突 Docker使用步骤简便,启动容器在秒级别 今天文章分为两部分 :)PART1Docker搭建MySQL主从数据库技术分享 /PART2 关于习惯杂谈//// ...原创 2020-10-05 14:13:33 · 469 阅读 · 2 评论 -
【数据分析】快速获取微博用户数据,图片,视频
功能输出实例运行环境使用说明下载脚本安装依赖程序设置设置数据库(可选)运行脚本按需求修改脚本(可选)如何获取user_id添加cookie与不添加cookie的区别(可选)如何获取cookie(可选)如何检测cookie是否有效(可选)功能连续爬取一个或多个新浪微博用户(如Dear-迪丽热巴、郭碧婷)的数据,并将结果信息写入文件。写入信息几乎包括了用户微博...原创 2020-01-10 21:31:31 · 4032 阅读 · 1 评论 -
【tensorflow】static_rnn与dynamic_rnn的区别
static_rnn和dynamic_rnn的区别主要在于实现不同。static_rnn会把RNN展平,用空间换时间。 gpu会吃不消(个人测试结果)dynamic_rnn则是使用for或者while循环。调用static_rnn实际上是生成了rnn按时间序列展开之后的图。打开tensorboard你会看到sequence_length个rnn_cellstack在一起,只不...原创 2019-12-18 21:58:45 · 748 阅读 · 0 评论 -
【深度学习】Cifar-10-探究不同的改进策略对分类准确率提高
cifar10数据集上进行图片分类,基于tensorflow框架,旨在探究不同的改进策略对分类准确率的影响,如何一步步得提高准确率一、问题描述当我们在处理图像识别或者图像分类或者其他机器学习任务的时候,我们总是迷茫于做出哪些改进能够提升模型的性能(识别率、分类准确率)。。。或者说我们在漫长而苦恼的调参过程中到底调的是哪些参数。。。所以,我花了一部分时间在公开数据集CIFAR-1...原创 2019-12-18 21:38:37 · 7136 阅读 · 4 评论 -
【机器学习】 LightGBM——优于XGBoost提升的集成算法(安装+对比XGBoost改进+参数说明+python代码实例)
中文官方文档:http://lightgbm.apachecn.org/cn/latest/Installation-Guide.html英文官方文档:https://lightgbm.readthedocs.io/en/latest/一、lightGBM安装在anaconda中输入:pip install lightGBM即可输入import lightgbm as lg...原创 2019-12-06 17:48:43 · 2229 阅读 · 0 评论 -
【机器学习】XGBoost集成算法——(理论+图解+python代码比较其他算法使用天池蒸汽数据)
一、集成算法思想二、XGBoost基本思想三、用python实现XGBoost算法在竞赛题中经常会用到XGBoost算法,用这个算法通常会使我们模型的准确率有一个较大的提升。既然它效果这么好,那么它从头到尾做了一件什么事呢?以及它是怎么样去做的呢?我们先来直观的理解一下什么是XGBoost。XGBoost算法是和决策树算法联系到一起的。XGBoost是boosting算法的其...原创 2019-12-06 17:15:34 · 2497 阅读 · 0 评论 -
【机器学习】DBSCAN聚类算法—优于Kmean—(理论+图解+python代码)
一、前言二、DBSCAN聚类算法三、参数选择四、DBSCAN算法迭代可视化展示五、常用的评估方法:轮廓系数六、用Python实现DBSCAN聚类算法一、前言去年学聚类算法的R语言的时候,有层次聚类、系统聚类、K-means聚类、K中心聚类,最后呢,被DBSCAN聚类算法迷上了,为什么呢,首先它可以发现任何形状的簇,其次我认为它的理论也是比较简单易懂的。今年在python...原创 2019-12-06 16:43:39 · 2370 阅读 · 0 评论 -
【机器学习】朴素贝叶斯介绍及实例--对短信进行二分类 使用多项式分布
贝叶斯首先什么是贝叶斯?一个例子,现分别有 A、B 两个容器,在容器 A 里分别有 7 个红球和 3 个白球,在容器 B 里有 1 个红球和 9个白球,现已知从这两个容器里任意抽出了一个球,且是红球,问这个红球是来自容器 A 的概率是多少? 假设已经抽出红球为事件 B,选中容器 A为事件 A,则有:P(B) = 8/20,P(A) = 1/2,P(B|A) = 7/10,按照公式,则有:...原创 2019-12-06 16:12:32 · 2112 阅读 · 0 评论 -
01Pandas_数据结构
Pandas数据结构做python数据分析,数据挖掘,机器学习的童鞋应该都离不开pandas。在做数据的预处理的时候pandas尤为给力。本文主要介绍pandas中的两种数据结构:series,dataframe。import pandas as pd1.Series首先来介绍series数据结构。series 类似于一维数组的对象。对于series基本要掌握的是:构...原创 2019-11-20 20:26:33 · 138 阅读 · 0 评论 -
【数据分析】豆瓣电影Top250爬取的数据的可视化分析
#!-*- coding:utf-8 -*-import pandas as pdimport numpy as npimport matplotlib.pylab as pltimport refrom numpy import rankfrom builtins import mapfrom datashape.coretypes import Map#http://www.j...原创 2019-11-15 10:10:59 · 20784 阅读 · 6 评论 -
【数据分析】苹果公司股票数据处理
import numpy as npimport pandas as pdfrom pandas import Series,DataFrameapp = pd.read_csv('./AAPL.csv')app.shape(9814, 7)app.head() Date Open High ...原创 2019-11-13 21:56:24 · 1600 阅读 · 0 评论 -
【数据分析】使用pandas和numpy分析美国大选献金项目
1. 数据载入与总览1.1 数据加载#绘图工具import matplotlib.pyplot as plt%matplotlib inline#数据处理工具import numpy as npimport pandas as pdfrom pandas import Series,DataFrame#数据路径自己指定,本案例数据路径就在当前文件夹下面子文件夹us...原创 2019-11-13 21:32:31 · 1026 阅读 · 0 评论