数据分析专栏
文章平均质量分 78
数据分析专栏
Tao_RY
很久不学习了
展开
-
数据挖掘——MySQL基础
MySQL基础一、MySQL入门1、进入mysql2、显示数据库3、选择数据库4、查看可用表5、查看表的列二、检索数据1、检索列2、检索不同的行3、限制结果三、排序数据四、过滤数据一、MySQL入门1、进入mysql mysql -uroot -p2、显示数据库mysql> show databases;+--------------------+| Database |+--------------------+| information_schema ||原创 2021-01-16 00:27:04 · 600 阅读 · 0 评论 -
熵值法python实现
在信息论中,熵是对不确定性的一种度量。不确定性越大,熵就越大,包含的信息量越大;不确定性越小,熵就越小,包含的信息量就越小。根据熵的特性,可以通过计算熵值来判断一个事件的随机性及无序程度,也可以用熵值来判断某个指标的离散程度,指标的离散程度越大,该指标对综合评价的影响(权重)越大。比如样本数据在某指标下取值都相等,则该指标对总体评价的影响为0,权值为0.熵权法是一种客观赋权法,因为它仅依赖于数据本身的离散性。但其实通过熵值法确定权重并不是特别合理。熵值法python实现:# -*- coding:u原创 2020-05-16 22:57:07 · 3957 阅读 · 0 评论 -
爬虫实战——爬取杭电就业信息网招聘信息
杭电宣讲会信息爬取爬取内容: 宣讲单位,宣讲时间,所在学校,宣讲地点,单位简介等项目需求实现两层网页的信息爬取,并将爬取的信息进行整合保存到 excel 文件中。(1) 基础:爬取一个外层页中,所有内层页的信息(2) 进阶:爬取多个外层页中, 所有内层页的信息每个题目中, 至少爬取上述给定爬取内容中的五项。自学数据可视化方法,将爬取结果以曲线图、 柱状图等方式显示。自学 scra...原创 2020-04-14 11:19:44 · 1633 阅读 · 5 评论 -
DataFrame按行/列遍历并按条件修改
1、按行遍历iterrows():包含索引和每一行元素In[25]: dfOut[25]: a b c d0 1 2 4 01 20 10 14 02 20 10 14 0In[26]: for index, row in df.iterrows(): ...: if row['a'] > 1: ...: ...原创 2020-03-26 01:06:42 · 10730 阅读 · 1 评论 -
python读取matlab的mat文件
python读取mat文件主要是通过scipy.io模块import scipy.io import numpy as np# python 读取mat文件signal = scipy.io.loadmat('Python basics/Dat_2.mat')查看一下signal的类型:字典In[7]: type(signal)Out[7]: dict查看signal[‘...原创 2020-03-23 20:01:31 · 282 阅读 · 0 评论 -
python数据可视化——matpiotlib、pandas、seaborn
一、饼图二、条形图三、直方图与核密度曲线四、箱线图五、小提琴图六、折线图七、散点图八、气泡图九、热力图原创 2020-12-20 11:30:49 · 488 阅读 · 0 评论 -
Python批量读取文件夹下所有文件
现给定一个文件夹,下面有很多文件(可能是一天一个数据文件等),我们要读取该文件夹下面的所有文件原创 2019-12-04 14:19:35 · 10039 阅读 · 0 评论 -
数据挖掘——pandas+matplotlib+seaborn数据可视化
前言:python数据挖掘pandas+matplotlib+seaborn数据可视化(画图)的基础知识,简单总结,主要是为了方便自己写代码的时候查看,发现有用的方法,随时补充,欢迎指正数据挖掘专栏数据挖掘——python基础数据挖掘——numpy基础数据挖掘——pandas基础数据挖掘——pandas+matplotlib+seaborn数据可视化(画图)数据可视化一、数据可视...原创 2019-11-17 14:28:54 · 1191 阅读 · 0 评论 -
数据挖掘——pandas基础
前言:python数据挖掘pandas的基础知识,简单总结,主要是为了方便自己写的时候查看,发现有用的方法,随时补充,欢迎指正数据挖掘专栏数据挖掘——python基础数据挖掘——numpy基础数据挖掘——pandas基础数据挖掘——pandas+matplotlib+seaborn数据可视化pandas基础一、认识pandas二、两种重要的数据类型1、序列(Series)(1)S...原创 2019-11-17 14:26:52 · 644 阅读 · 0 评论 -
DataFrame的groupby合并数据
现有数据如下格式:我们需要根据日期统计日点击量,画出日点击量图# -*- coding: utf-8 -*-"""Created on Thu Nov 7 18:39:18 2019@author: 1"""import pandas as pdfrom matplotlib import pyplot as pltdf=pd.read_excel('test.xls'...原创 2020-04-14 11:18:15 · 2348 阅读 · 0 评论 -
数据挖掘——python基础
前言:python数据挖掘的基础知识,参考网上很多文章和博客进行总结,主要是为了方便自己写代码的时候查看,发现有用的方法,随时补充数据挖掘专栏数据挖掘——python基础数据挖掘——numpy基础数据挖掘——pandas基础数据挖掘——pandas+matplotlib+seaborn数据可视化python基础一、python语言介绍1、万物皆对象2、解释型语言(胶水语言)二、基...原创 2019-11-17 14:23:24 · 579 阅读 · 0 评论 -
2017年全国大学生数学建模B题数据处理
2017年全国大学生数学建模B题数据处理# -*- coding: utf-8 -*-"""Created on Fri Oct 18 20:17:00 2019@author: 1"""import pandas as pdimport matplotlib.pyplot as pltimport smopy#读取数据df=pd.read_excel('附件一:已...原创 2020-04-14 11:21:18 · 4157 阅读 · 1 评论 -
pandas——微博数据分析
数据介绍:Use of this dataset in publications must be acknowledged by referencing the following publication:King-wa Fu, CH Chan, Michael Chau. Assessing Censorship on Microblogs in China: Discriminatory...原创 2020-04-14 11:22:07 · 325 阅读 · 0 评论 -
数据处理实例
前言:自己也是小白,主要用作练习和熟悉方法,其实里面很多处理方法还是花了心思去想的(可能还是不是特别简便,特别是膜拜的那个问题,欢迎指正),不涉及算法知识,仅锻炼自己的数据处理能力,数据集如有需要指明用处可共享,这里推荐一篇文章Python数据分析实战基础数据挖掘专栏数据挖掘——python基础数据挖掘——numpy基础数据挖掘——pandas基础数据挖掘——matplotlib+s...原创 2019-11-13 11:24:27 · 4257 阅读 · 3 评论 -
数据挖掘——numpy基础
前言:python数据挖掘numpy的基础知识,参考网上资料和博客进行简单总结,主要是为了方便自己写代码的时候查看,发现有用的方法,随时补充,欢迎指正数据挖掘专栏数据挖掘——python基础数据挖掘——numpy基础数据挖掘——pandas基础数据挖掘——pandas+matplotlib+seaborn数据可视化numpy基础一、认识numpy二、numpy数组对象(ndarr...原创 2019-09-27 00:07:22 · 385 阅读 · 0 评论 -
膜拜共享单车数据分析
数据:2017年5月两周内,北京40余万辆摩拜单车被30余万摩拜用户的使用情况(该开源数据来源于2017年摩拜算法挑战赛)。数据包含300余万条出行记录数据,每条的数据包含了订单号(orderid )、用户编号(userid )、单车编号(bikeid)、单车类(biketype)、开始使用单车时间(starttime)、使用起点坐标(startloc)和使用终点坐标(endloc),其中起点和终...原创 2020-04-14 11:21:39 · 2190 阅读 · 0 评论