数据分析-图书馆
小松悦读会 | kevinelstri
小松悦读会,用心阅读,执着专注!
展开
-
【数据分析】图书馆数据-03直方图展示借书数量与借书人数之间的关系
图书馆的数据是一年的数据,一年以来,每个学生的借书情况就可以清洗的展示出来,不同学生对于图书的需求也是不同的,那么学生借书的热度如何呢?这里就可以通过计算每个学生的借书数量,来分析一年以来学生的借书情况。# -*-coding:utf-8-*-import numpy as npimport pandas as pdimport matplotlib.pyplot as plt"""原创 2017-03-09 17:46:46 · 3217 阅读 · 1 评论 -
【数据分析】图书馆数据-02重命名、索书号、分组
图书馆数据预处理: 1、由于表的字段都是中文,为了后续处理的方便性,首先将表的字段全部重命名为英文。 2、对于索书号而言,图书的类型主要由索书号的首字母来决定,因此这里将对索书号进行字符串分割,只保留索书号的首字符。 3、分组获取不同学生借书数量的多少,便于对学生借书行为进行分析。字段重命名:df = pd.read_csv('data.原创 2017-03-09 17:24:29 · 1677 阅读 · 1 评论 -
【数据分析】图书馆数据-01建表
对图书馆的数据进行数据挖掘,考虑到学生借阅图书的周期性,在图书馆数据库中主要选取了读者信息表和读者借阅记录表,选取从2016年1月1日到2016年12月31日的182508条借阅记录信息和15294条学生信息,使用python对数据进行数据挖掘处理,根据数据挖掘的结果来分析其中蕴含的规律。 读者借阅记录表是在读者借书的过程中,由图书馆数据库生成的,包括读者证号、读者姓名、条形码、书名等11原创 2017-03-09 16:57:19 · 3662 阅读 · 2 评论 -
【数据分析】图书馆数据
此次数据分析实践是在这篇论文《基于数据挖掘的图书馆书目推荐服务的研究》的基础上进行实施的,将论文中提到的相关技术及相关知识点进行实践操作,并对相关业务进行逻辑上的分析。【数据分析】图书馆数据-01建表 【数据分析】图书馆数据-02重命名、索书号、分组 【数据分析】图书馆数据-03直方图展示借书数量与借书人数之间的关系【数据分析】图书馆数据-04借阅情况聚类挖掘 【数据分析】图书馆数据原创 2017-03-11 21:15:21 · 3147 阅读 · 1 评论 -
【数据分析】图书馆数据-08决策树
# -*-coding:utf-8-*-import numpy as npimport pandas as pd""" 数据要求:read_num, book_id"""pf = pd.read_csv('new_data.csv', encoding='gbk')print type(pf)unit = pf['read_unit']unit = unit.str.split(原创 2017-03-09 21:58:51 · 1696 阅读 · 0 评论 -
【数据分析】图书馆数据-07关联规则
对读者借书的书目进行关联规则处理,通过关联规则来查找读者借书之间的关系. 首先获取读者证号、索书号列表,由于部分数据的索书号为空,或者出现异常值,所以需要对索书号进行数据清洗:1、数据清洗""" 数据要求:read_num, book_id"""pf = pd.read_csv('new_data.csv', encoding='gbk')# print pf.head(原创 2017-03-09 21:42:28 · 2180 阅读 · 0 评论 -
【数据分析】图书馆数据-06数据处理过程中的算法
1、加标签算法给定一个数组:x = [A,B,H,D,F,E,A,D,C,F,V,C,D,B,B,C,A,F,E,D,F,D,D]Output:x = [1,2,3,4,5,6,1,4,7,5,8,7,4,2,2,7,1,5,6,4,5,4,4]说明: 将数组x中的字母全部用数字表示,相同的字母使用同一个数字表示,不同的字母使用不同的数字表示。分析: 对于上述数组x而言,数组x的长度是已知的,原创 2017-03-09 21:02:40 · 1189 阅读 · 0 评论 -
【数据分析】图书馆数据-05读者类型聚类挖掘
根据读者借阅图书的总册数进行分类可以大致了解借阅图书的积极性,那么还有那些因素影响着学生的借阅图书情况呢?不同类型的读者对图书的要求也是不同的,在阅读次数较多的分组中对读者进行再一次的分类,寻找读者阅读中的因素。 导入现有的读者信息,包括读者性别、所在院系以及对应的借书书目信息。# -*-coding:utf-8-*-import pandas as pdimport numpy a原创 2017-03-09 19:14:53 · 2545 阅读 · 0 评论 -
【数据分析】图书馆数据-04借阅情况聚类挖掘
由上述对图书借阅数量与借阅人数之间的直方图中,可以清晰地展示一年以来,读者借书数量的情况分布,那么在这个分布的情况下,读者借阅又有怎样的特点呢? 对于图书馆的读者而言,有的读者借阅频率高,对图书的利用也比较充分,具有大量的借书行为;而有的读者则很少出现在图书馆,或是仅仅借阅与专业相关的部分书籍。对不同读者的借阅需求进行聚类分析,分析读者的平均借阅情况。# -*-coding:utf-8原创 2017-03-09 17:58:05 · 4890 阅读 · 3 评论 -
数据分析大咖一日行
一、数据分析师有哪些要求?下图是数据分析师认证的基本内容(http://cda.pinggu.org/view/3.html),1至3级,从低到高。概括起来四点要求: 1、理论要求及对数字的敏感性,包括统计知识、市场研究、模型原理等。 2、工具使用,包括挖掘工具、数据库、常用办公软件(excel、PPT、word、脑图)等 3、业务理解能力和对商业的敏感性。对商业及产品要有深刻的理解,因为原创 2016-10-10 09:49:40 · 2030 阅读 · 0 评论