Dataset之LSUN:LSUN数据集的简介、安装、使用方法之详细攻略

Dataset之LSUN:LSUN数据集的简介、安装、使用方法之详细攻略

 

 

目录

LSUN数据集的简介

1、Paper

2、简介

3、LSUN数据集上DCGAN的生成结果

LSUN数据集的安装

LSUN数据集的使用方法


 

 

 

LSUN数据集的简介

1、Paper

Fisher Yu, Ari Seff, Yinda Zhang, Shuran Song, Thomas Funkhouser and Jianxiong Xiao 
LSUN: Construction of a Large-scale Image Dataset using Deep Learning with Humans in the Loop
arXiv:1506.03365 [cs.CV], 10 Jun 2015 

2、简介

      LSun场景分类的10个场景类别。LSUN 是一个场景理解图像数据集,主要包含了卧室、固房、客厅、教室等场景图像。
      20对象类别:链接列表。每个类别的图像以LMDB格式存储,然后数据库被压缩。下载和解压缩ZIP文件后,请参考LSun实用代码来可视化和导出图像。还提供了每个zip文件的MD5和,以便您可以验证下载。

     While there has been remarkable progress in the performance of visual recognition algorithms, the state-of-the-art models tend to be exceptionally data-hungry. Large labeled training datasets, expensive and tedious to produce, are required to optimize millions of parameters in deep network models. Lagging behind the growth in model capacity, the available datasets are quickly becoming outdated in terms of size and density. To circumvent this bottleneck, we propose to amplify human effort through a partially automated labeling scheme, leveraging deep learning with humans in the loop. Starting from a large set of candidate images for each category, we iteratively sample a subset, ask people to label them, classify the others with a trained model, split the set into positives, negatives, and unlabeled based on the classification confidence, and then iterate with the unlabeled set. To assess the effectiveness of this cascading procedure and enable further progress in visual recognition research, we construct a new image dataset, LSUN. It contains around one million labeled images for each of 10 scene categories and 20 object categories. We experiment with training popular convolutional networks and find that they achieve substantial performance gains when trained on this dataset.

       虽然在视觉识别算法的性能上已经取得了显著的进步,但是最先进的模型往往特别需要数据。为了在深层网络模型中优化数百万个参数,需要大量标注的训练数据集,这些数据集的生产既昂贵又繁琐。滞后于模型容量的增长,可用的数据集在尺寸和密度方面很快变得过时。为了绕过这个瓶颈,我们建议通过部分自动化的标签方案,利用循环中的人的深层学习,来增强人的努力。从每个类别的一大组候选图像开始,我们迭代地采样一个子集,要求人们标记它们,用训练好的模型对其他类别进行分类,根据分类置信度将集合划分为正、负和未标记,然后用未标记的集合进行迭代。为了评估这种级联过程的有效性,并使视觉识别研究取得进一步进展,我们构建了一个新的图像数据集,LSUN。
      它包含10个场景类别和20个对象类别中的每一个的大约一百万个标记图像。我们对当前流行的卷积网络进行了实验,发现当在这个数据集上进行训练时,它们获得了显著的性能增益。

官网地址:http://www.yf.io/p/lsun

3、LSUN数据集上DCGAN的生成结果

 

 

LSUN数据集的下载

        一个类别中的所有图像都存储在一个lmdb数据库文件中。每个条目的值是jpg二进制数据。我们调整所有的图像大小,使较小的尺寸是256和压缩的质量为75的jpeg图像。

 

该数据集,暂时无法在线下载
PS:如需该数据集,可向博主留言索取!

Dataset之LSUN:LSUN数据集的下载使用教程

 

 

LSUN数据集的使用方法

基于LSUN数据集实现场景分类识别

 

 

 

 

 

 

  • 7
    点赞
  • 40
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 68
    评论
### 回答1: Python使用dataset数据集可以通过以下步骤实现: 1. 安装dataset库:可以使用pip命令进行安装,如下所示: ``` pip install dataset ``` 2. 导入dataset库:在Python代码中导入dataset库,如下所示: ``` import dataset ``` 3. 连接数据库:使用dataset库提供的connect()方法连接数据库,如下所示: ``` db = dataset.connect('sqlite:///mydatabase.db') ``` 其中,'sqlite:///mydatabase.db'表示连接SQLite数据库,mydatabase.db为数据库文件名。 4. 创建表格:使用dataset库提供的create_table()方法创建表格,如下所示: ``` table = db.create_table('mytable') ``` 其中,'mytable'为表格名称。 5. 插入数据:使用dataset库提供的insert()方法插入数据,如下所示: ``` data = {'name': 'John', 'age': 30} table.insert(data) ``` 其中,data为要插入的数据。 6. 查询数据:使用dataset库提供的find()方法查询数据,如下所示: ``` results = table.find(name='John') for row in results: print(row) ``` 其中,name='John'表示查询name字段为John的数据。 以上就是Python使用dataset数据集的基本步骤。 ### 回答2: Python的dataset模块是一个用于处理关系型数据库(RDBMS)的工具,它充分利用了SQLAlchemy的功能。这个模块为Python语言提供了一个轻量级的接口,可以让用户更快速、更方便地连接和查询数据库。下面我会分几个方面来介绍它的使用安装方式 首先,你需要使用pip安装dataset。你可以使用以下命令来安装: ``` pip install dataset ``` 连接数据库 连接数据库是很重要的一步,在Python代码中连接数据库需要先指定数据库的类型、用户名、密码、主机IP和数据库名称。以MySQL数据库为例,以下是一个连接MySQL数据库的代码示例: ``` python import dataset db = dataset.connect('mysql://user:password@host/database') ``` 在这个例子中,我们使用connect()函数设置了一个MySQL数据库的连接。其中,连接连接字符串(mysql://user:password@host/database)由以下部分组成: - mysql表示我们将要连接的数据库类型; - user和password分别是数据库访问的用户名和密码; - host代表主机的IP地址; - database是我们将要访问的数据库名称。 你可以修改连接字符串来连接其他类型的数据库,如PostgreSQL、SQLite等。 常用操作 一旦连接成功,你可以执行诸如“插入记录” 、“更新记录”、“删除记录”、“查询记录”等数据库操作。下面是一些常用的操作: - 插入记录 ``` python table = db['my_table'] table.insert({'name': 'test', 'age': 18}) ``` 在这个例子中,我们打开一个名为“my_table”的表,并插入一个名为“test”、年龄为18岁的记录。 - 更新记录 ``` python table = db['my_table'] table.update({'name': 'test'}, {'age': 20}) ``` 这个例子将更新“my_table”表中名为“test”的记录的年龄为20岁。 - 删除记录 ``` python table = db['my_table'] table.delete(name='test') ``` 这个例子将删除“my_table”表中所有名为“test”的记录。 - 查询记录 ``` python table = db['my_table'] results = table.find(name='test') ``` 这个例子将查询“my_table”表中所有名为“test”的记录,并将结果存储在变量results中。你还可以使用其他条件来查询记录。 总结 dataset模块是处理关系型数据库的一个轻量级接口,它大大简化了Python代码与数据库的交互。通过连接、插入、更新、删除、查询等常规操作,你可以快速地对数据库进行操作。它与SQLAlchemy组合在一起使得在Python程序中使用关系型数据库变得容易而且高效。 ### 回答3: Python是一种非常流行的编程语言,因其易学易用和灵活性而受到广泛的喜爱。Python也被广泛用于数据科学领域中,主要是因为其数据分析能力和可视化工具。 在Python实现一个数据科学项目时,可能会经常使用dataset数据集dataset是一个处理关系型数据的Python库。下面我们将详细介绍如何在Python中使用dataset数据集。 首先,需要安装dataset库,这可以通过运行以下命令在命令行中完成: pip install dataset 安装完成后,我们可以从以下方式中的任何一种方式读取、写入和查询关系型数据: 1. 使用SQLite数据库。在SQLite数据库中,数据存储在本地文件系统中。 2. 使用PostgreSQL数据库。PostgreSQL是一个强大的开源数据库管理系统,可以用于管理大量关系型数据。 3. 使用MySQL或MariaDB数据库。这些数据库是另外两个常用的关系型数据库,数据库支持相应的Python库运行环境。 使用dataset库,我们可以将数据与Python对象相关联。在Python中,使用的数据通常是字典,列表或对象。通过使用dataset,可以轻松地将这些对象序列化为关系型数据,同时还可以查询和过滤数据。 例如,下面的示例代码演示了如何使用dataset创建SQLite数据库: import dataset db = dataset.connect('sqlite:///mydatabase.db') table = db['mytable'] table.insert(dict(name='John', age=25)) table.insert(dict(name='Jane', age=33)) table.insert(dict(name='Bob', age=44)) 在上面的代码中,我们定义了一个名为`mytable`的新表,然后向其添加三个用户的数据。要查询数据,可以使用where子句,例如下面的代码将查询所有年龄大于30的用户: result = table.find(age={'$gt': 30}) for item in result: print(item['name'], item['age']) 输出结果将为: Jane 33 Bob 44 在总结中,dataset是一个流行的Python库,可用于简化对关系型数据的访问和查询。使用dataset,可以轻松地将对象序列化为关系型数据,并使用简单的API从数据库中查询和过滤数据。通过使用dataset,可以提高Python数据分析的效率和灵活性。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 68
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

一个处女座的程序猿

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值