- 博客(21)
- 资源 (1)
- 收藏
- 关注
原创 【kaggle比赛记录】SHOPPE商品分类多模态分析
文本方向处理TFIDF这个方法就是一个统计词频加逆文档频率的统计学方法,来找出最能代表一篇文章的一组关键词。sklearn提供了包来进行词汇的向量化,向量化之后的词汇向量组大小是 (34250个样本, 32324词汇)。from sklearn.feature_extraction.text import TfidfVectorizermodel = TfidfVectorizer(stop_words=None, binary=True, max_features=55000, use_idf=T
2021-05-17 14:47:48 1960
原创 【错误处理】‘PIL.Image‘ has no attribute ‘register_extensions‘ matplotlib引用错误
相信很多初学CV方向的小伙伴都会在安装环境上出现问题尤其是这个:'PIL.Image' has no attribute 'register_extensions' 提示你更新 Pillow 的版本,可是更新完之后要么出现py3文件缺失,要么还有这个问题。解决方法是直接使用 pip install pillow==4.1.1 安装老版本pillow,最后会告诉你这个版本已经过时了ERROR: pip's dependency resolver does not currently take i
2021-04-01 18:08:10 1291 1
原创 【OCR文章】CRNN 端到端可训练神经网络对于OCR的应用
CRNN 端到端可训练神经网络对于OCR的应用背景论文photoOCR: reading text in uncontrolled conditionsreading text in the wild with convolutional neural networksa novel connectionist system for unconstrained handwriting recongnitionword spotting and recognition with embedded attrib
2021-03-29 22:31:09 1036
原创 【kaggle比赛记录】Bristol-Myers Squibb – Molecular Translation
这个比赛是将分子结构式的纸质版扫描图片转换成InChl标准化学文字。比赛的内容跟我的专业相近,而且有50000奖金(拿是不可能拿到的),所以就报名参加了,记录一下这个项目的开发过程吧!查阅文献后,其实化学式ORC已经是一个被研究很久的课题了,但拿最新的ORC引擎去解析数据集中给的化学式扫描图时(mol2D图)效果却非常的差。很明显,这是由于图片质量过差。要解决这个问题,可以利用传统CV定位图片位置加锐化等等来正则化图片,也可以用Resnet等模型直接把问题转化成图像修复,只要我们有修复过图像的数据集。这
2021-03-22 14:52:50 597 1
原创 【MySQL学习】管理事务处理
管理事务处理控制事务处理使用ROLLBACK使用COMMIT使用保留点更改默认的提交行为并非所有的引擎都支持事务处理,其中MyISAM 和 InnoDB 是两种最常使用的引擎。前者不支持明确的事务处理管理,而后者支持。所以之前我们的例子都使用 InnoDB 而不是更经常使用的 MyISAM 。如果你的应用中需要事务处理功能,则一定要使用正确的引擎类型。事务处理(transaction processing)可以用来维护数据库的完整性,他保证成批的MySQL操作完全执行或者完全不执行。这个功能是因为数据
2021-03-22 14:51:20 160
原创 【MySQL学习】全球化和本地化
字符集和校对顺序数据库表被用来存储和检索数据。不同的语言和字符集需要以不同的方式存储和检索。因此,MySQL需要适应不同的字符集(不同的字母和字符),适应不同的排序和检索数据的方法。在讨论多种语言和字符集时,将会遇到以下重要术语:字符集为字母和符号的集合;编码为某个字符集成员的内部表示;校对为规定字符如何比较的指令。使用字符集和校对顺序使用 SHOW CHARACTER SET; 查看所有支持的字符集使用 SHOW COLLATION; 查看所支持校对的完整列表。有的字符集具有不止一种校对
2021-03-22 14:50:35 111
原创 【数据结构和算法】数据结构和时间空间复杂度
数据结构分为逻辑结构和物理结构逻辑结构有集合结构:集合结构中的数据元素除了同属一个集合之外,他们之间没有其他的关系线性结构:线性结构中数据元素是一对一的关系树形结构:树形结构中的数据元素存在一对多的层次关系图形结构:图形结构的数据元素是多对多的关系物理结构有顺序储存:把数据元素存放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的链式存储:是把数据元素存放在任意的存储单元里面,这组存储单元可以是连续的,也可以是不连续的时间复杂度有:O(1) 、O(n) 、O(logn)
2021-03-22 14:49:45 109
原创 【MySQL学习】安全管理
获得所有用户账号列表:USE mysql;SELECT user FROM user;创建用户账号CREATE USER joshua IDENTIFIED BY '12211221'删除用户账号DROP USER joshua查看权限SHOW GRANTS FOR joshua设置访问权限--database 指特定的表GRANT SELECT ON database.* TO joshua表示允许用户在这个数据库 SELECT 访问,也就是只读。使用 GRANT 的反
2021-03-12 21:20:27 95
原创 【MySQL学习】使用视图、存储过程、游标和触发器
视图、储存过程、游标和触发器视图存储过程为什么要使用存储过程使用存储过程执行存储过程创建存储过程删除存储过程使用参数建立智能存储过程检查存储过程游标使用游标使用游标数据触发器MySQL 5添加了对视图、存储过程、游标和触发器的支持,因此,本文内容适用于MySQL 5及以后的版本。视图其实就是封装的图表使用方法视图是虚拟的表。与包含数据的表不一样,视图只包含使用时动态检索数据的查询。理解视图的最好方法是看一个例子。我们之前用 SELECT 语句从三个表中检索数据。SELECT cust_name,
2021-03-11 17:10:10 1147
原创 【MySQL学习】创建表和操作表
创建表和操作表真的很建议这部分去看《MySQL必知必会》,我仅简单总结一下知识点。现在我们通常用脚本来创建数据库,同时也有具有有交互式创建和管理表的工具,不过我们也应该了解一下利用MySQL语言如何创建并操纵表。给出几个关键语句语句功能描述CREATE TABLE创建表NULL值空值PRIMARY KEY主键AUTO_INCREMENT自动编号DEFAULT默认值ENGINE = InnoDB引擎类型ALTER TABLE更新表
2021-03-10 12:33:05 183 1
原创 【MySQL学习】数据操作(插入、更新和删除)
数据操作数据插入插入完整的行插入多个行插入检索出的数据更新数据删除数据数据插入INSERT 是用来插入(或添加)行到数据库表的。插入可以用几种方式使用:插入完整的行;插入行的一部分;插入多行;插入某些查询的结果。插入完整的行把数据插入表中的最简单的方法是使用基本的 INSERT 语法,它要求指定表名和被插入到新行中的值。下面举一个例子:INSERT INTO CustomersVALUES(NULL,'Pep E. LaPew','100 Main Street','Los A
2021-03-09 23:24:47 765 1
原创 【MySQL】全文本搜索
全文本搜索启用全文本搜索支持进行全文本搜索使用扩展查询布尔文本搜索全文本搜索的使用说明MySQL支持几种基本的数据库引擎。并非所有的引擎都支持的全文本搜索。两个最常使用的引擎为 MyISAM 和 InnoDB ,前者支持全文本搜索,而后者不支持。这就是为什么虽然本书中创建的多数样例表使 用 InnoDB ,而 有一个样例表( productnotes 表)却使用 MyISAM 的原因。如果你的应用中需要全文本搜索功能,应该记住这一点。虽然 LIKE 关键字和正则表达式在匹配功能上已经非常有用,但存在几个
2021-03-09 22:30:11 235
原创 【MySQL学习】组合查询
我们可以使用 UNION 语句来一次性返回多个 SELECT 语句,这种查询通常称为并(union)或者复核查询(compound query)有两种基本情况,我们需要用到组合查询:在单个查询中从不同的表返回类似结构的数据对单个表执行多个查询,按单个查询返回数据。多数情况下,组合相同表的两个查询完成的工作与具有多个 WHERE 子句条件的单条查询完成的工作相同。换句话说,任何具有多个 WHERE 子句的 SELECT 语句都可以作为一个组合查询给出,在以下段落中可以看到这一点。这两种技术在不同的
2021-03-09 11:00:34 282 1
原创 【MySQL学习】重要功能-联结表和高级联结
联结表和高级联结联结表联结为什么要使用联结创建联结内部联结多表联结高级联结创建联结表SQL最强大的功能之一就是能在数据检索查询的执行中联结(join)表。联结是利用SQL的 SELECT 能执行的最重要的操作,很好地理解联结及其语法是学习SQL的一个极为重要的组成部分。在能够有效地使用联结前,必须了解关系表以及关系数据库设计的一些基础知识。下面的介绍并不是这个内容的全部知识,但作为入门已经足够了。联结为了节省储存空间,我们使用联结表尽量避免同样的信息出现多次。使用书中的表举个例子:假如有一个包
2021-03-08 17:05:42 279 1
原创 【MySQL学习】分组数据,使用子查询
【MySQL学习】分组数据,使用子查询分组数据数据分组创建分组过滤分组分组和排序SELECT字句顺序使用子查询使用子查询进行过滤作为计算字段使用分组数据介绍两个新的SELECT 语句字句,分别是GROUP BY 和 HAVING。数据分组之前我们介绍过使用聚集函数汇总数据,比如对1003供应商进行汇总SELECT COUNT(*) AS num_prodsFROM productsWHERE vend_id =1003;说明这个供应商提供7个产品+-----------+| num_p
2021-03-05 23:49:47 462
原创 【MySQL学习】组合聚集函数
聚集函数运行在行组上,计算和返回单个值的函数。说明函数返回列的平均值AVG()返回行数COUNT()返回最大值MAX()返回最小值MIN()返回和SUM()聚集不同值注意,这个功能仅仅在MySQL5中有。上面的五个聚集函数都可以如下使用:对所有的行执行计算,指定ALL参数或者不给参数只包含不同的值,指定 DISTINCT 参数...
2021-03-05 15:50:33 218 2
原创 【MySQL学习】使用数据处理函数
函数大多数SQL实现支持以下类型的函数。用于处理文本串,比如删除或者填充值,转换至为大写小写,的文本函数用于数值数据上的算术操作用于处理日期和时间并提取特定成分的日期时间函数返回DBMS正是用的特殊信息,比如用户的登录信息,检查版本细节的系统函数文本处理函数说明函数大写函数Upper()返回左边的字符Length()返回串长度Locate()找出子串Locate()变小写Lower()返回串右边的字符Right()去掉串左
2021-03-03 18:23:26 135 1
原创 【MySQL学习】创建计算字段
【MySQL学习】创建计算字段计算字段拼接字段计算字段储存在数据库表中的数据一般不是应用程序所需要的格式,下面举几个例子:如果想在一个字段中既显示公司名,又显示公司的地址,但这两个信息一般包含在不同的表列中。城市、州和邮政编码存储在不同的列中(应该这样),但邮件标签打印程序却需要把它们作为一个恰当格式的字段检索出来。列数据是大小写混合的,但报表程序需要把所有数据按大写表示出来。物品订单表存储物品的价格和数量,但不需要存储每个物品的总价格(用价格乘以数量即可)。为打印发票,需要物品的总价格。需
2021-03-03 15:15:28 381
原创 【MySQL学习】使用正则表达式进行搜索
简介如果通配符无法满足你的匹配要求,那么就要尝试正则表达式了。所有种类的程序设计语言、文本编辑器、操作系统等都支持正则表达式。MySQL中的正则表达式仅仅为正则表达式语言的子集,下面我们来了解几种常见的正则表达式。使用MySQL正则表达式正则表达式搜索依然需要WHERE字句的支持,它允许你制定正则表达式,过滤SELECT检索出的数据。基本字符匹配下面语句检索列 prod_name 包含文本 1000 的所有行:SELECT prod_nameFROM productsWHERE prod_n
2021-03-02 23:07:01 275
原创 【MySQL学习】使用通配符进行过滤
【MySQL学习】使用通配符进行过滤简介LIKE操作符百分号(%)通配符下划线(_)通配符简介通配符(wildcard) 是用来匹配值的一部分的特殊字符。搜索模式(search pattern) 是由字面值、通配符或者两者组合构成的搜索条件。本文介绍如何使用通配符以及怎样使用LIKE操作符进行统配搜索,方便对数据进行复杂过滤。LIKE操作符通配符本身实际是 SQL 的 WHERE 子句中含有特殊意义的字符。我们可以使用LIKE操作符来合法化这些字符。百分号(%)通配符在搜索串中,% 表示
2021-02-23 22:19:40 117
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人