数据挖掘
墨禾
这个作者很懒,什么都没留下…
展开
-
数据分析
MySQL安装: pip install pymysql 创建数据库:CREATE DATABASE test; 使用数据库:USE test; 然后创建表:CREATE TABLE pages;数据表必须有一列 可以创建的字段类型有:bigint(7),varchar,timestamp 插入数据 INSERT INTO table(字段) VALUES(字段所要插入的值) 删除...原创 2018-03-19 22:18:13 · 236 阅读 · 0 评论 -
数据库mysql和sql知识笔记
show databases;显示mysql中的所有数据库。 show tabbles;显示mysql中的表。 describe 表名:显示表的的具体信息。 help show;显示help所有能用的语句。 select 列名 1,列名2 from 表名 order by 列名(desc) limit 数字 :从指定表中选择一个指定列,列名用逗号隔开。可以按列排序,desc是按降序...原创 2018-03-23 23:11:29 · 230 阅读 · 0 评论 -
类别比例严重不平衡常用处理方法
如果你研究过一点机器学习和数据科学,你肯定遇到过不平衡的类分布(imbalanced class distribution)。这种情况是指:属于某一类别的观测样本的数量显著少于其它类别。这个问题在异常检测是至关重要的的场景中很明显,例如电力盗窃、银行的欺诈交易、罕见疾病识别等。在这种情况下,利用传统机器学习算法开发出的预测模型可能会存在偏差和不准确。发生这种情况的原因是机器学习算法通常被设...转载 2018-04-09 21:52:32 · 1629 阅读 · 0 评论