数据库
怡宝的代言人连高波
I am LAB, the SnowWhiteprincess in BUPT
展开
-
数据预处理:标称型特征的编码和缺失值处理
标称型特征编码(Encoding categorical feature)有些情况下,某些特征的取值不是连续的数值,而是离散的标称变量(categorical)。比如一个人的特征描述可能是下面的或几种:features ['male', 'female'], ['from Europe', 'from US', 'from Asia'], ['use Firefox', 'use Chorme', 'use Safari', 'Use IE']这样的特征可以被有效的编码为整型特征值(interge转载 2020-10-20 19:57:19 · 1223 阅读 · 0 评论 -
SQOOP关系型数据收集(hdfs的使用)和linux下mysql的简单操作
linux下mysql的基本使用方法1 mysql的安装1.1、复制下载地址,得到rmp包1.2、wget+刚才复制的地址例如:若未找到wget命令,则先进行如下命令安装wget,然后再执行上述步骤:1.3、安装mysql服务器:过程中如果需要root权限,则(不要使用sudo):2 mysql的配置2.1、启动mysql2.2、查看mysql运行状态2.3、查看mysql的默认密码2.4、进入数据库2.5、登陆数据库ps:一定要加上分号2.6、修改数据库的密码原创 2020-10-17 20:30:28 · 216 阅读 · 0 评论 -
完全小白篇-用python爬取豆瓣电影影评
Python爬虫技术5天速成(2020全新合集)原创 2020-09-07 10:07:00 · 14738 阅读 · 12 评论