自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 【无标题】

python循环赋值

2023-02-26 16:30:22 143 1

原创 Kaggle:Home Credit Default Risk(住房贷款破产风险)报告部分

项目来源:https://www.kaggle.com/c/home-credit-default-risk/overview1. Data mining objective and exploratory analysisMany people find it difficult to obtain loans because of insufficient or non-existent credit records. To evaluate whether those clients who do

2020-07-11 23:08:33 759

原创 星巴克数据库搭建(Database project for Starbucks)

Business events, business rules and EDRs(1) Stores have employees/managers.Each STORE has many EMPLOYEEs including part-time and full-time.Each EMPLOYEE can be a MANAGER or not.Each STORE has only one MANAGER.Each EMPLOYEE and MANAGER can only work.

2020-07-11 20:18:08 1075

转载 Mysql触发器before和after的区别

https://www.cnblogs.com/zejin2008/p/4643761.html总结如下:after—是在记录操纵之后触发,是先完成数据的增删改,再触发,触发的语句晚于监视的增删改操作,无法影响前面的增删改动作before—是在记录操纵之前触发,是先完成触发,再增删改,触发的语句先于监视的增删改,我们就有机会判断,修改即将发生的操作,如:我们在触发之前需要判断new值和old...

2020-07-11 19:40:54 673

原创 存储过程与控制结构

存储过程与函数的区别:存储过程是没有返回值的函数函数是有返回值的存储过程创建存储过程delimiter $create procedure procedureName()begin—sql 语句end$delimiter ;查看已有存储过程show procedure status;调用存储过程call p1();删除存储过程drop procedure p6;存储...

2020-07-11 19:39:42 249

原创 【Python】批量从doc简历中提取出需要的信息

最近帮公司HR从智联招聘下载简历录入信息,写了个小程序自动录入。第一步 把doc文件转为txt文件 因为doc文件中嵌套大量隐藏表格,超链接之类的格式,用docx这个库读取时很多信息显示不出来(也可能是我不会),就想到把doc转换为无格式的txt文件。第二步 从txt文件中提取信息 转换为txt后惊喜的发现不同文件的相同信息基本都在相同的位置,比如姓名、性别; ...

2020-03-14 16:52:28 2114 1

原创 【爬虫基础】jQuery信息在url中是个啥

我也不知道。。。。。。但有了jQuery,无法解析并提取信息。解决方式:http://push2.eastmoney.com/api/qt/clist/get?pn=2&pz=50&po=1&np=1&ut=b2884a393a59ad64002292a3e90d46a5&fltt=2&invt=2&fid0=f4001&fid...

2020-02-28 21:54:02 388

原创 【爬虫基础】爬取学校官网分页招聘信息

**爬取某学校就业网站招聘信息**用到的包from urllib.request import urlopenimport requestsimport json一、获取不同页面的url在页面点击F12,通过network中获取不同网页的url,观察区别1st page:Request URL: http://job.ustb.edu.cn/front/zp_query/zp...

2020-02-28 21:24:01 2429

转载 集成学习

Bagging,Boosting以及Stacking(1)Bagging + 决策树 = 随机森林(2)AdaBoost + 决策树 = 提升树(3)Gradient Boosting + 决策树 = GBDT一、Boosting1)Adaboosthttps://www.cnblogs.com/willnote/p/6801496.html2)Gradient Boostingh...

2020-01-18 17:46:48 98

原创 数据预处理方法

数据导入初步看变量间的关系可视化,facetgrid删除多于列从现有列中提取有用信息,可能使用到正则表达式将categorical变成ordinal (map,labelEcoder,get_dummies)处理缺失值*1) random number 代替2)同类的均值、中位数代替# 对于train_df和test_df的同时修改,可以建li...

2020-01-16 21:00:08 167

原创 约分

约分成整数(非四舍五入)int()约分成最近的0.5int(number/ 0.5 + 0.5)* 0.5

2020-01-16 17:18:09 251

原创 select标量子查询的别名问题

# 13. 按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩select a.*, (select score from sc b where cid=01 and b.sid = sc.sid) as 01_score,(select score from sc b where cid =02 and b.sid = sc.sid) as 02_score,(select sc...

2019-12-20 13:46:27 365

原创 别名不能直接做where和group by后的查询条件,但order by 可以用别名

select a.*,b.score as 01_score from student a left join SC b on a.Sid = b.Sidwhere Cid = 01 and b.score < 60 order by 01_score desc;该句可以正常运行。where 后面不可以用重命名后的列名(01_score), 而order by后面可以用。如果是...

2019-12-20 13:24:37 898

原创 MySQL子查询from和select型子查询的疑惑

各种子查询http://www.5idev.com/p-mysql_exists_subquery.shtmlhttps://www.cnblogs.com/zhazhaacmer/p/9858256.html关于标量子查询的疑惑点:标量子查询:只查询出一行一列。理解为每行只能查出一列。select:子查询给每行查出一个结果where:子查询一般只查出一个值例子:select子查询...

2019-12-19 16:42:27 691

原创 清洗数据时怎么把non-numerical变成numerical

get_dummies 会生成n-1个虚拟变量e.g. pd.get_dummies(data)LabelEcodertitle_mapping = {“Mr”: 1, “Miss”: 2, “Mrs”: 3, “Master”: 4, “Rare”: 5}for dataset in combine:dataset[‘Title’] = dataset[‘Title’].map(tit...

2019-12-16 21:18:10 166

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除