机器学习
文章平均质量分 88
Noby_Ng
这个作者很懒,什么都没留下…
展开
-
淘客消费者行为,深入分析。
1.引言1.1.目标此报告会使用Panda,Matplotlip,复购率,转化率等概念进行数据分析,并找出有趣及有价值的趋势及特点,为淘宝公司或淘宝客户带来正面的好处。1.2.流程第一步:清洗数据,将空值及相关数据特征进行删除或者替换。提高数据的准确性及方便后续的分析。第二步:数据探究及可视化。第三步,根据可视化的图进行数据分析,并找出独特及有趣的数据特征。1.3.数据解释阿里云 天池数据集https://tianchi.aliyun.com/dataset/dataDeta原创 2021-08-11 10:36:58 · 710 阅读 · 0 评论 -
深入分析泰坦尼克号分析生存率
背景泰坦尼克号:英国白星航运公司下辖的一艘奥林匹克级邮轮,于1909年3月31日在爱尔兰贝尔法斯特港的哈兰德与沃尔夫造船厂动工建造,1911年5月31日下水,1912年4月2日完工试航。 首航时间:1912年4月10日 航线:从英国南安普敦出发,途经法国瑟堡-奥克特维尔以及爱尔兰昆士敦,驶向美国纽约。 沉船:1912年4月15日(1912年4月14日23时40分左右撞击冰山) 船员+乘客人数:2224 遇难人数:1502(67.5%)目标¶建立决策树模型,按照乘客的特征预测该乘...原创 2021-08-03 22:10:00 · 4824 阅读 · 10 评论 -
泰坦尼克号生存预测-----基于决策树模型(机器学习- sklearn)
"""主要是存储本人的笔记为主,但是希望和各位进行交流""简介:该代码主要会用 train_test_split 及 cross_val_score验证模型的有效度。 此外,还会用GridSearchCV找出模型最优的参数。step 1:对数据进行处理,比如填补或者删除缺失值。此外, 决策树无法处理文字,所以,我们需要把性别(sex)及 船票号码(embark)转换数字。比如,0,1,2等无意义的数字。import pandas as pdfrom sklearn.tree impo原创 2021-07-13 12:29:49 · 2209 阅读 · 0 评论