数据爬虫&数据分析&数据挖掘
文章平均质量分 93
保护我方鲁班七号
机器学习、深度学习、自然语言处理从业者
展开
-
机器学习项目处理流程方法论
一、问题分析将问题抽象成模型,这是一个什么问题(分类、聚类、回归?),使用什么模型1、明确分析目的,在开展项目之前,问清楚:问题背景:为什么开展这个项目/数据分析/分析需求?为了解决什么问题? 业务场景:做这个是用在哪里?干什么的? 问题结果:通过这个项目/数据分析需要我解决什么问题? 问题方案:思考怎么做2、确定分析思路,梳理分析思路,搭建分析框架,把分析目的分解成若干个不同的分析要点,即如何具体展开数据分析,需要从那几个角度进行分析,采用哪些分析指标。 最后还要确保分析框架的体系化,原创 2021-02-18 13:59:50 · 465 阅读 · 0 评论 -
AI工程师技术学习进阶指南
数学基础微积分《北京大学高等数学B》线性代数北京大学出版社,《线性代数简明教程》 MIT 的线性代数公开课概率论与数理统计李航《统计学习方法》朴素概率论钟开来概率论朴素统计学理论北京大学出版社,《概率论与数理统计下册》 北京大学出版社,《多元统计》 Wasserman所著《All of Statistics》朴素优化理论Boyd和Vandenberghe所著《Convex Optimization》编程基础编程语言(至少熟悉1+)《集体智慧编程》..原创 2021-02-18 11:55:28 · 496 阅读 · 0 评论 -
数据分析师必备技能之PowerBI教程
通过动手实践一些教程,总结一些经验。参考1、干货合辑 | 最全的PowerBI教程,都在这里了2、干货 | 无需企业邮箱,免费可发布到Web的Power BI账户注册秘籍原创 2020-09-23 11:22:42 · 8284 阅读 · 0 评论 -
用户画像如何构建
看到了一系列搭建用户画像的文章,但没有形成专栏,在此博客收藏整理,方便以后使用。 用户画像(一)|计划制定 用户画像(二)|为“一面APP”数据建模 用户画像(三)|通过用户对不同文章的不同行为(浏览、点赞、评论、分享)提取用户标签 爬取简书百万页面 分析简书用户画像...原创 2019-01-10 17:06:47 · 488 阅读 · 0 评论 -
python爬取新浪微博大V的所有微博内容
相关github地址:https://github.com/KaguraTyan/web_crawler一般做爬虫爬取网站时,首选的都是m站,其次是wap站,最后考虑PC站,因为PC站的各种验证最多。当然,这不是绝对的,有的时候PC站的信息最全,而你又恰好需要全部的信息,那么PC站是你的首选。一般m站都以m开头后接域名, 我们这次通过m.weibo.cn去分析微博的HTTP请求。准备工作...原创 2019-01-09 17:15:24 · 10121 阅读 · 24 评论