大邓和他的Python

内容涵盖python爬虫、文本数据编码、(文本)数据分析、金融量化、机器学习和深度学习
私信 关注
邓旭东HIT
码龄4年

python大法好

  • 157,260
    被访问量
  • 128
    原创文章
  • 43,545
    作者排名
  • 208
    粉丝数量
  • 于 2017-03-21 加入CSDN
获得成就
  • 获得154次点赞
  • 内容获得85次评论
  • 获得841次收藏
荣誉勋章
兴趣领域
  • #人工智能
    #Python
TA的专栏
  • python
    1篇
  • R
  • 文本分析
    1篇
  • 网络爬虫
    1篇
  • 数据分析
  • 可视化
  • 最近
  • 文章
  • 资源
  • 问答
  • 课程
  • 帖子
  • 收藏
  • 关注/订阅

2021寒假赋能!Python网络爬虫与文本分析直播课

Python网络爬虫与文本分析课在过去的两年间,Python一路高歌猛进,成功窜上“最火编程语言”的宝座。惊奇的是使用Python最多的人群其实不是程序员,而是数据科学家,尤其是社会科学家...
原创
167阅读
2评论
1点赞
发布博客于 27 天前

akshare库 | A股股票价格指数数据获取

腾讯课堂 | Python网络爬虫与文本分析(戳一戳)~~A股函数类型功能ak.stock_sse_summary()数据总貌当日上海证券交易所-股票数据总貌ak.stock_szse_...
原创
637阅读
0评论
0点赞
发布博客于 2 月前

akshare库 | 初识Python金融经济大数据库

腾讯课堂 | Python网络爬虫与文本分析(戳一戳)~~AkShare是基于 Python 的财经数据接口库, 目的是实现对股票、期货、期权、基金、外汇、债券、指数、加密货币等金融产品...
原创
213阅读
0评论
0点赞
发布博客于 2 月前

pdf2docx库 | 转文件格式,支持抽取文件中的表格数据

腾讯课堂 | Python网络爬虫与文本分析(戳一戳)~~今天在知乎看到如何免费地、完整地把 PDF 转换为 Word?近几年【pdf转word】在百度指数中呈上升趋势,由于pdf文件本...
原创
92阅读
0评论
0点赞
发布博客于 2 月前

爬虫实战 | 采集&可视化知乎问题的回答

腾讯课堂 | Python网络爬虫与文本分析(戳一戳)~~问题链接https://www.zhihu.com/question/432119474/answer/1597194524爬...
原创
77阅读
0评论
0点赞
发布博客于 3 月前

实操 | 复习Pandas一些常用操作

腾讯课堂 | Python网络爬虫与文本分析我挺喜欢看B站up主-老师好我叫何同学 , 所以今天就用bsite库采集一下何同学的视频信息及评论数据,每个视频的评论以csv文件存储于dat...
原创
129阅读
0评论
0点赞
发布博客于 4 月前

pyttsx3库 | 2行代码将文本转音频

腾讯视频 | Python网络爬虫与文本分析pyttsx3简介pyttsx3是一个款将文本转为语音的Python包,不同于其他Python包,pyttsx3真的可以文本转语音。安装pip...
原创
191阅读
0评论
0点赞
发布博客于 4 月前

bsite库 | 采集B站视频信息、评论数据

腾讯课堂 | Python网络爬虫与文本数据分析一、简介bsite是用于采集B站用户视频列表页、视频评论数据的python包。二、安装pipinstallbsite三、使用方法3...
原创
687阅读
2评论
10点赞
发布博客于 4 月前

五步写爬虫 | 采集大众点评数据采集实战

腾讯课堂 | Python网络爬虫与文本数据分析任务采集 http://www.dianping.com/shanghai/hotel爬虫设计阶段类型问题需要做到1请求网页数据在哪里?发...
原创
782阅读
0评论
9点赞
发布博客于 4 月前

40000字 Matplotlib 实操干货,真的全!

预备通知 | Python数据挖掘与Stata应用能力提升与实证前沿国庆工作坊导读Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出...
转载
38阅读
0评论
0点赞
发布博客于 5 月前

带你来看全国3000所高等院校分布

截至2020年6月30日,全国高等学校共计3005所,其中:普通高等学校2740所,含本科院校1272所、高职(专科)院校1468所;成人高等学校265所。本名单未包含港澳台地区高等学校...
转载
619阅读
0评论
1点赞
发布博客于 5 月前

用Python分析18万条《八佰》影评,看看观众怎么说?

腾讯课堂 |Python网络爬虫与文本分析大家好,我是J哥。最近《八佰》这部电影比较火,上映仅15天就已斩获22亿票房。对于沉寂了半年、影院上座率仍限定在50%的电影市场而言,这样的成...
转载
370阅读
0评论
0点赞
发布博客于 5 月前

实战|手把手教你用Python爬虫(附详细源码)

腾讯课堂 |Python网络爬虫与文本分析大家好,我是J哥,专注原创,致力于用浅显易懂的语言分享爬虫、数据分析及可视化等干货,希望人人都能学到新知识。最近J哥做了个爬虫小项目,感觉还挺...
转载
738阅读
1评论
0点赞
发布博客于 5 月前

Pandas学习笔记之时间序列总结

早起导读:pandas是Python数据处理的利器,时间序列数据又是在很多场景中出现,本文来自GitHub,详细讲解了Python和Pandas中的时间及时间序列数据的处理方法与实战,建...
转载
352阅读
0评论
0点赞
发布博客于 5 月前

微信群总是有人发广告?看我用Python写一个自动化机器人消灭他!

预备通知 | Python数据挖掘与Stata应用能力提升与实证前沿国庆工作坊序幕 微信群牛皮癣,指的是在微信群里毫无下限的群发小广告的用户,是微信群主最痛恨的一波人。如果熟悉早起的读者...
转载
163阅读
0评论
0点赞
发布博客于 5 月前

大厂热门工具限时免费学:玩转数据分析一个操作就跪了!

科技飞速发展的今天,企业对候选人有了新的更高要求,如市场、运营等必须会Python、Sql,面试常问诸如用户漏斗等考察数据分析能力。可以说,懂数据的人会更有竞争力通过面试。而市场上,专业...
转载
34阅读
0评论
0点赞
发布博客于 5 月前

预备通知 | Python数据挖掘与Stata应用能力提升与实证前沿国庆工作坊

培训大纲开班时间10月1-2日(模块Ⅰ:Python数据挖掘)10月3-8日(模块Ⅱ:Stata 应用能力提升与实证前沿)模块I:邓旭东:python 语法入门、数...
转载
84阅读
0评论
0点赞
发布博客于 6 月前

数据可视化 | Pandas vs Plotnine

腾讯课堂 |Python网络爬虫与文本分析使用Pandas和plotnine可视化数据目标:学会使用pandas内置的作图功能使用pands作散点图和直方图?使用plotnine定制一...
原创
98阅读
0评论
0点赞
发布博客于 6 月前

「Python ​正则」使用专题总结

腾讯课堂 |Python网络爬虫与文本分析我的施工之路1我的施工计划2数字专题3字符串专题4列表专题5流程控制专题6编程风格专题7函数使用8面向对象编程(上篇)9面向对象编程(下篇)1...
转载
131阅读
0评论
0点赞
发布博客于 6 月前

reticulate包 | 在Rmarkdown中调用Python代码

腾讯课堂 |Python网络爬虫与文本分析Python和R是一对数据科学两大语言,在互联互通的路上,我感觉R更加的积极。还记得之前 Python中调用R的库-rpy2, 在Python...
原创
510阅读
0评论
0点赞
发布博客于 6 月前

tidytextpy包 | 对《三体》进行情感分析

腾讯课堂 |Python网络爬虫与文本分析TidyTextPy前天我分享了tidytext | 耳目一新的R-style文本分析库但是tidytext不够完善,我在tidytext...
原创
657阅读
0评论
2点赞
发布博客于 6 月前

tidytext | 耳目一新的R-style文本分析库

腾讯课堂 | Python网络爬虫与文本分析tidytext是R语言的文本分析包,一般数据会整理为dataframe,每行都是由docid-word-freq组成。有一本R语言的文本挖掘...
原创
368阅读
0评论
0点赞
发布博客于 6 月前

plydata库 | 数据操作管道操作符>>

腾讯课堂 | Python网络爬虫与文本分析plydata是一个提供数据处理语法的Python库,借鉴了R语言dplyr,tidyr和forcats等包中的管道操作符。plydata使用...
原创
211阅读
0评论
0点赞
发布博客于 6 月前

2020年,学会Python这项技能真的很重要!

前不久教育界的一个消息,引发了广泛的关注。今年9月,浙江三到九年级信息技术课将替换新教材,八年级将新增Python课程内容。新高一信息技术编程语言由VB替换为Python,大数据、人工智...
转载
135阅读
0评论
0点赞
发布博客于 6 月前

rpy2库 | 在jupyter中调用R语言代码

在数据分析中,Python和R各有千秋,虽然Python或R都能在数据分析打通关,从采集、清洗(预处理)、分析、可视化,但是在不同的环节,不同的语言易用程度不同。Python胜在干脏活累...
原创
233阅读
0评论
0点赞
发布博客于 6 月前

使用Jupyter Book发布自己的网页版代码书

使用Jupyter Book发布自己代码书的网页版Jupyter Book是一个快速搭建在线书籍、网站、文档的开源框架。Jupyter Book开源能什么?支持用Markdown撰写出版...
原创
172阅读
0评论
0点赞
发布博客于 6 月前

七夕礼物 | 全网最火的钉子绕线图制作教程

最近在抖音经常看到这类视频,仔细一想,也对七夕快到了,男同胞们该准备给小姐姐送小礼物了,大邓提前给大家分享一个idea-制作钉子绕线画教程,制作步骤如下打开StringArtGenera...
原创
1104阅读
2评论
3点赞
发布博客于 6 月前

原理+代码|Python基于主成分分析的客户信贷评级实战

前言大样本的数据集固然提供了丰富的信息,但也在一定程度上增加了问题的复杂性。如果我们分别对每个指标进行分析,往往得到的结论是孤立的,并不能完全利用数据蕴含的信息。但是盲目的去减少我们分析...
转载
322阅读
0评论
0点赞
发布博客于 6 月前

Python已经世界第一了,听说你还不会?

2020年,Python可学吗?答案是可。近些年,Python 的火热有目共睹,作为一种功能强大的高级编程语言,在2018 年的时候它的流行程度就得到了大幅提高。Stack Overfl...
转载
101阅读
0评论
0点赞
发布博客于 6 月前

干货!4个高质量数据分析实战项目分享

如今,全球早已步入数据时代,随着行业的高速发展,相关岗位缺口已超150万,且薪资超同行业50%。未来十年,数据细分岗位将扩张5倍,各行业数据人才缺口明显。很多人想抓住机遇进入数据分析行业...
转载
142阅读
0评论
0点赞
发布博客于 6 月前

原理+代码|手把手教你使用Python实战反欺诈模型

本文将基于不平衡数据,使用Python进行反欺诈模型数据分析实战,模拟分类预测模型中因变量分类出现不平衡时该如何解决,具体的案例应用场景除反欺诈外,还有客户违约和疾病检测等。只要是因变量...
转载
103阅读
0评论
0点赞
发布博客于 6 月前

爬虫小案例 | 批量查询地址经纬度信息

如何批量查询地址经纬信息?抓包打开https://jingweidu.51240.com/F12键(mac电脑快捷键option+command+I)打开开发者工具Network面板搜索...
转载
427阅读
0评论
0点赞
发布博客于 6 月前

爬取B站20万+条弹幕,我学会了如何成为B站老司机

本文含3420字,27图表截屏建议阅读10分钟前言B站(哔哩哔哩)是国内知名的视频弹幕网站,也是中国最大的年轻人聚集地之一,想要知道B站弹幕爱刷什么梗?不同分区UP主弹幕各有什么...
转载
498阅读
0评论
2点赞
发布博客于 7 月前

如何准备年薪20w+数据岗面试? 摘要:提升面试通过率~

科技飞速发展的今天,企业对候选人有了新的更高要求,如市场、运营等必须会Python、Sql,面试常问诸如用户漏斗等考察数据分析能力。可以说,懂数据的人会更有竞争力通过面试。而市场上,专业...
转载
49阅读
0评论
0点赞
发布博客于 7 月前

免费直播 | 90分钟带你初探Python,一行代码实现7个趣味功能

Python自带明星属性,并且入门容易、语法简单、应用广泛,容易看到实际效果。慕课网特意为对Python感兴趣对同学开展一场免费的直播,【90分钟带你初探Python,一行代码实现7个...
转载
98阅读
0评论
0点赞
发布博客于 7 月前

R语言 | 向量化操作purrr包

Python网络爬虫与文本数据分析在不少实际问题中有许多具有规律性的重复操作,因此在程序中就需要重复执行某些语句。问题比如有一个序列ns,现在想得到res,让ns中每一个数字变为平方数,...
原创
452阅读
0评论
0点赞
发布博客于 7 月前

R语言 | 词频统计

Python网络爬虫与文本数据分析本章内容导入停用词读数据,分词剔除停用词导入停用词表library(dplyr)stopwords<-readtext::readtext(...
原创
611阅读
0评论
0点赞
发布博客于 7 月前

R语言 | 制作词云图

Python网络爬虫与文本数据分析wordcloud2文档https://github.com/lchiffon/wordcloud2安装install.packages("w...
原创
381阅读
0评论
0点赞
发布博客于 7 月前

Pingouin: 基于pandas和numpy的统计包

Python网络爬虫与文本数据分析pingouin是基于Pandas和numpy开发的Python3统计包。主要统计功能有方差分析多元线性回归中介效应分析卡方检验Q-Q图贝叶斯因子信效度...
原创
252阅读
0评论
0点赞
发布博客于 7 月前

R语言 | 数据操作tidyr包

[更新~]Python网络爬虫与文本数据分析tidyr包类似于上图成行成列的表数据是干净数据(tidy data),一般每一行表示一条观测记录,每一列表示一个字段(变量)tidyr包是...
原创
577阅读
0评论
3点赞
发布博客于 7 月前

R语言 | jiebaR中文分词包

[更新~] Python网络爬虫与文本数据分析jiebaR中文与英文做文本分析很多时候会多一个分词步骤,因为默认情况下,文本分析软件会默认用空格作为分隔符处理文本,所以很多软件需要先将中...
原创
232阅读
0评论
1点赞
发布博客于 7 月前

R语言 | 数据操作dplyr包

[更新~] Python网络爬虫与文本数据分析公众号只带着Python字眼,却分享着R语言,不务正业,任性了~dplyr简介dplyr是R语言的数据分析包,很像python中的panda...
原创
413阅读
0评论
1点赞
发布博客于 7 月前

R语言 | 读写txt、csv、excel文件

[更新~] Python网络爬虫与文本数据分析前段时间看到plotnine库(封装的R语言ggplot2)作的图太美了,有点想重新拾起R语言^_^R语言代码略带凌乱,讲真的还是更喜欢Py...
原创
548阅读
0评论
0点赞
发布博客于 7 月前

最全总结!聊聊 Python 发送邮件的几种方式

[更新~] Python网络爬虫与文本数据分析1. 前言邮件,作为最正式规范的沟通方式,在日常办公过程中经常被用到我们都知道 Python内置了对 SMTP 的支持,可以发送纯文本、富文...
转载
114阅读
0评论
0点赞
发布博客于 7 月前

如何在科研论文中画出漂亮的插图?

[视频课] Python网络爬虫与文本数据分析本文整理自知乎问答,仅用于学术分享,著作权归作者所有。如有侵权,请联系后台作删文处理。编译:极市平台方法一作者|冯昱尧https://www...
转载
160阅读
0评论
0点赞
发布博客于 7 月前

可视化工具不知道怎么选?深度评测5大Python数据可视化工具

[视频课] Python网络爬虫与文本数据分析相信很多读者学习Python就是希望作出各种酷炫的可视化图表,当然你一定会听说过Matplotlib、Pyecharts、Seaborn、P...
转载
252阅读
0评论
0点赞
发布博客于 7 月前

[更新] Python网络爬虫与文本数据分析

课程章节:python语法入门python网络爬虫数据分析新增初识文本分析文本分析与机器学习课程介绍在过去的两年间,Python一路高歌猛进,成功窜上“最火编程语言”的宝座。惊奇的是使...
转载
193阅读
0评论
1点赞
发布博客于 7 月前

Python网络爬虫免费学

课程介绍在过去的两年间,Python一路高歌猛进,成功窜上“最火编程语言”的宝座。惊奇的是使用Python最多的人群其实不是程序员,而是数据科学家,尤其是社会科学家,涵盖的学科有经济学、...
转载
185阅读
1评论
0点赞
发布博客于 7 月前

一起支持南方受灾地区

最近南方水灾,看到很多受灾画面,有些感触,我发起了目标2000元的一起捐,想跟大家一起捐款支持一下受灾地区。我捐500元算我替大家一起捐的,毕竟从公众号中获得的收益都是大家支持的带来的;...
转载
71阅读
0评论
0点赞
发布博客于 7 月前

2500字 字符串专题总结

我的完整施工计划这篇是字符串专题总结除了常见的数值型,字符串是另一种常遇到的类型。一般使用一对单引号或一对双引号表示一个字符串。字符串中如果遇到 \ 字符,可能是在做字符转义,所谓的转义...
转载
91阅读
0评论
0点赞
发布博客于 7 月前

4300 字Python列表使用总结,用心!

我的完整施工计划列表基础1 创建列表2 访问元素3 添加元素4 删除元素5 list 与 in6 list 与数字7 列表生成式列表进阶8 其他常用API9 列表实现栈10 列表包含自身...
转载
83阅读
0评论
0点赞
发布博客于 7 月前

3800 字 Python 流程控制专题总结

我的完整施工计划已完成专题:1.我的施工计划2.数字专题3.字符串专题4.列表专题今天流程控制专题流程控制与代码的执行顺序息息相关,流程控制相关的关键字,如if,elif,for,wh...
转载
72阅读
0评论
0点赞
发布博客于 7 月前

13个Pandas奇技淫巧

来源:风控猎人归纳整理了一些工作中常用到的pandas使用技巧,方便更高效地实现数据分析。1.计算变量缺失率df=pd.read_csv('titanic_train.csv&#...
转载
89阅读
0评论
0点赞
发布博客于 7 月前

怎样用“python快速入门数据分析?

福报!廖雪峰大佬最新打磨的《优秀数据分析师炼成记》首次公开了,这套体系化的学习宝典,可帮不同阶段的数据分析人尽快摆脱工作困扰:日常困于存取、处理数据等基础工作,本部分能帮你快速掌握数据分...
转载
76阅读
0评论
0点赞
发布博客于 7 月前

免费直播!手把手教你如何构建自己的开源项目

作者 | 慕课网来源 | 慕课网20年下半场已经开启,更多企业不断提高了自己的用人标准。如果我们有了自己的开源项目,势必会给自己的简历增加更多的说服力。本次慕课网明星讲师7七月给大家带来...
转载
96阅读
0评论
0点赞
发布博客于 7 月前

如何批量更新电脑中的python包?

方法1: pip命令行切换到桌面cddesktop在桌面生成requirements.txt,该文件主要记录本地安装的包及其版本号pipfreeze>requiremen...
原创
128阅读
0评论
0点赞
发布博客于 7 月前

plotnine: Python版的ggplot2作图库

R语言的ggplot2绘图能力超强,python虽有matplotlib,但是语法臃肿,使用复杂,入门极难,seaborn的出现稍微改善了matplotlib代码量问题,但是定制化程度依...
原创
398阅读
0评论
0点赞
发布博客于 7 月前

stylecloud:简洁易用的词云库

预祝全国考生:鲤鱼跃龙门,门门考高分~stylecloud基于wordcloud库,使用方法更简单一些。该库的特点有支持词云图图标形状设置可直接读取csv文件(csv有两列,word和f...
原创
611阅读
0评论
1点赞
发布博客于 8 月前

Github上10个超好看 可视化面板,后台管理页面有着落了

作者:SevDot来源:www.jianshu.com/p/3bc7404af887Web 开发中几乎的平台都需要一个后台管理,但是从零开发一套后台控制面板并不容易,幸运的是有很多开源免...
转载
302阅读
0评论
0点赞
发布博客于 8 月前

小案例:用Pandas分析招聘网Python岗位信息

1. 读取数据 importpandasaspdimportnumpyasnpdf=pd.read_csv('data/Jobs.csv')df....
原创
445阅读
0评论
0点赞
发布博客于 8 月前

用Python绘制近20年地方财政收入变迁史视频

bar_char_race_cn库解决bar_chart_race库不支持中文的问题安装pipinstallbar_char_race_cn注意:使用前需提前安装ffmpeg使用准...
原创
322阅读
2评论
0点赞
发布博客于 8 月前

nltk.download()下载不了怎么办​??​

nltk.download()下载不了怎么办??1. 安装nltk库pip install nltk2. nltk_data.zip下载链接:https://pan.baidu.com...
原创
152阅读
0评论
0点赞
发布博客于 8 月前

Pandas也能修改样式?快速给你的数据换个Style!

前言 在之前的很多文章中我们都说过,Pandas与openpyxl有一个很大的区别就是openpyxl可以进行丰富的样式调整,但其实在Pandas中每一个DataFrame都有一个Sty...
转载
480阅读
0评论
0点赞
发布博客于 8 月前

Python3.9正式版即将发布,来看看新特性

Python 正在一直马不停蹄地更新,历时数月,我们迎来了又一个 Beta 版 —— 3.9.0b3,Python 3.9 正式版已经不远了,一起来看它带来了哪些值得开发者关注的重要新特...
转载
188阅读
0评论
0点赞
发布博客于 8 月前

pyecharts的绘图原理详解

其实学习任何一门编程语言,最重要的就是学习它的原理。今天给大家介绍的是,我认为交互效果最好的一个python绘图库pyecharts,学会了绝对不亏。1.pyecharts简介 Echa...
转载
308阅读
0评论
0点赞
发布博客于 8 月前

Python&Stata云特训今晚18:30开播~报名抓紧哦

课程概览模块Ⅰ- PythonPython语法入门、数据采集、文本分析(词典法)、文本分析进阶(机器学习)模块Ⅱ- Stata司继春:Stata基础与应用、OLS:解释与因果、面板数据分...
转载
88阅读
0评论
0点赞
发布博客于 8 月前

我用Python展示Excel中常用的20个操作

前言 Excel与Python都是数据分析中常用的工具,本文将使用动态图(Excel)+代码(Python)的方式来演示这两种工具是如何实现数据的读取、生成、计算、修改、统计、抽样、查找...
转载
339阅读
0评论
2点赞
发布博客于 8 月前

真香!安利 6 个 Python 数据分析神器

Python数据挖掘与文本分析&Stata应用能力提升与实证前沿云特训Python部分明天(6月29日-7月2日)开始上课,感兴趣的童鞋抓紧哦用Python处理数据大家都不陌生了,属常规...
转载
259阅读
0评论
0点赞
发布博客于 8 月前

《Python数据分析通关攻略.pdf 》送你!可永久阅读

Python 如今广泛地应用在数据分析领域。其具有开源免费、灵活的语法、丰富的第三方库、平缓地学习曲线等诸多优势,因而广受数据分析师的追捧。学习用 Python 做数据分析,你得到的不仅...
转载
156阅读
0评论
0点赞
发布博客于 8 月前

文本分析在经管领域中的应用概述

Python数据挖掘与文本分析&Stata应用能力提升与实证前沿云特训Python部分上课时间为6月29日-7月2日,感兴趣的童鞋欢迎关注在大数据的今天,通过互联网超文本链接,无数的个人...
原创
253阅读
0评论
0点赞
发布博客于 8 月前

R语言dplyr包实操

1. dplyr简介dplyr是R语言的数据分析包,类似于python中的pandas,能对dataframe类型的数据做很方便的数据处理和分析操作。最初我也很奇怪dplyr这个奇怪的名...
原创
478阅读
0评论
0点赞
发布博客于 8 月前

掌握这几点,轻松玩转 Bokeh 可视化

Python数据挖掘与文本分析&Stata应用能力提升与实证前沿云特训Python部分上课时间为6月29日-7月2日,感兴趣的童鞋欢迎关注本文通过一个项目案例,详细的介绍了如何从 Bok...
转载
216阅读
0评论
0点赞
发布博客于 8 月前

小案例: Pandas的apply方法

插播一条广告Python数据挖掘与文本分析&Stata应用能力提升与实证前沿云特训Python部分上课时间为6月29日-7月2日,感兴趣的童鞋欢迎关注pandas中有一个特别好用的app...
原创
175阅读
0评论
0点赞
发布博客于 8 月前

Python语法快速入门视频课程

插播一条广告Python数据挖掘与文本分析&Stata应用能力提升与实证前沿云特训Python部分上课时间为6月29日-7月2日,感兴趣的童鞋欢迎关注《Python语法快速入门》已经在B...
原创
131阅读
0评论
0点赞
发布博客于 8 月前

Python办公自动化|批量合并PDF,拿来就用

Python数据挖掘与文本分析&Stata应用能力提升与实证前沿云特训大家好,今天分享一个实用的办公脚本:将多个PDF合并为一个PDF,例如我手上现在有如下3个PDF分册,需要整合成一个...
转载
167阅读
0评论
0点赞
发布博客于 8 月前

半个小时学会Markdown标记语法

Python数据挖掘与文本分析&Stata应用能力提升与实证前沿云特训学习编程的过程需要敲大量代码,遇到很多错误,好脑子不如烂笔头,能一边敲代码一边做笔记,学起来事倍功半,今天分享大家一...
原创
134阅读
0评论
0点赞
发布博客于 8 月前

7年大佬直播解锁python学习方法,让你从小白“C位出道”

每个风口有人乘风破浪,有人嗤之以鼻、有人默默离场。但更多的是后知后觉,不知道有什么机会,更不知道如何去创造机会,之前我们说过,我们生活在大数据的时代,每一个人每天产生的数据都是以成千上万...
转载
106阅读
0评论
0点赞
发布博客于 8 月前

在Markdown中用mermaid语法绘制图表

Python数据挖掘与文本分析&Stata应用能力提升与实证前沿云特训~Mermaid可以用文本方式绘制图表和流程图,相比Visio而言更加的轻量便捷,此外Markdown内部支持Mer...
原创
588阅读
0评论
0点赞
发布博客于 8 月前

大邓的自建博客Thunderhit开通了

Python数据挖掘与文本分析&Stata应用能力提升与实证前沿开始报名了~在B站看到一位博主用Hugo制作个人博客的视频,感觉挺简单的,真的十几分钟就能看到云端出现自己的博客,当然了...
原创
251阅读
0评论
1点赞
发布博客于 8 月前

10 个超好看Web可视化面板

作者:SevDot来源:www.jianshu.com/p/3bc7404af887Web 开发中几乎的平台都需要一个后台管理,但是从零开发一套后台控制面板并不容易,幸运的是有很多开源免...
转载
844阅读
0评论
1点赞
发布博客于 8 月前

cntopic库:支持中英文LDA话题分析

cntopic简单好用的lda话题模型,支持中英文。该库基于gensim和pyLDAvis,实现了lda话题模型及可视化功能。本文视频讲解已上传到B站(今晚会通过审核),大家可以关注大邓...
原创
630阅读
9评论
8点赞
发布博客于 8 月前

使用Python转换PDF,Word/Excel/PPT/md/HTML都能转!

今天讲的是各位一定会接触到的PDF转换,关于各种格式的文件转换为PDF有很多第三方工具与网站可以实现,但是使用Python的好处不仅可以批量转换,同时一旦脚本写完了以后就可以一键执行,彻...
转载
461阅读
0评论
2点赞
发布博客于 8 月前

数据科学利器 PyCaret,几行代码搞定从数据处理到模型部署

Python数据挖掘与文本分析&Stata应用能力提升与实证前沿云特训学习数据科学很久了,从数据探索、数据预处理、数据模型搭建和部署这些过程一直有些重复性的工作比较浪费时间,尤其当你有个...
转载
407阅读
0评论
0点赞
发布博客于 8 月前

当Python遇到哈工大无人机校庆彩排

6.7是哈工大百年校庆,我与工大结缘已有11载,从翩翩少年变成大叔,在决胜脱贫攻坚的决胜之年,我也正在朝着大爷的路上狂奔,没有一点减速的迹象。17年种草大疆的spark,感觉电子产品很炫...
原创
1440阅读
2评论
3点赞
发布博客于 8 月前

视频 | Python自然语言处理入门

作者: Alice ZhaoYoutube地址 https://www.youtube.com/channel/UCyv-PL-QgkAXEfDRcKrYMeAGithub地址 ht...
原创
170阅读
0评论
0点赞
发布博客于 9 月前

OS.path模块的详细使用说明

大家好,从本周起早起Python将持续更新由小甜同学从初学者的角度学习Python的笔记,其特点就是全文大多由新手易理解的代码与注释及动态演示。刚入门的读者千万不要错过!为了配合Pyth...
转载
319阅读
0评论
0点赞
发布博客于 9 月前

Python中匿名函数与内置高阶函数详解

点击上方『早起Python』关注并星标第一时间接收最新Python干货!大家好,从今天起早起Python将持续更新由小甜同学从初学者的角度学习Python的笔记,其特点就是全文大多由新手...
转载
62阅读
0评论
0点赞
发布博客于 9 月前

Python内置OS模块用法详解

大家好,从今天起早起Python将持续更新由小甜同学从初学者的角度学习Python的笔记,其特点就是全文大多由新手易理解的代码与注释及动态演示。刚入门的读者千万不要错过!为了配合Pyth...
转载
90阅读
0评论
0点赞
发布博客于 9 月前

未来2年,会Python的人将会非常抢手

最近一段时间,我经常在留言区看到很“丧气”的评论,被问得最多的就是“我到底该怎么做”。可能你从来没有想过这个问题:如果现在失业,你的存款够你维持多久的日常生活,它能应付哪种级别的风险,例...
转载
317阅读
0评论
0点赞
发布博客于 9 月前

从记者的Twitter关注看他们稿件的党派倾向?

这篇论文属于社会计算方向,一般会用到社交媒体数据做研究,分析方法一般会用到文本分析。这篇文章文本数据处理感觉还是挺技术的,可以借鉴一下构建词典-使用词频比构建党派倾向(共和or民主)词典...
原创
222阅读
0评论
0点赞
发布博客于 9 月前

读完本文你就了解什么是文本分析

文章较长,建议先收藏有时间再阅读~插播一个广告《Python网络爬虫与文本数据分析》视频课程中对本文中的绝大部分技术都有讲解~一、文本的作用文本涉及两个主体,即文本生产者和文本消费者:...
原创
1436阅读
1评论
3点赞
发布博客于 9 月前

实战 | 北京高档酒店价格因素分析

数据分析实战又来啦,今天我们进行的是北京高档酒店的价格因素分析,话不多说,直接上代码。1. 导入所需要的包import pandas as pdimport matplotlib.py...
转载
1144阅读
2评论
3点赞
发布博客于 9 月前

实战|淘宝用户行为分析案例

一、项目背景本数据报告以淘宝app平台为数据集,通过行业的指标对淘宝用户行为进行分析,从而探索淘宝用户的行为模式,具体指标包括:日PV和日UV分析,付费率分析,复购行为分析,漏斗流失分析...
转载
478阅读
0评论
0点赞
发布博客于 9 月前

Matplotlib可视化教程~

作者: AwesomeTang原文: https://www.kesci.com/home/project/5ead1655366f4d002d743eb3/code前言✨本文会逐步整理...
转载
1阅读
0评论
0点赞
发布博客于 9 月前

手把手|共享单车数据特征工程

数据来源Kaggle上有这样一个比赛:城市自行车共享系统使用状况。提供的数据为2年内按小时做的自行车租赁数据,其中训练集由每个月的前19天组成,测试集由20号之后的时间组成。本项目一此数...
转载
176阅读
0评论
0点赞
发布博客于 9 月前

readability: 英文文本数据可读性库

readability文本可读性的公式最初都是为英语开发而来,所以目前仅支持英文文本数据。文档 https://pypi.org/project/readability/安装pipin...
原创
480阅读
0评论
0点赞
发布博客于 9 月前

躺平了,给你10个关于AI学习的宝贵资料!

目前有越来越多的同学在学习人工智能,也有越来越多的开发者学习人工智能。毕竟,现在人工智能辣么火!然鹅,目前大家面临的问题是,时间有限,资料繁多。老祖宗早就告诉过我们,读书贵在精,不在多。...
转载
141阅读
0评论
0点赞
发布博客于 9 月前

Python实现排序算法

前言冒泡排序快速排序插入排序希尔排序选择排序堆排序归并排序计数排序桶排序基数排序前言 本章介绍使用Python实现场景的几种排序算法。分别有冒泡算法、快速排序、插入排序、希尔排序、选择排...
转载
91阅读
0评论
0点赞
发布博客于 9 月前

玩转数据处理120题|Pandas版本

Pandas进阶修炼120题系列一共涵盖了数据处理、计算、可视化等常用操作,希望通过120道精心挑选的习题吃透pandas。并且针对部分习题给出了多种解法与注解,动手敲一遍代码一定会让你...
转载
222阅读
0评论
0点赞
发布博客于 9 月前

对Titanic进行数据分析,我们发现了一些线索送给谈恋爱的你们

titanic数据集字段字段释意值survival幸存0 = No, 1 = Yespclass客舱等级1 = 1st, 2 = 2nd, 3 = 3rdsex性别Age年龄If the...
转载
94阅读
0评论
0点赞
发布博客于 9 月前