Python
文章平均质量分 92
致Great
为将之道,当先治心
展开
-
Pandas非常用技巧汇总
Pandas非常用技巧汇总原创致GreatChallengeHubimportpandasaspdimportnumpyasnpimportreP1 缺失值填充1.1 用另一列对应行的内容填充本列缺失值df=pd.DataFrame({'A':[1,2,3,4,5],'B':[1,np.nan,3,np.nan,5]})df A B 0 1 1.0 1 2 NaN 2...原创 2021-03-28 22:23:10 · 456 阅读 · 3 评论 -
机器学习(十九)EM:期望最大算法
致GreatChallengeHub1 EM算法简介最大期望算法(Expectation Maximization Algorithm,又译期望最大化算法),是一种迭代算法,用于含有隐变量(hidden variable)的概率参数模型的最大似然估计或极大后验概率估计。在统计计算中,最大期望(EM)算法是在概率(probabilistic)模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐藏变量(Latent Variable)。最大期望经常用在机器学习...原创 2021-02-27 23:36:36 · 663 阅读 · 0 评论 -
机器学习(十八)极大似然估计
原创致GreatChallengeHub2019-06-17 16:14:53手机阅读收录于话题#机器学习课程14个1 极大似然估计简介极大似然估计是在总体类型已知条件下使用的一种参数估计方法 。它首先是由德国数学家高斯在1821年提出的,然而,这个方法常归功于英国统计学家费希尔.费希尔在1922年重新发现了这一方法,并首先研究了这种方法的一些性质 。极大似然估计的思想是:选取这样的θ̂,使得当它作为未知参数θ的估计时,观察结果出现的可能性(概率)...原创 2021-02-27 23:28:05 · 528 阅读 · 0 评论 -
FACEBOOK 时间序列预测算法 PROPHET 的研究
转载 zr9558ChallengeHubProphet 简介Facebook 去年开源了一个时间序列预测的算法,叫做fbprophet,它的官方网址与基本介绍来自于以下几个网站: Github:https://github.com/facebook/prophet 官方网址:https://facebook.github.io/prophet/ 论文名字与网址:Forecasting at scale,https://peerj.com/preprints/3190...原创 2021-02-27 23:24:43 · 1379 阅读 · 0 评论 -
Python 过滤字母和数字
实例1crazystring = 'dade142.!0142f[., ]ad'# 只保留数字new_crazy = filter(str.isdigit, crazystring)print(''.join(list(new_crazy)))# 只保留字母new_crazy = filter(str.isalpha, crazystring...原创 2018-05-28 16:47:00 · 35670 阅读 · 0 评论 -
Python爬虫系列(一)初期学习爬虫的拾遗与总结
最近,为了提取裁判文书网的有关信息,自己迈入Python的学习之路,写了快两周的代码,自己写这篇文章总结下踩过的坑,还有遇到一些好的资料和博客等总结下,以便自己后期复习和参考和、分享给大家交流学习,也欢迎大家补充些精彩内容。一、环境搭建和工具准备1、为了省去时间投入学习,推荐直接安装集成环境 Anaconda2、IDE:Pycharm、Pydev3、工具:Jup原创 2017-04-16 20:22:01 · 2643 阅读 · 0 评论 -
Python爬虫系列(三)多线程爬取斗图网站(皮皮虾,我们上车)
斗图我不怕最近看了Python多线程的相关内容,并且前几天观看了腾讯课堂潭州学院上面的关于斗图网爬取的公开课,课程内容大致是利用Python多线程爬取斗图(多页),并将图片保存到本地。自己写这篇文章总结下这个项目的所涉及的知识,并将实现过程分享给大家。首先:分析网站,找到图片的src地址打开网址:https://www.doutula.com/a原创 2017-05-06 17:05:54 · 7540 阅读 · 20 评论 -
Python爬虫系列(二)Quotes to Scrape(谚语网站的爬取实战)
接下来自己会写一些关于爬虫 实战的内容,把所学的知识加以运用。这篇文章是关于一个英文谚语网站的谚语爬取,并输出结果。这个网站大致有10页谚语,所以是一个关于selenium使用的例子,大致思路使用webrdriver获取“下一页”按钮,获取每一页源码,输入所要的谚语使用到的模块或工具(这些要提前准备好):1、 BeautifulSoup2、selenium 3、time4、driver原创 2017-08-31 10:03:35 · 1673 阅读 · 0 评论 -
Python爬虫系列(五)360图库美女图片下载
这几天终于忙完毕设和学校的事情,终于有时间来写Python了(( ̄▽ ̄)~*)。前些天在群里看到有人讨论这个360美女图库的爬取。自己今天也尝试下(蛮简单)。因为这个网站是下拉到底底部,图片就会加载进来,所以自己想用Seleniu+PhantomJS来做,后来分享doc源代码并没有我们想要的图片信息,后来发现是js请求的数据,找到数据请求的地址,自己发现每次,下拉都会加载30张图片,所以自己将原创 2017-08-31 10:03:40 · 26312 阅读 · 2 评论 -
2017/6/9-Python文件读写的方法
# 使用斜杠“/”: "c:/test.txt"… 不用反斜杠就没法产生歧义了 # 将反斜杠符号转义: "c:\\test.txt"… 因为反斜杠是转义符,所以两个"\\"就表示一个反斜杠符号 # file=open('D:\\jupyter\\test.txt')##file=open('D:/jupyter/test.txt')#file=open('test.txt')#和程序在一个原创 2017-08-31 10:03:52 · 337 阅读 · 0 评论 -
使用Python和R语言从头开始理解和编写神经网络
本篇文章是原文的翻译过来的,自己在学习和阅读之后觉得文章非常不错,文章结构清晰,由浅入深、从理论到代码实现,最终将神经网络的概念和工作流程呈现出来。自己将其翻译成中文,以便以后阅读和复习和网友参考。因时间(文字纯手打加配图)紧促和翻译水平有限,文章有不足之处请大家指正。介绍你可以通过两种方式学习和实践一个概念:选项1:您可以了解一个特定主题的整个理论,然后寻找应用这些概念的方法。所以,你阅读整个算原创 2017-07-24 20:30:44 · 3304 阅读 · 1 评论