笔记
文章平均质量分 92
小鱼编程
越努力,越幸运
展开
-
爬虫的一些常用代码模块
下载图片from bs4 import BeautifulSoupimport requestsURL = "http://www.nationalgeographic.com.cn/animals/"html = requests.get(URL).textsoup = BeautifulSoup(html, 'lxml')img_ul = soup.find_all('ul', {"class": "img_list"})for ul in img_ul: imgs = ul.原创 2020-09-26 22:05:22 · 199 阅读 · 0 评论 -
数据分析和预测泰坦尼克号船员存活率(详细)
#通过pandas导入数据import pandas as pdtitanic=pd.read_csv("titanic_train.csv")print(titanic.head(5))#因为Age项里有空的数据,这里使用平均值去填补fillnatitanic["Age"]=titanic["Age"].fillna(titanic["Age"].median())print(titanic.describe())#将一些字符型变为数值方便处理print(titanic["Sex"].原创 2020-08-07 12:53:33 · 1023 阅读 · 0 评论 -
贝叶斯拼写检查器
求解:argmaxc P(c|w) -> argmaxc P(w|c) P©/ P(w)P©, 文章中出现一个正确拼写词 c 的概率, 也就是说, 在英语文章中, c 出现的概率有多大P(w|c), 在用户想键入 c 的情况下敲成 w 的概率. 因为这个是代表用户会以多大的概率把 c 敲错成 wargmaxc, 用来枚举所有可能的 c 并且选取概率最大的import re, collections# 把语料中的单词全部抽取出来, 转成小写, 并且去除单词中间的特殊符号#词频统计,并把最原创 2020-08-07 12:48:49 · 149 阅读 · 0 评论 -
pandas数据分析泰坦尼克号船员信息
first_rows=food_info.head(3)#打印前3行print(first_rows)print(food_info.columns)#显示表头print(food_info.shape)#总的数据规模import pandas as pdfood_info=pd.read_csv("food_info.csv")print(food_info)#读取数据并显示,dataframe格式#print(food_info.loc[6])#利用索引查找指定行#print(fo原创 2020-08-03 20:38:44 · 465 阅读 · 4 评论 -
iFLYOS文档学习笔记
一、什么是智能硬件开放平台?我们生活中,已经实现了人与人之间的连接,现在需要将人与机器设备连接,这就需要一套完整的系统和连接规则,那么这么好的系统为什么要开放给大家使用呢?其实之前通过学习Google的tensorflow框架了解到,开放出来其实是为了打造一个属于自己的生态,扩大自己的范围,...原创 2020-05-19 08:56:56 · 1177 阅读 · 0 评论 -
你真的懂C语言基础的输入输出吗?ACM,scanf,gets,getchar
好久没打过ACM了,今天准备复试,发现连输入输出都不会了,仔细想想,这个坑还真的挺大,你真的会输入输出吗??输入的几种方式1.给你几组数据,当你没输入的时候结束while(scanf("%d %d",&a,&b)!=EOF) {}EOF是一个预定义常量,为-1.如果有一个输入,返回1,如果有两个输入,返回2,如果一个都没有,返回值为-1。2.输入的一开始就说有多少组数...原创 2020-09-07 21:40:21 · 351 阅读 · 0 评论 -
RNN原理及其解决MNIST手写数字识别
前面学习到了全连接神经网络和卷积神经网络,以及它们的训练和使用。他们都只能单独的取处理一个个的输入,前一个输入和后一个输入是完全没有关系的。但是,某些任务需要能够更好的处理序列的信息,即前面的输入和后面的输入是有关系的。比如,当我们在理解一句话意思时,孤立的理解这句话的每个词是不够的,我们需要处理这些词连接起来的整个序列;当我们处理视频的时候,我们也不能只单独的去分析每一帧,而要分析这些帧连接起来...2020-01-17 08:00:55 · 1761 阅读 · 0 评论 -
推荐一个非常好的深度学习教程
稍微需要一点数学基础,很全。https://zybuluo.com/hanbingtao/note/6263002020-01-17 08:00:52 · 419 阅读 · 0 评论 -
系统测试实习学习小知识点记录(断言,monkey,内存泄露溢出,网络配置)
断言assert(表达式)当表达式的值为真的时候,也就是假设成立的时候,系统继续运行;但是当表达式的值为假,也就是假设不成立的时候,他就会中断程序执行,并且报告错误所在行。 do { printf("input m(m>=0):"); scanf("%d",&m); }while(m<0); //当m>=0,不...2020-01-10 11:14:10 · 433 阅读 · 0 评论 -
通俗易懂的机器学习名词--L1和L2正则化
机器学习中,如果参数过多,模型过于复杂,容易造成过拟合(overfit)。即模型在训练样本数据上表现的很好,但在实际测试样本上表现的较差,不具备良好的泛化能力。为了避免过拟合,最常用的一种方法是使用使用正则化,例如 L1 和 L2 正则化。这篇文章写的非常容易理解,分享给大家。L2 正则化直观解释L2 正则化公式非常简单,直接在原来的损失函数基础上加上权重参数的平方和:其中,Ein 是未...2020-01-10 10:47:34 · 213 阅读 · 0 评论