- 博客(3)
- 收藏
- 关注
原创 综合总结
术语 解释 关系 公式 叫做线性回归用途:最简单预测连续值手段回归预测连续值(天气,速度,距离)用一条直线来拟合真实世界的一些规律属于有监督学习分类预测离散值(地名,品牌,颜色)属于监督学习有监督学习datasets(数据集)中的每一条样本(数据中的每一行),都有一个对应的label(结果)X --> YDatasets数据集,一般用关系型数据库...
2019-10-15 19:44:56 257
原创 pandas处理丢失数据
#pandas处理丢失数据######Pandas将None和NaN视为可交换的,它们都可以用来指示丢失的数据。1.None可以代替丢失值(哨兵值)并不适合所有情况,只能用于数组的类型为对象的情况。 None会导致一些聚合操作,比如sum()和min()会报错。2.NaN 代替丢失值(另外一中哨兵值)一种特殊的浮点型数据,不管什么操作,只要有NaN,结果都为NaN(聚合操作能进行,但结果都是...
2019-10-15 17:08:18 101
原创 beautiful Soup方法(美丽汤)
导入BeautifulSoupfrom bs4 import BeautifulSoup转至对象 括号可以加入url,要爬取得模板名,还可以加入‘lxml’解析器bs = BeautifulSoup(html,'lxml')格式化输出网页bs.prettify()匹配所有网页tr标签不加过滤条件,获取全部的tr标签bs.find_all('标签名')limit限制符合...
2019-10-15 16:39:01 626
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人