![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python
ShinyCC
自律给人自由
展开
-
使用Python+Pandas+Statsmodels建立线性回归模型预测房价
【综述】本文通过使用Python+Pandas+Statsmodels建立简单一元线性回归模型、多元线性回归模型来预测房价。主要内容来源自网页:https://www.learndatasci.com/tutorials/predicting-housing-prices-linear-regression-using-python-pandas-statsmodels/我在原文基础...原创 2019-04-01 15:59:00 · 14210 阅读 · 3 评论 -
使用python requests+re库+curl.trillworks.com神器 实现淘宝页面信息爬取
慕课【Python网络爬虫与信息提取】课程随手练习~!和嵩天老师课程中的示范不同的是,淘宝页面现在不能直接爬取,要修改下访问请求的headers表头信息。目标:使用python的requests+re库+curl.trillworks.com神器,获取淘宝搜索页面的信息,提取其中的商品名称和价格。步骤:1. 导入必要的requests和re库。2. 使用requests库获取淘...原创 2019-04-07 21:11:46 · 3705 阅读 · 0 评论 -
Python list.insert() 遇上负索引
分享下使用insert函数时,参数index设置为负索引 negative index时的情况。insert()语法如下:list.insert(index, obj)index -- 对象 obj 需要插入的索引位置。 obj -- 要插入列表中的对象。insert函数时实现的功能是,在指定的索引位 之前 插入 参数中指定的对象。一般,在索引大于0的时候,我们不会发...原创 2019-03-28 19:32:29 · 2032 阅读 · 1 评论 -
Pandas+Numpy 数据中空值的处理操作:判断、查找、填充及删除
本文整理了数据中空值的处理操作,主要内容如下:判断数据中是否有空值统计空值/非空值数量根据空值筛选数据查找空值索引删除空值 dropna()函数填充空值fillna()函数为了便于描述,定义本文示例数据为如下结构:df = pd.DataFrame([[1, np.nan], [np.nan, 4], [5,6],[np.nan,7]],columns=["A",...原创 2019-04-20 22:58:19 · 21909 阅读 · 0 评论 -
概率统计练手题【含方差统计、置信区间、线性回归方程】
做了几道概率统计题,整理分布~第一题美国房地产协会报道了美国房屋价格的中位数和 5年期间房屋价格中位数的增长率(《华尔街日报》.2006 年 1 月 16 日)。利用下面房屋价格(单位:1000 美元)的样本数据回答下列问题995. 9 48. 8 175. 0 263. 5 298. 0 218. 9 209. 0628.3 111.0 212.9 92....原创 2019-04-20 23:15:28 · 3213 阅读 · 0 评论 -
摩拜单车骑行数据探索性分析【实战总结】
终于有整块时间,将前段时间学习实操的摩拜单车数据探索分析内容整理一下。工具:Python,使用到Pandas,seaborn,matplotlib,math第三方库。 内容:数据清洗,日期、地理位置特征提取、用户行为规律探讨及可视化。原创 2019-04-26 10:04:20 · 10773 阅读 · 26 评论 -
科大讯飞AI营销云广告投放数据分析报告【实战总结】
4月份项目实战的总结,前后进行了约20多天。花了大量时间在清洗数据,虽然耗时但是觉得过程中很享受,喜欢“静静地泡在里面”的感觉。另外,了解了涉及到的广告投放、业务指标体系、手机设备版本及API等相关知识,有趣!感受:分析问题的思路 比 代码的实现更为重要项目背景:2018科大讯飞AI营销算法大赛,点击去官网数据集:选用训练集数据round1_iflyad_train....原创 2019-04-27 22:33:57 · 3658 阅读 · 3 评论 -
Python sorted() 函数 和 sort() 函数
本文对比sorted()函数和list.sort()函数的语法和用法。sorted()函数对所有可迭代的对象进行排序,返回迭代对象中元素重新排序后组成的新list列表。sorted()排序不改变原始结构,临时排序。sorted函数语法:sorted(iterable,*,key=None,reverse=False)sorted函数有两个命名关键字参数key和rever...原创 2019-03-22 10:04:49 · 182 阅读 · 0 评论 -
Python/Pandas Categorical对象labels和levels属性已弃用,改为codes和categories
《利用Python进行数据分析》,第7章-离散化和面元划分,这一章节提到Categorical对象,含有一个表示不同分类名称的levels数组和一个标号的labels属性。按照书中代码测试的时候,系统反馈:'Categorical' object has no attribute 'levels''Categorical' object has no attribute 'ind...原创 2019-03-13 15:48:13 · 3898 阅读 · 3 评论 -
PYTHON笔记1
Hello WorldPrint输出函数; 字符串要使用单引号‘’,或者双引号“” 在jupyter notebook中运行代码,可以点击菜单栏‘运行’按钮,或者直接快捷键ctrl+回车 # 表示注释,方便代码阅读。注释内容不会被运行 代码可以写在一个txt文件中,保存为.py格式,用软件运行 字符串拼接,可以直接用加号 + 使用库,用import导入,如import math 使...原创 2019-02-25 22:55:28 · 299 阅读 · 0 评论 -
PYTHON笔记2
tuple元祖元祖的格式和用法几乎和列表一致,唯一的区别就是元祖是不可更改的序列,因此你只能从元祖中查找元素,但是不能修改元素。元祖的创建有以下几种方式:使用一对圆括号:( ) 如 a =(1,2,3) a[1]=2使用tuple关键词:tuple(),如a = tuple([1,2,3])字典字典是以键值对(key-value)的形式存储数据,可以在O(1)的时间复...原创 2019-02-26 14:45:00 · 128 阅读 · 0 评论 -
Jupyter notebook: Notebook validation failed: 'execution_count' is a required property
今天,将科赛网上的练习直接保存为.ipynb格式,并导入到我的jupyter notebook中,以便做练习时做好笔记记录。顺利导入jupyter notebook后,文件保存时,提示保存成功,但可能是无效操作。同时,提示:Notebook validation failed: 'execution_count' is a required property:...担心整理的笔记保存失...原创 2019-03-08 17:03:35 · 6282 阅读 · 0 评论 -
Python基础练习题笔记
学习的时间过的真快,每天都觉得时间不够用。看到新的知识点,在查询资料的过程中,知识网越铺越大,想一直泡在里面!目前了解到Pandas库,操作好强大。略兴奋!这篇是上周末做的练习题笔记,从jupyter notebook中导出。多读书,惜四时!1. 一行代码实现1--100之和# 一行代码实现1--100之和# print(sum(list(range(1,101))...原创 2019-03-04 19:30:37 · 406 阅读 · 0 评论 -
Python基础练习题
同上一篇,依旧是上周末做的练习题笔记。笔记代码直接从jupyter notebook笔记本中导出的,因为此,所以有些代码中,输出语句中没有print。参考时,请注意咯!1 列出python中可变数据类型和不可变数据类型,并简述原理答:Python中可变数据类型有:列表、字典、集合;不可变数据类型有:数值型、字符创、元祖【了解】不可变数据类型: 当该数据类型的对应变量的值...原创 2019-03-04 19:57:40 · 1644 阅读 · 0 评论 -
Numpy Random 随机数
Numpy可以根据一定的规则创建随机数,随机数的使用会在概率论,数据分析,数据挖掘的时候经常用到。官网主页Random本文整理Numpy Random常见的一些用法。目录np.random.rand(d0,d1,...,dn)np.random.randn(d0,d1,...,dn)np.random.randint(low,high=None,size=...原创 2019-03-11 23:58:43 · 424 阅读 · 0 评论 -
【Python】使用sorted()函数对一组tuple排序
【题】假设我们用一组tuple表示学生名字和成绩:L = [('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]请用sorted()对上述列表分别按名字排序:# 按名称排序L = [('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)] def by_name...原创 2019-03-08 11:54:49 · 6167 阅读 · 0 评论 -
Python/Pandas 数据规整/合并数据集Merge/Concat/Join/Combine_first函数
目录1 pandas.merge1.1 merge函数的语法1.2 单一键上合并1.2.1 key名相同1.2.2 两者key名不同1.3 多个键上合并1.4 连接键key之外,合并数据中两者存在重复列名1.5 索引上的合并1.5.1 使用单方DataFrame索引1.5.2 使用双方DataFrame索引1.6 层次化索引2Pandas.co...原创 2019-03-12 23:47:47 · 1963 阅读 · 1 评论 -
Dijkstra算法的Python实现-最短路径问题
使用狄克斯特拉算法找出下图中从起点至终点耗时最短的路径,路径上的每个数字表示的都是时间,单位分钟。狄克斯特拉算法包含的4个步骤:(1)找出开销/消耗“最便宜”的节点,即在最短时间内到达的节点(2)对于该节点的邻居,检查是否有前往它们的更短路径,如果有,更新该节点的邻居的开销(3)重复上述过程,直到对图中的每个节点都这样做了(4)计算最终路径python代码实现:...原创 2019-05-30 11:39:08 · 4102 阅读 · 0 评论