python初探
木南花
这个作者很懒,什么都没留下…
展开
-
python预测模型
####趋势外推预测:根据事物的历史和现实数据,寻求事物随时间推移而发展变化的规律,从而推测其未来状况的一种常用的预测方法。运用一个数学模型,拟合一条趋势线,然后用这个模型外推预测未来时期事物的发展。Tableau—选择拟合线(历史数据做折线图)–一元线性拟合出来的趋势线。####回归预测:根据自变量和因变量之间的相关关系进行预测的。回归问题的学习等价于函数拟合:选择一条函数曲线使其很好的拟合已知数据且能很好的预测未知数据。####组合预测:对同一个问题,采用多种预测方法。组合的主要目的是综合利原创 2021-07-20 10:34:59 · 2839 阅读 · 0 评论 -
Python中的操作符
算数操作符+ - * / // % **1、操作符介绍 从左到右这些操作符依次是:加、减、乘 、传统除法、浮点除法、取余,乘方 单斜杠用作传统除法,双斜杠用作浮点除法(对结果进行四舍五入),传统除法是指如果两个操作都是整型的话,它将执行的是地板除(取比商小的最大整数),而浮点除法是真正的除法,不管操作数是什么类型,浮点除法总是执行真正的除法。 ...原创 2018-05-25 11:32:38 · 1724 阅读 · 0 评论 -
【报错】Python中expected an indented block
IndentationError: expected an indented block Python严格地要求代码缩进,缩进的代码块相对于上一级是从属关系。用if语句举个例子: if a==2: print ‘hello world’if语句的条件为真时会执行print语句,print语句是if语句的从属代码块,代表从属关系,print语句之前有4个空格。如果if语句没有任何从属的代码块就会...原创 2018-05-24 15:28:10 · 12968 阅读 · 0 评论 -
【报错】python 中 出现 invalid syntax
invalid syntax 就是语法错误常见的场景: 1、在使用筛选是使用等号:例如data['car']==2data[‘car’]==2写成data['car']=2原创 2018-05-24 15:32:39 · 47096 阅读 · 0 评论 -
Python代码过长换行问题
在Python中当代码过长,需要换行的话,如果之前换行会出现报错,需要在每一行的末尾加一个英文的”\”才可以正确换行。data['tool'] = data['jk']+\ data['df']+\ data['iui']...原创 2018-09-04 13:48:16 · 11114 阅读 · 0 评论 -
【报错】ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() o
**ambinguous:模糊的,有歧义的 这个错误的理解:所选的真值不明确。可能是将一个值与多个值或一个列表中的值相比较、匹配,导致的问题** 出现以上错误的代码:def xianhao(b): if (汇总0901['尾号'] == '0')&(汇总0901['尾号'] == '5'): return '星期五' elif (汇总0901['尾号...原创 2018-09-11 17:12:44 · 10608 阅读 · 0 评论 -
【报错】:Missing parentheses in call to 'print'
使用print函数的时候往往会出现这个错误。 当你执行:print "hello world"出现以下错误: Missing parentheses in call to ‘print’原因:Python2.X和Python3.X不兼容。现在大部分人用的是Python3,而print “hello world”是Python2中的语法,在Python3中需要使用print()语...原创 2018-09-11 17:20:05 · 1306 阅读 · 0 评论 -
Python中的对象
在Python中的对象数据类型主要包含,数值型、字符型、逻辑型、列表、元祖、字典、数据框。 本文将针对不同的数据类型进行介绍,说明其用法。 一、数值型、字符型、逻辑型说明数值型定义:数值型主要是指实数,正数,负数以及0。分为长整型,浮点值,复数 运算:数值型可以进行标准算术运算(+ - * / // % **) 举例:长整型(long):94895893589...原创 2018-09-05 17:33:06 · 3847 阅读 · 0 评论 -
python中基本数据处理
同一个数据框中,根据两列数据得出新一列数据例:有某工厂的上班时间,一列是夜间上班时间,一列是白间上班时间,我们需要根据这两列数据得出一列新数据:工人的夜班和白班情况。 具体规则: 1、如果夜间在线时长大于0,称之为夜班 2、如果白间在线时长大于0,称之为白间 3、如果司机当天在线时长为0 ,这称为未做单 4、如果夜间和白间的在线时长都大于0,称之为混合def function(a...原创 2018-09-06 16:51:21 · 320 阅读 · 0 评论 -
python核心编程第二版-第五章习题--自己写(欢迎批改)
第二题:操作符1/写一个函数,计算并返回两个数的乘积;2/写一段代码调用这个函数并显示它的结果def ji(a,b): return a*bji(2,6)第三题:标准类型操作符。写一段脚本,输入一个测验成绩,根据下面的标准,输出他的评分成绩(A-F).A:90~100B:80-89C:70-79D:60-69E:<60def fenshu(a): if...原创 2018-09-18 13:43:13 · 664 阅读 · 0 评论 -
【报错】"cannot convert the series to class 'float'
def is_number(s): try: float(s) return True except ValueError: pass try: import unicodedata unicodedata.numeric(s) return True except (...原创 2018-09-07 17:24:55 · 11379 阅读 · 3 评论 -
jupter notebook安装
1、Mat 在他的课程中写道:“到目前为止,安装 Jupyter 最简单的方法是采用 Anaconda。” Anaconda 是为数据科学建立的一个软件包。由于这节课中已经有了 Jupyter Notebook Workspaces,所以并不一定需要在你的计算机上设置 Anaconda,但我们仍然建议最好设置一下。 2、还可以使用命令行的 pip 安装 Jupyter:如果不想使用 Anacon...原创 2018-09-13 15:55:56 · 2176 阅读 · 0 评论 -
python核心编程第六章
6-1 字符串。string模块中是否有一种字符串方法或者函数可以鉴定一个字符串是否是另一个大字符串的一部分?#in/not in 可以判断一个字符串是否再另一个字符串中'bc' in 'abcd'Out[3]: True'bc' not in 'abcd'Out[4]: False6-2 字符串标识符。修改例6-1的idcheck.py脚本,使之可以检测长度为一的标识符,并且可以...原创 2018-10-09 19:04:22 · 306 阅读 · 0 评论 -
python2和python3的区别
【1】print用法在python2中 print后面直接跟字符串,而在python3中字符串需要用小括号进行封装。#python2print 'nimen'#python3print ('nimen')【2】string中字母序列的表达方式在python2中用string.letters表示所有字母,在python3中用string.ascii_letters表示所有字母。s...原创 2018-10-09 19:11:00 · 204 阅读 · 0 评论 -
series转换成dataframe
在平时数据分析时,通过describe和groupby生成的统计数据,更多的时候是属于series格式的。而我们在后续的分析或者数据合并的过程中,我们往往需要将series格式转换成dataframe格式,往往存在以下两种情况单个的series转换成dataframe,其中也要将index去除索引,变成dataframe中的一列#生成序列,这里注意pd.Series的S一定要大写ser...原创 2019-03-14 16:28:18 · 24343 阅读 · 3 评论 -
关于行和列的操作
增加一行hangzhou = zhewan_score_original[zhewan_score_original.城市 == '杭州市']hangzhou_d = hangzhou.服务分.describe()hangzhou_d.loc['90分以下'] = len( hangzhou[hangzhou.服务分<90])hangzhou_d.loc['80分以下...原创 2019-03-14 18:38:55 · 277 阅读 · 0 评论 -
关于df中的排序
python内置的sorted()和.sort() 都是稳定的排序方法。日期是索引,因为high这列可以有重复值,所以需求是按high列降序排列,如果遇到重复值,再按第二顺序也就是日期索引列进行升序排列。但是发现pandas的sort_values不支持一列升序,一列降序。有什么办法吗?df.sort_values([‘high’, ‘日序’], ascending=[False, True...原创 2019-03-19 15:14:22 · 9525 阅读 · 0 评论 -
【报错】Missing parentheses in call to 'print'
在执行过程中出现以下报错:print 'hello world' File "<ipython-input-1-d05d0c8adf1f>", line 1 print 'hello world' ^SyntaxError: Missing parentheses in call to 'print'原因:在Python...原创 2018-05-25 10:51:20 · 18762 阅读 · 1 评论 -
【报错】Python中选取单列或者多列
选取单列1、以下报错出现是因为字段错误,这里的司机ID是不在报表内周故意明细 = 周报['ID']Traceback (most recent call last): File "<ipython-input-14-c23e3b5f93d6>", line 1, in <module> 周故意明细 = 周报['ID'] File "C:\Pro...原创 2018-04-19 18:36:19 · 14138 阅读 · 1 评论 -
python-数据处理-merge函数
#在python中使用merge函数的过程中,当要合并的两个表的索引字段一致时,可以将left_on和right_on两个参数省去,统一更换为on参数进行设置。data1 = merge(driver11[['司机ID', '司机姓名', '司机电话', '所在租赁公司', '合作模式', '驾管', '小组名称']],income11[['司机I...原创 2017-12-23 17:22:02 · 3024 阅读 · 0 评论 -
python中的json文件
json结构 API的 大部分数据都是JSON和XML格式,W3Schools提供相应的课程。 JSON(Javescript Object Natation )顾名思义 JaveScript对象标记。而XML可延伸标记语言。 这两种格式都有自己的用例。 下面重点说一下Json: 很多情况下,能用列表数据体现的内容有限;有时数据字段具有多个条目。用列表显示此数据将会很奇怪。 我们需...原创 2018-03-15 21:01:32 · 711 阅读 · 0 评论 -
python--数据导入--read_excel
#在使用python使用数据导入的过程中,在导入Excel文件时使用read_excel#在使用read_excel的过程中,部分Excel文件会存在多个sheet,可以选择单个sheet进行导入,read_excel默认导入第一个sheetfrom pandas import read_exceltext11 = read_excel('F:\\1011\\11\\text11.xlsx','神...原创 2017-12-23 17:15:54 · 2932 阅读 · 2 评论 -
按照时间抽取数据
一、按照时间抽取主要有两种方法1.时间列作为索引列进行抽取 2.时间列不作为索引列进行抽取 二、时间列作为索引列进行提取实例 重点:时间列转换为日期格式,日期列而是索引DataFrame.ix[start:end] 此处是冒号DataFrame.ix[dates]import pandasfrom pandas import read_csvdata = re...原创 2018-03-13 13:45:37 · 1393 阅读 · 0 评论 -
关于CUT函数报错解决
问题: 在使用cut函数时,出现以下报错: 原因: bins = [“min(twitter_archive_master.scale)-1”,”10”,”20”,”max(twitter_archive_master.scale)+1”], lables = [‘10级以下’,’10到20级’,’20级以上’] 上面的bins各值不应该用引号括起来,括起来之后就不再是数字格式,因此...原创 2018-03-06 15:45:21 · 983 阅读 · 0 评论 -
Python数据挖掘--时间序列
概念时间序列:(TIME SERIES)均匀时间间隔的观测值序列 时间序列分析:(Time Series Analysis)趋势分析,序列分解,序列预测序列分解时间序列分解(Time-Series Decomposition)时间序列按照季节性来分类:分为季节性时间序列和非季节性时间序列非季节性时间序列:趋势部分,不规则部分季节性时间序列:趋势部分,不规则部分,季节性部...原创 2018-03-29 18:36:14 · 1881 阅读 · 0 评论 -
python数据分析---数据评估
评估数据是数据整理的第二步。评估数据就像作侦探一样,检查数据集是否存在两个问题:数据质量问题(即内容问题)和缺乏整洁度(即结构性问题)。 数据质量问题包含:数据缺失,数据重复以及数据错误等问题。又被称为脏数据 不整洁或杂乱的数据存在明显的结构问题。 评估的两个方法:目测评估,代码编程评估首先,对脏数据和杂乱数据进行明确定义: 为了方便理解,将数据想象成卧室,一间脏兮兮的卧室可能有脏盘子...原创 2018-03-24 16:55:29 · 2697 阅读 · 0 评论 -
如何将几列合并为一列
使用+将不同的列合并在一起twitter_archive_enhanced_clean['d1'] = s.str.findall('doggo')twitter_archive_enhanced_clean['d2'] = s.str.findall('floofer')twitter_archive_enhanced_clean['d3'] = s.str.findall('puppe...原创 2018-04-07 14:34:59 · 1468 阅读 · 0 评论 -
针对同一列不同的行直接复制
twitter_archive_enhanced_clean['dog_status'][1596,1198,1289,1574,1483,1152,1341,1568,1856,1845] = 'multiple'原创 2018-04-07 14:35:57 · 395 阅读 · 0 评论 -
pandas.replace
twitter_archive_enhanced_clean['dog_status'] = twitter_archive_enhanced_clean['dog_status'].replace('none','no_status')原创 2018-04-07 14:42:35 · 560 阅读 · 0 评论 -
正则表达式
用正则表达式从文本中提取想要的内容twitter_archive_enhanced_clean.name = twitter_archive_enhanced_clean.text.str.extract('(?:This is|Meet|name is|Say hello to|named) ([A-Z][a-z]{2,12})', expand=False)...原创 2018-04-07 14:45:44 · 153 阅读 · 0 评论 -
关min和max函数使用的注意事项
min(twitter_archive_master.scale) 和 max(twitter_archive_master.scale) 这样的用法,不会跳过 nan 值,最终返回的最大值和最小值都是 nan,bins 中的值不能有重复的,现在有两个 nan 就会报错了。 使用 twitter_archive_master.scale.min() 和 twitter_archive_maste...原创 2018-04-07 12:32:22 · 1002 阅读 · 1 评论 -
从互联网下载文件-HTTP
目标:从互联网上下载影评文本 方法:通过HTTP和Python中的request库一、导入相应的模块import requestsimport os二、指定文件保存的路径folder_name = 'ebert_reviews'if not os.path.exists(folder_name): os.makedirs(folder_name)三、收集需...原创 2018-01-22 16:32:49 · 1749 阅读 · 3 评论 -
pandas.findall--文本查找方法
pandas.Series.str.findallSeries.str.findall(pat, flags=0, **kwargs)[source]Parameters: pat : string(Pattern or regular expression) flags : int, default 0 (no flags) re module flags, e.g. re.IG...原创 2018-04-07 13:28:18 · 3700 阅读 · 2 评论 -
python之数据类型转换
使用astype进行数据类型转换 将电话号码转换成文本型df['tel'] = df['tel'].astype(str) int(x [,base ]) 将x转换为一个整数 long(x [,base ]) 将x转换为一个长整数 float(x ) 将x转换到一个浮点数 complex(real [,i...原创 2018-04-07 13:30:40 · 3849 阅读 · 0 评论 -
如何展示全部文档
当df中存在过长的问题当,在pandas中查询无法全部展示是,可尝试一下代码进行尝试pd.set_option('max_colwidth', 400)print(twitter_archive_enhanced_clean[1979:1982]['text'])1979 This is Stuart. He's sporting his favorite fanny pac...原创 2018-04-07 13:41:45 · 166 阅读 · 0 评论 -
pandas.group by 函数
group by函数在使用Python进行分组分析时使用非常频繁,使用group by可以对数据进行简单的分组分析。 一、分组列一列,计算列一列的写法一组分组列,一组计算列,一种计算方式aggResult = data.groupby(by=['年龄分层'])['年龄'].agg({'人数': numpy.size})grouped = data.年龄.groupby(data....原创 2018-03-08 12:20:10 · 3805 阅读 · 0 评论