- 博客(24)
- 收藏
- 关注
原创 正则表达提取字符
本文记录正则表达的一些用法import re1.提取所有数字print(data.loc[0,'date'])pattern = re.compile(r'\d+') # 正则表达,查找数字resultdate = pattern.findall(data.loc[0,'date'])print(resultdate)结果为1993/7/28['1993', '7', '28']2.按照固定间隔分隔字符串print(a.year8Char)#定义函数,按照固定间隔分隔字符串
2021-11-28 10:02:43 382
原创 python绘制马赛克图,每个格子填充不同颜色
import matplotlib.pyplot as pltimport numpy as npfrom matplotlib.ticker import MultipleLocator, FormatStrFormatterimport pandas as pdax=plt.subplot(111) #注意:一般都在ax中设置,不再plot中设置#x1= np.linspace(0...
2020-04-01 22:01:05 23217
原创 爬虫代码,网页需要点击翻页的selenium
网页是需要翻页的,利用selenium库实现代码:from selenium import webdriverfrom selenium.webdriver.common.by import Byimport timetageturl='www.'browser = webdriver.Chrome(tageturl)browser.get()time.sleep(5)...
2020-02-22 16:32:39 1695
原创 python之pandas处理数据的一些常用操作
1.read_excel('路径.xls',names=["a","b"])2.to_excel('路径.xls',header=False,index=False)3.dropna()过滤缺失数据如果是Series,则返回一个仅含非空数据和索引值的Series,默认丢弃含有缺失值的行。df.dropna(how = 'all') # 传入这个参数后...
2020-02-11 16:33:17 569 1
原创 用dataframe格式存储列表,再读取列表时如何将字符串转化为列表
如下所示,dataframe中存储的是列表>>> df = DataFrame(columns=['col1'])>>> df.append(Series([None]), ignore_index=True)>>> dfEmpty DataFrameColumns: [col1]Index: []>>> ...
2020-02-11 15:17:32 3931
原创 python将图片制作成GIF
需将代码文件和图片放在同一文件夹下import imageiodef create_gif(image_list, gif_name, duration = 1.0): ''' :param image_list: 这个列表用于存放生成动图的图片 :param gif_name: 字符串,所生成gif文件名,带.gif后缀 :param duration: ...
2020-02-04 11:15:23 1007
原创 python绘制地图
使用pyecharts库,文档:https://pyecharts.org/#/zh-cn/geography_charts?id=map%ef%bc%9a%e5%9c%b0%e5%9b%be代码如下:from pyecharts.charts import Map,Geofrom pyecharts import options as opts#将数据处理成列表locate...
2020-02-02 16:28:07 1185
原创 python将数据归一到[-1,1]之间
参考:https://blog.csdn.net/sinat_33761963/article/details/53433799将数据归一到[-1,1]之间代码from sklearn import preprocessingimport numpy as npfrom pandas import DataFramea=[]for i in range(-5,5): ...
2020-01-09 17:26:30 19417 1
原创 python时间序列分解STL
参考链接:参考链接1,参考链接2.输入数据代码:import statsmodels.api as smimport matplotlib.pyplot as pltimport pandas as pd#from dateutil import get_gran, format_timestampdata = pd.read_csv('data.csv',useco...
2020-01-03 17:40:22 12985 9
原创 python多元线性回归及三维可视化
参考链接:https://www.jianshu.com/p/d2b926c458d9目标函数:Y=A*X1+B*X2+C代码:import pandas as pdimport numpy as npfrom io import StringIOfrom urllib import requestimport matplotlib.pyplot as pltfrom mp...
2019-11-23 19:45:29 4987
原创 pyflux中的时间序列模型
参考链接:https://pyflux.readthedocs.io/en/latest/arimax.html1.ARIMA models(ARIMA)2.ARIMAX models(ARIMAX)3.dynamic autoregression model (DAR)动态自回归模型4.Dynamic Linear regression models 动态线性回归模型5.B...
2019-10-21 17:20:40 1056
原创 python获取股票数据,并计算技术指标
python获取stock数据。计算技术指标使用talib库。方法一:使用pandas_datareader.data 库,该库获取的历史数据更多一些。上证股票在股票代码后面加上“.SS”,深圳股票在股票代码后面加上“.SZ”代码:stockname='000001.SS'import pandas_datareader.data as webimport datetime...
2019-10-16 10:50:32 5513
原创 时间序列聚类-tslearn库的应用
参考链接:https://tslearn.readthedocs.io/en/latest/gettingstarted.html#time-series-formathttps://mp.csdn.net/postedit/101713347时间序列聚类,用tslearn库实现。1.首先引用库import pandas as pdimport numpyimport mat...
2019-10-16 10:31:12 3736 2
原创 notepad运行python
按照网上的教程,运行不成功,原因是我的绝对路径中有空格。找到另外一种方法:在运行中输入:cmd /k cd /d "$(CURRENT_DIRECTORY)" & python "$(FULL_CURRENT_PATH)" & ECHO. & PAUSE & EXIT即可。然后设置快捷键就行了解释:其中cmd /k的意思是打开cmd命令行...
2019-10-05 11:56:13 234
原创 python绘制网络图,networkx固定节点的位置,按边的权重绘制边的宽度
代码如下:import networkx as nximport numpy as npimport matplotlib.pyplot as pltG=nx.Graph()row=np.array([1,1,2,2,2,3,3,3,4,4,4,5,5,5,6,6,7,7,7,7,8,8,8,8,9,9,9,9,10,10,10,10,11,11,11,12,12,13,13,...
2019-09-25 16:56:58 7266 1
原创 python处理时间序列数据股票数据,并进行相关性分析
参考链接:https://www.jianshu.com/p/ce0e0773c6ecimport pandas as pdimport numpy as npimport matplotlib.pyplot as pltfig = plt.figure()#读取数据stock = pd.read_csv('D:/0py-stock analysis/predict/6004...
2019-09-08 16:32:22 4100 1
原创 python数据分析与建模(1)
理论铺垫集中趋势:均值、中位数,分位数,众数离中趋势:标准差,方差数据分布:偏态与峰态、正态分布、三大分布(卡方分布,t分布,F分布)抽样理论:抽样误差、抽样精度...
2019-08-29 14:55:15 260
原创 python处理心电数据(ECG)-----heartpy库的应用
将原始数据+1,数据概貌如下:第三方包:https://python-heart-rate-analysis-toolkit.readthedocs.io/en/latest/quickstart.html该库相关文档:http://www.paulvangent.com/2016/03/15/analyzing-a-discrete-heart-rate-signal-using...
2019-08-26 19:55:56 4661
原创 python读取mat格式数据,并转存为csv格式
最近处理心电数据import pandas as pdimport scipyfrom scipy import io#采样频率是2000features_struct= scipy.io.loadmat('E:/CCCC/ECGdata/20181101first.mat')features = features_struct['data'] #data为表的名称,df...
2019-08-26 11:20:37 2066 2
原创 python五数概括法
五数概括法:通俗的说就是最小,第一四分位,第二四分位,第三四分位,最大数箱形图是基于五数概括法的数据的一个图形汇总。箱形图的说明:(1)边界分别为第一四分位数和第三四分位数(2)在箱体上中位数即第二四分数处画垂线(3)利用四分位数间距IQR = Q3-Q1,找到界限,超出即为异常值。IQR左 = Q1 - 1.5×IQRIQR右 = Q3 + 1.5×IQR(4)虚线被...
2019-08-06 17:49:28 3399 2
原创 python中matplotlib画图
画折线图,散点图。import numpy as np import pandas as pd from pandas import Series, DataFrameimport matplotlib.pyplot as plt#读取文件数据#df = pd.read_csv('2.14-addspeed-12.csv',names=['A','B','C','D'])df=p...
2019-08-06 10:50:16 190
原创 python爬虫学习笔记
爬虫学习笔记爬虫学习笔记1.网页页面获取爬虫学习笔记这是 学习北理的mooc教程的笔记。1.网页页面获取简易爬虫框架import requesturl = ' 'try: kv={'user-agent':'Mozilla/5.0'} #将爬虫伪装成浏览器 r = request.get(url.header=kv) r.raise_for_status() r.encodi...
2019-08-04 08:02:46 294
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人