python基础
文章平均质量分 87
Mayumi_yumi
这个作者很懒,什么都没留下…
展开
-
Tushare Day7—— 第19章投资组合理论及拓展
投资组合的收益率与风险1 不同相关系数下投资组合标准差随投资比例变动的情况1.1 设置calc_mean函数为采用的投资组合方式1.2 以x/50为权重(其中x属于0到50)进行投资组合(其实就是0到1中间等距抽权重)1.3 计算不同相关系数的股票组合对应收益值1.4 不同相关系数均值和标准差关系图2 Markowitz模型实现2.1 获取各只股票日线行原创 2021-03-03 23:46:23 · 1396 阅读 · 15 评论 -
Tushare Day6—— 第18章 资产收益计算(嘻嘻嘻)
资产收益计算1 通过接口导入茅台股2019至今的数据2 获取收盘价列并错位合并求单期收益率2.1 获取收盘价列2.2 索引设置为时间列2.3 下移得到延迟一期收盘价2.4 将收盘价与延迟一期收盘价合并为表格2.5 计算延迟一期收益率3 计算多期收益3.1 将收盘价、延迟一期收盘价及收益率合并为一个表格3.2&n原创 2021-02-21 01:07:12 · 859 阅读 · 0 评论 -
Tushare Day4——导入IPO新股列表new_share并分析基金和盈利
IPO新股列表new_share1 从数据接口取出new_share(由于限制,分两次取再合并)1.1 20000101到201501011.2 20150101到202101011.3 将二者合并2 分析筹集资金2.1 选出募集资金前20的公司2.2 按基金数额画频数直方图2.3 小于80的基金按数额画频数直方图2.4原创 2021-02-05 10:59:05 · 437 阅读 · 0 评论 -
Tushare Day3——了解stock_company并与stock_basic数据规模进行比较
了解stock_company1 stock_company的基本信息2 由于导入限制,把股票分成上交所和深交所分别导入2.1 设置fields为交易所以外的信息2.2 导入股票信息2.3 分别取出上交所和深交所的信息并以dataframe的形式保存2.4 将上交所和深交所的信息纵向合并并储存2.5 查看共有有多少支不重复的股票2.6 &nbs原创 2021-02-01 18:56:52 · 2064 阅读 · 0 评论 -
Tushare Day2——了解stock_basic数据并根据行业和地区进行统计
了解stock_basic数据1 stock_basic基础信息2 导入包和stock_basic数据、查看基本信息3 根据行业列进行统计3.1 1.先把不同行业列举出来,看一下一共有多少种行业3.2 2.统计每个行业分别有多少家公司3.3 3.把行业从array的二维数组形式变成list形式3.4 4.把行业从list形式转换成文本形式3.5 原创 2021-01-30 22:57:42 · 2136 阅读 · 0 评论 -
Tushare Day1——通过Tushare读取数据并存入MySQL
通过Tushare读取数据并存入MySQL1 了解Tushare2 下载sqlalchemy和pymysql包2.1 sqlalchemy2.2 pymysql3 操作实例3.1 导入包3.2 从接口获取数据3.3 将数据储存进mysql中3.4 了解stock_basic数据任务:从api(应用程序编原创 2021-01-29 21:38:15 · 1549 阅读 · 0 评论 -
Untitled18
任务说明学习主题:作者关联(数据建模任务),对论⽂作者关系进⾏建模,统计最常出现的作者关系;学习内容:构建作者关系图,挖掘作者关系学习成果:论⽂作者知识图谱、图关系挖掘数据处理步骤将作者列表进⾏处理,并完成统计。具体步骤如下:将论⽂第⼀作者与其他作者(论⽂⾮第⼀作者)构建图;使⽤图算法统计图中作者与其他作者的联系;社交⽹络分析图是复杂⽹络研究中的⼀个重要概念。 Graph是⽤点和线来刻画离散事物集合中的每对事物间以某种⽅式相联系的数学模型。 Graph在现实世界中随处可⻅,如交通原创 2021-01-25 13:23:48 · 128 阅读 · 0 评论 -
论文04
import seaborn as sns #⽤于画图from bs4 import BeautifulSoup #⽤于爬取arxiv的数据import re #⽤于正则表达式,匹配字符串的模式import requests #⽤于⽹络连接,发送⽹络请求,使⽤域名获取对应信息import json #读取数据,我们的数据为json格式的import pandas as pd #数据处理,数据分析import matplotlib.pyplot as plt #画图⼯具data = [] #初原创 2021-01-23 00:09:04 · 253 阅读 · 3 评论 -
论文分析 03
# 导⼊所需的packageimport seaborn as sns #⽤于画图from bs4 import BeautifulSoup #⽤于爬取arxiv的数据import re #⽤于正则表达式,匹配字符串的模式import requests #⽤于⽹络连接,发送⽹络请求,使⽤域名获取对应信息import json #读取数据,我们的数据为json格式的import pandas as pd #数据处理,数据分析import matplotlib.pyplot as plt #画图⼯原创 2021-01-20 13:27:33 · 108 阅读 · 0 评论 -
论文数据分析02
论文作者统计1 任务说明2 数据处理步骤3 字符串处理4 具体代码实现以及讲解4.1 数据读取4.2 数据统计任务说明任务主题:论⽂作者统计,统计所有论⽂作者出现频率Top10的姓名;任务内容:论⽂作者的统计、使⽤ Pandas 读取数据并使⽤字符串操作;任务成果:学习 Pandas 的字符串操作;数据处理步骤在原始arxiv数据集中论⽂作者 authors 字段原创 2021-01-16 22:03:09 · 164 阅读 · 0 评论 -
数据分析-学术前沿趋势分析-论⽂数据统计
论文数据统计1 数据集简介2 arxiv论文类别介绍3 具体代码实现以及讲解3.1 导入包并读取原始数据3.2 数据预处理3.2.1 粗略统计论文的种类信息3.2.2 判断共出现多少独立种类3.2.2.1 代码解释4 数据分析及可视化4.1 查看所有⼤类的paper数量分布4.1.1&nb原创 2021-01-13 23:38:40 · 2019 阅读 · 0 评论 -
pandas(2)
Pandas基础1 文件的读取和写入1.1 文件的读取1.2 数据写入(数据保存为文件)2 基本数据结构2.1 Series2.2 DataFrame3 常用基本函数3.1 汇总函数3.2 特征统计函数3.3 唯一值函数3.4 替换函数3.4.1  原创 2020-12-19 21:52:18 · 457 阅读 · 1 评论 -
pandas基础1
预备阶段1 Python 基础1.1 语法糖1.1.1 列表推导式1.1.2 条件赋值1.2 匿名函数与 map 方法1.3 zip 对象与 enumerate 方法1.3.1 zip打包1.3.2 enumerate打包1.3.3 解压操作( * 操作符和 zip 联合使用):2 Num原创 2020-12-16 22:56:48 · 154 阅读 · 0 评论 -
大作业 numpy下
大作业1 导入鸢尾属植物数据集,保持文本不变。2 求出鸢尾属植物萼片长度的平均值、中位数和标准差(第1列,sepallength)3 3. 创建一种标准化形式的鸢尾属植物萼片长度,其值正好介于0和1之间,这样最小值为0,最大值为1(第1列,sepallength)。4 找到鸢尾属植物萼片长度的第5、10和第95百分位数(第1列,sepallength)。5 把iris_data数据集中的20个随机原创 2020-12-01 23:35:53 · 504 阅读 · 0 评论 -
线性代数(关于矩阵的运算及各种分解的python实现)
线性代数1 矩阵和向量积2 矩阵特征值与特征向量3 矩阵分解3.1 奇异值分解3.2 QR分解3.3 Cholesky分解4 范数和其它数字4.1 矩阵的范数4.2 方阵的行列式4.3 矩阵的秩4.4 矩阵的迹5 解方程和逆矩阵5.1原创 2020-11-29 23:16:24 · 1637 阅读 · 0 评论 -
描述统计的python实现
统计相关1 次序统计1.1 计算最小值1.2 计算最大值1.3 计算极差1.4 计算分位数2 均值与方差2.1 计算中位数2.2 计算平均值2.3 计算加权平均值2.4 计算方差2.5 计算标准差3 相关3.1 计算相关系数原创 2020-11-27 20:49:52 · 205 阅读 · 0 评论 -
随机抽样的python实现
目录1 随机抽样1.1 离散型随机变量1.1.1 二项分布1.1.2 泊松分布1.1.3 超几何分布1.2 连续型随机变量1.2.1 均匀分布1.2.2 正态分布1.2.3 指数分布1.3 其它随机函数1.3.1 随机从序列中获取元素1.3.2原创 2020-11-25 23:35:52 · 1787 阅读 · 0 评论 -
输入和输出(二进制文件、文本文件、文本格式选项)
输入和输出1 numpy二进制文件1.1 numpy.save()1.2 nuumpy.load()1.3 numpy.savez()2 文本文件2.1 numpy.savetxt()2.2 numpy.loadtxt()2.3 numpy.genfromtxt()3 文本格式选项3.1原创 2020-11-23 21:53:50 · 771 阅读 · 0 评论 -
徐老师python课——个人难点整理(最后其实变成了抄笔记)
目录第一章视频二功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入第一章视频二python中os.path.isdir()和os.path.isfile()的正确用法(其中包括os.listdir(),os.path.join原创 2020-10-19 10:16:03 · 2504 阅读 · 0 评论