- 博客(18)
- 资源 (1)
- 收藏
- 关注
原创 R语言 基于共现提取《雪中悍刀行》人物关系并画网络图
概述雪中悍刀行作为现象级的网文,电视剧版即将上映,作为曾经的一员“妖孽”书粉,按捺不住想做点啥。最近在研究知识图谱,就以此为契机展开相关研究吧。本文将基于简单共现关系,编写 R 代码从纯文本中提取出人物关系网络,并用 networkD3 将生成的网络可视化。共现: 顾名思义,就是共同出现,关系紧密的人物往往会在文本中多段内同时出现,可以通过识别文本中已确定的人名,计算不同人物共同出现的次数和比率。当比率大于某一阈值,我们认为两个人物间存在某种联系。由于共现概率比值的计算方法较为复杂,本文只使用最
2021-07-11 15:06:29 7682 3
原创 用R语言画日历
当我们拿到一系列连续的时间序列数据(比如气候数据,利率数据等),可以用日历图来直观的显示数据的变化程度,而在R中有多种方式可以实现日历图。首先日历图有两种,一是以年为整体单位,一是像我们常用的日历一样以月为单位。在本文中,以年为单位的日历图我们使用基于ggplot2衍生的ggTimeSeries包两种函数作图,以月为单位的日历图我们使用ggplot 和openair包两种方法作图数据说明年日历图数据数据说明:美国2016年1月1号到2020年12月31号的十年期国债收益率数据数据来源:https:
2021-07-07 12:18:14 3262 3
转载 基于人脸的常见表情识别(1)——深度学习基础知识【天池AI训练营打卡】
基于人脸的常见表情识别(1)——深度学习基础知识神经网络1. 感知机2. 多层感知机与反向传播卷积神经网络1. 全连接神经网络的2大缺陷2. 卷积神经网络的崛起卷积神经网络的基本网络层1. 什么是卷积?2. 填充(Padding)3. 步长(Stride)4. 池化5. 卷积和池化输出尺寸计算6. 为什么要用卷积来学习呢?7. 卷积神经网络的优势在哪?神经网络1. 感知机感知机(Perceptron)是 Frank Rosenblatt 在1957年提出的概
2021-04-21 11:28:57 475
原创 python statsmodel 回归结果提取(回归系数、t值、pvalue、R方、、、、)
提取statsmodel里模型结果的各个元素以OLS结果为例相关函数官网链接:https://www.statsmodels.org/stable/search.html?q=OLSResults部分较常用的结果数值提取具体操作示例如下import statsmodels.api as sm# 模型训练model = sm.OLS(y, x).fit()# 查看模型结果model ...
2020-02-09 23:56:45 40532 10
原创 jupyter notebook 代码+结果导出word格式方法 (windows)
方法分两步:1、首先导出为 md格式2、通过系统自带的pandoc命令转换为word格式1、导出md格式:下载后解压2、转换md文件进入md解压后的文件夹,按住shift 点击鼠标右键,菜单栏中选择在此处打开powershell窗口关键一步使用pandoc转换文件,具体格式为:pandoc 待转换文件.md -s -o 转换后文件.docx比如上图就算把 随机森林.md转...
2020-01-13 23:54:20 27818 4
原创 Windows【win10】 CondaIOError: IO error: Missing write permissions in: C:\ProgramData\Anaconda3
如果anaconda安装在 C盘,那么install包的时候可能需要管理员权限,右键anaconda Navigator 以管理员身份运行,即可正常install或者开始菜单找到“Anaconda Prompt”,右键以管理员身份运行 ,然后直接pip install 即可...
2020-01-03 11:33:47 1448
原创 [windows pycharm] flask - sqlite3.OperationalError: unable to open database file
项目文件树图<app.py># 导入所有的模块import sqlite3from flask import Flask, request, session, g, redirect, url_for, abort, render_template, flashfrom contextlib import closing# 配置文件DATABASE = 'flask1...
2019-10-07 16:44:43 784
原创 windows powershell 使用wget 下载文件的代码格式
在linux中 wget是很方便的下载命令在powershell中 也可以使用 wget但是直接用的话不会正常下载,而是返回如下结果wget http://labfile.oss.aliyuncs.com/courses/29/flaskr.zipStatusCode : 200StatusDescription : OKContent : {80,...
2019-10-07 14:47:02 14800 3
原创 Navicat 快捷键大全
Navicat 官方中文文档:https://www.navicat.com.cn/manual/online_manual/cn/navicat/win_manual/index.htmlNavicat 快捷键(常用)1.新建对象:CTRL+N2.新建查询:CTRL+Q3.关闭当前窗口:Ctrl+W4.打开MySQL命令行窗口:F65.运行当前窗口的SQL语句:Ctr...
2019-09-19 10:35:17 5726
原创 数据分析-主成分分析流程(R语言)
主成分分析原理见: http://blog.sina.com.cn/s/blog_14154cb430102xjcc.html主成分分析(principal component analysis,PCA)是一种降维技术,把多个变量化为能够反映原始变量大部分信息的少数几个主成分流程环节为:1、数据预处理。数值型,去缺失值,2、主成分计算。3、判断要选择的主成分数目。4、选择并解释主成分。...
2019-07-27 19:19:05 9041 8
原创 sql填坑小技巧(持续更新)
day1:表格字段查询select * from tablename #全字段查询select id from tablename #字段"id"查询 (单字段查询)select id,name from tablename #多字段查询(字段名用逗号分隔)条件查询select * from tablename where age<30 # where 表示条...
2019-06-03 11:33:35 309
原创 数据分析-虚拟变量的设定(python、R、STATA)
虚拟变量(dummy variables)虚拟变量,也叫哑变量和离散特征编码,可用来表示分类变量、非数量因素可能产生的影响。python设置虚拟变量① 离散特征的取值之间有大小的意义例如:尺寸(L、XL、XXL)离散特征的取值有大小意义的处理函数mappandas.Series.map(dict)参数 dict:映射的字典② 离散特征的取值之间没有大小的意义pandas.get_...
2019-02-28 16:53:14 9584 2
原创 数据分析 R语言 机器学习各种算法作图(开坑,持续更新)
聚类:圆形树状图library(ape)hc = hclust(dist(mtcars))plot(as.phylo(hc), type = &amp;amp;quot;fan&amp;amp;quot;)决策树library(rpart) library(rpart.plot)model&amp;amp;amp;lt;- rpart(label ~ sd+Q25+IQR+sp.ent+sfm+meanfun+mode,
2019-01-09 23:35:36 1382 2
原创 个人思考-关于“技多不压身”
新入行数据分析行业,原本只会python,接单过程中学会POWERbI,R,Stata等一批各式各样的分析软件,最近深感软件虽然多,但应用起来很难,分散了时间,导致自己原本制定的计划一拖再拖,重新思考是否应该做取舍 “技多不压身”的出处: 清·李绿园《歧路灯》第四十四回:“这孙海仙说了这些江湖本领,不耕而食,不织而衣,遨游海内,艺不压身。” 技多真的...
2019-01-07 14:37:54 1839 1
原创 R 填坑小技巧(持续更新)
R语言小技巧一、R语言读取文本文件:1、文件目录操作:getwd() : 返回当前工作目录setwd(“d:/data”) 更改工作目录2、常用的读取指令readread.table() : 读取文本文件read.csv(): 读取csv文件如果出现缺失值,read.table()会报错,read.csv()读取时会自动在缺失的位置填补NA3、灵活的读取指令scan() :4...
2018-12-14 20:48:27 1059
原创 python填坑小技巧 持续更新
文件导入txt与csv文件读取为dataframe利用pandas 里的read_table1、读取txt,且重命名表头import pandas as pddf = pd.read_table('.../data.txt',names=['a','b','c'],header=None,encoding='utf-8').astype(str)2、读取csv,且重命名表头,跳过第一...
2018-11-09 00:57:47 588
原创 数据可视化练习-用powerBI生成自动播放的动态排行榜
数据可视化练习-用powerBI生成自动播放的动态排行榜前言1. 前期准备:账号注册及软件下载2、数据获取及预处理3、可视化效果搭建4、发布共享其他前言最近在B站很流行各种动态排行榜视频,动态排行榜制作源代码来自一位大神基于d3.js做的一个将历史数据排名转化为动态柱状图图表的数据可视化项目,但原项目中的图表在网页上是一次性运行,除非实时录屏,否则在其他电脑上需重做,无法直接分享,本人新入数据...
2018-11-08 20:34:39 27086 2
Tushare R包
2019-01-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人