自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(35)
  • 收藏
  • 关注

转载 批量处理文件提取文件名并把有相同文件名的文件发放在同一个文件夹下

脚本语言原理可以参看这位博主的文章https://www.cnblogs.com/dasusu/p/9058554.html有一个这样的文件,想要按照规则提取这些文件名,自动生成文件夹,并把数据移动到对应的文件夹下得到的结果见这样脚本内容见下,建立这个脚本文件,后缀名名设为bat,将这个脚本放在第一张图的文件所在地址,点击运行就可以了@echo offse...

2019-03-25 18:05:00 2773

转载 序列数据波峰识别以及波峰形状识别

转载请注明出处:https://www.cnblogs.com/bethansy/p/10560341.html1、波峰识别 序列数据是按照时间进行采集,其中400个点一个周期,一条数据共10个周期,即4000个点。 首先针对序列数据判断每个周期是否存在波峰,并在存在波峰的情况下进行波峰形状识别。 其中波峰识别主要遍历寻找某个值既大于左边又大于右边1.1、参数:①p...

2019-03-19 18:05:00 3223

转载 电信用户流失率预测

二、代码实现# /usr/bin/python# -*- encoding:utf-8 -*-# data analysisimport pandas as pdimport numpy as npimport random as rnd# visualizationimport seaborn as snsimp...

2019-01-12 23:56:00 486

转载 几种相似度方法

1、相似度的几种方法1.1Jaccard相关系数 Jaccard相关系数主要用于计算两个集合的并集和交集的比值来度量用户相似度 注:Jaccard相关系数适合计算离散型集和的相似度,对于非离散型的评分矩阵,Jaccard相关系数没有考虑评分值对相似度的影响,对于10级评分矩阵的相似度计算效果较差1.2余弦相似度 余弦相似度通过计算两个...

2018-08-27 19:37:00 2175

转载 本地电脑无法连接到MySQL

问题描述:ERROR 1130 (HY000): Host 'localhost' is not allowed to connect to this MySQL server首先网上的问题大部分是远程登陆MySQL,用户Ip没有权限,用本机登陆增加权限。但是我的就是本地都进不去。。。安装的是官网的mysql免安装版 https://dev.mysql.com/dow...

2018-08-16 18:25:00 232

转载 数据结构算法编程

1.打印一个链表,从尾到头打印链表# -*- coding:utf-8 -*-# class ListNode:# def __init__(self, x):# self.val = x# self.next = Noneclass Solution: # 返回从尾部到头部的列表值序列,例如[1,2,3]...

2018-06-09 17:14:00 179

转载 Kaggle项目实战一:Titanic: Machine Learning from Disaster

项目地址 https://www.kaggle.com/c/titanic项目介绍: 除了乘客的编号以外,还包括下表中10个字段,构成了数据的所有特征VariableDefinitionKeysurvival是否存活0 = No, 1 = Yespclass...

2018-05-14 18:21:00 237

转载 数据分析相关技能

1、相关性分析参考文档:http://bluewhale.cc/2016-06-30/analysis-of-correlation.html首先绘图查看:折线图(双坐标轴),散点图其次计算相关系数:person相关系数,协方差回归:一元回归或者多元回归。信息熵及互信息:度量文本特征的相关关系2、展示转载于:https://www.cnblog...

2018-01-28 20:06:00 104

转载 DataFrame基本操作

这些操作在网上都可以百度得到,为了便于记忆自己再根据理解总结在一起。---------励志做一个优雅的网上搬运工1.建立dataframe(1)Dict to Dataframedf = pd.DataFrame({'key1':['a','a','b','b','a'],'key2':['one','two','one','two','one'],'data1':np....

2018-01-21 11:39:00 212

转载 pycharm中可以运行脚本但是不能debug脚本

以前用的时候好好地,但是最近上班突然脚本就不能debug了,debug直接报错,如下所示上网查过该有的原因:1.在pycharm中两个地方设置成utf-8,页面右下角和File>setting中编码设置成UTF-82.脚本编码问题的解决:使用notepad++打开test.py发现文件存储的格式是ANSI只要将保存文件的格式换成UTF-8就好了只用n...

2017-12-04 10:04:00 703

转载 Python建立多线程任务并获取每个线程返回值

1.进程和线程 (1)进程是一个执行中的程序。每个进程都拥有自己的地址空间、内存、数据栈以及其他用于跟踪执行的辅助数据。进程也可以派生新的进程来执行其他任务,不过每个新进程都拥有自己的内存和数据栈,所以只能采用进程间通信(IPC)的方式共享信息。 (2)线程与进程类似,不过他们是在同一个进程下执行的,并共享相同的上下文。线程一般是以并发方式执行的,但是在单核CPU中真...

2017-12-03 16:15:00 2015

转载 用谷歌浏览器模拟打开天眼查网站并爬取需要的数据

转载请注明地址:http://www.cnblogs.com/bethansy/p/7683130.html安装软件,部署各种环境 (1)安装软件 安装python3.6 和pycharm2017,都在官网上下载即可。注意安装python3.6时注意勾选添加环境变量,安装pycharm后,打开软件会让你激活,按照下面的步骤操作即可第一步:一路默认到这个...

2017-10-17 18:04:00 1355

转载 java调用python脚本并向python脚本传递参数

1、安装Eclipse先安装jdk,再安装Eclipse,成功后开始建立py_java项目,在这个项目的存储目录SRC下建立test包,在test包中New-Class,新建MyDemo类,建好完成后就可以在MyDemo中写代码了2、python脚本内容import numpy as npfrom selenium import webdriverd...

2017-09-30 13:59:00 520

转载 sql必知必会

1、根据条件查询数据库中数据,并返回数据条数去掉count就会返回数据库中符合条件的所有数据SELECT COUNT(*) FROM sentiment_info WHERE sentiment_source='海丝商报' AND sentiment_type='要闻' AND sentiment_source_id='1056162'其他查询操作:se...

2017-09-28 11:37:00 189

转载 python爬虫----XPath

1.知道本节点元素,如何定位到兄弟元素 详情见博客 XML代码见下bt1在文档中只出现一次,所以很容易获取到bt1中内容,那怎么根据<td class='bt1'>来获取bt2中的内容 content_title = driver.find_element_by_xpath("//td[@class='bt1']"...

2017-09-28 11:36:00 156

转载 定时爬取海丝财经网站新闻内容

1、定时器1.1一直执行程序 直接在python脚本中加入几行代码,让这个脚本一直运行 scheduler = BlockingScheduler() scheduler.add_job(mainAll, 'cron', second='*/50', hour='*/8') print('Press Ctrl+{0} to exit'.for...

2017-09-26 11:21:00 137

转载 传染病传播模型(SIS)Matlab代码

function spreadingability=sir(A,beta,mu)for i=1:length(A) for N=1:50%随机次数 InitialState=zeros(length(A),1);InitialState(i)=1; time=5;%传播时间 I(N,:)=sire(A,Initial...

2017-09-03 19:14:00 11679

转载 李航统计学习方法——算法3朴素贝叶斯法

一、贝叶斯分类 是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称贝叶斯分类。而贝叶斯分类中最简单的一种:朴素贝叶斯分类。二、贝叶斯定理: 已知某条件概率,如何得到两个事件交换后的概率,也就是在已知P(A|B)的情况下如何求得P(B|A)。三、朴素贝叶斯分类思想: 给出待分类项,求解在此项出现的条件下其他各个类别...

2017-08-26 16:52:00 145

转载 李航统计学习方法——算法2k近邻法

2.4.1构造kd树 给定一个二维空间数据集,T={(2,3),(5,4),(9,6)(4,7),(8,1),(7,2)},构造的kd树见下图2.4.2kd树最近邻搜索算法三、实现算法 下面算法实现并没有从构建kd树再搜索kd树开始,首先数据分为两部分,train数据和predict的数据,将train的数据抽取k个作为predict的最临近k节点,计算...

2017-07-30 19:05:00 297

转载 李航统计学习方法——算法1感知机学习

介绍之前先讲两个概念转载请注明出处:http://www.cnblogs.com/bethansy/p/7235133.html一、回归1.定义: 回归属于监督学习,用于预测输入变量和输出变量之间的关系。 回归模型表示从输入到输出变量之间的映射的函数,回归问题的学习等于函数拟合:选择一条函数曲线使其很好滴拟合已知数据且很好地预测未知数据。2.回归分类: ...

2017-07-25 16:58:00 118

转载 复杂网络研究文献中出现过的数据汇总

一、数据资源1、斯坦福大学网站一般提供大社区数据,节点动则上万,十万百万等,包括已知社区划分的网络数据。 http://snap.stanford.edu/data/index.html2、数据堂 数据堂上提供的数据多是论文中出现的数据,按数据名称搜索即可 http://www.datatang.com/3...

2017-07-21 11:28:00 149

转载 聚类系数可变无标度网络模型Holme-Kim HK模型

# -*- coding: cp936 -*-import randomimport networkx as nxfrom networkx.generators.classic import empty_graphdef powerlaw_cluster_graph(n, m, p, seed=None): """Holme and Kim algor...

2017-07-05 18:35:00 932

转载 用Python玩转数据第六周——高级数据处理与可视化

1、matplotlib中有两个模块,pyplot和pylabimport matplotlib.pyplot as plt ///plt.plot(x,y)import pylab as pl ///pl.plot(x,y)import pandas as pd 、///data.plot(),data的数据类型是series和dataFreem绘制折线...

2017-06-22 16:56:00 175

转载 用Python玩转数据——第五周数据统计和可视化

一、数据获取1.本地数据with语句,pd.read_csv('data.csv')2.网站上数据 2.1 直接获取网页源码,在用正则表达式进行删选 2.2 API接口获取---以豆瓣为例 importrequests r=requests.get(https://api.douban.com/v2/book/10...

2017-06-20 17:46:00 194

转载 Python中第三方库的安装

网上的帖子挺多的,教你如何安装,安装第三方工具库的方法总共分为三类:Dos系统下pip命令;安装包下载安装;IDE集成环境下安装(Pycharm,Spyder……)http://www.jianshu.com/p/41a9c25273b1一、pip命令 感觉这个最简单,但是需要注意几点1、get-pip这个文件是否在您的Python目录中,Python官网中也指出当你的...

2017-06-16 19:31:00 157

转载 python 查找字符串中字母的个数

2017.6.17更新:好像知道错在哪里了。以第一个为例,输入应该是“AHHaaBBa”,因为直接输入AHHaaBBa时,系统不知到这是一个变量还是字符串,所以必须输入的时候申明定义。既然这样的话,那我在str=input()的时候将输入定义成字符串格式例如str=str(input())这样呢?结果还是不可以。。。最后,最好不要把变量名和函数名取得一样,就像我这里的str就很不...

2017-06-15 16:06:00 2302

转载 A Node Influence Based Label Propagation Algorithm for Community detection in networks 文章算法实现的疑问...

这是我最近看到的一篇论文,思路还是很清晰的,就是改进的LPA算法。改进的地方在两个方面:(1)结合K-shell算法计算量了节点重重要度NI(node importance),标签更新顺序则按照NI由大到小的顺序更新 得到ks值后,载计算一下节点邻居ks值和度值d的比值(2)当出现次数最多的标签不止一个时,再计算一下标签重要度LI(label importa...

2017-06-13 11:28:00 311

转载 Fast Newman-FN算法以及模块度定义介绍

一、社区的定义 Newman第一次提出模块度定义就是在2004年发表的这篇文章“fast algorithm for community structure in networks”,第一次用量化的公式来确定社区划分。 首先,我们来看Newman如何定义社区的:the vertices in networks are often found to cluste...

2017-06-09 21:18:00 2723

转载 Label Propagation Algorithm LPA 标签传播算法解析及matlab代码实现

转载请注明出处:http://www.cnblogs.com/bethansy/p/6953625.htmlLPA算法的思路: 首先每个节点有一个自己特有的标签,节点会选择自己邻居中出现次数最多的标签,如果每个标签出现次数一样多,那么就随机选择一个标签替换自己原始的标签,如此往复,直到每个节点标签不再发生变化,那么持有相同标签的节点就归为一个社区。算法优点:思路简...

2017-06-06 20:59:00 963

转载 LFR benchmark graphs 人工网络生成程序

人工网络生成程序,可在CSDN上免费下载或者科学网这边也可以下载参数• n: number of vertices;• k: average degree;• maxk: maximum degree;• mu: mixing parameter (the higher the mixing parameter of a network is, the more diffic...

2017-05-22 22:36:00 1155

转载 社区发现的3个评估指标:标准化互信息NMI,ARI指标,以及模块度(modularity)...

转载请注明出处:http://www.cnblogs.com/bethansy/p/6890972.html一、已知真实社区划分结果1.NMI指数,互信息和标准化互信息 具体公式和matlab代码参见博客,Python代码参加,C++代码参见function MIhat = nmi( A, B )%NMI Normalized mutual in...

2017-05-22 19:21:00 1918

转载 LabelRank非重叠社区发现算法介绍及代码实现(A Stabilized Label Propagation Algorithm for Community Detection in Networ...

最近在研究基于标签传播的社区分类,LabelRank算法基于标签传播和马尔科夫随机游走思路上改装的算法,引用率较高,打算将代码实现,便于加深理解。这个算法和Label Propagation 算法不同的是计算复杂度较高,对每个标签都确定了概率,但是准确性比Label Propagation算法好。一、概念相关概念不再累述,详情见前两篇文章二、算法思路 首先建立一...

2017-05-10 22:10:00 564

转载 Top Leaders社区发现算法(top leaders community detection approach in information networks)

一、概念复杂网络:现实生活中各种系统都可以看做成复杂网络,复杂网络构成包括节点和边,节点是网络中的基本组成单元,节点之间的联系或者关系是网络中的边。例如 电力网络:基站代表节点,基站之间是否互通表示边; 社交网络:用户代表节点,用户的关注关系表示边; 万维网络:网页代表节点,网页的链接关系代表边; 交通运输网络,神经网络,经济贸易网络,科学家合...

2017-04-28 10:59:00 265

转载 SLAP(Speaker-Listener Label Propagation Algorithm)社区发现算法

其中部分转载的社区发现SLPA算法文章一、概念社区(community)定义:同一社区内的节点与节点之间关系紧密,而社区与社区之间的关系稀疏。设图G=G(V,E),所谓社区发现是指在图G中确定nc(>=1)个社区C={C1,C2,...,Cnv},使得各社区的顶点集合构成V的一个覆盖。若任意两个社区的顶点集合的交际均为空,则称C为非重叠社区(disjoin...

2017-04-18 10:34:00 896

转载 CPM(Cluster Percolation method)派系过滤算法

一、概念(1)完全子图/全耦合网络/k-派系:所有节点全部两两相连 图1这些全耦合网络也成为派系,k-派系表示该全耦合网络的节点数目为k1)k-派系相邻:两个不同的k-派系共享k-1个节点,认为他们相邻2)k-派系连通:一个k-派系可以通过若干个相邻的k-派系到达另一个k-派系,则称...

2017-04-13 16:50:00 726

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除