自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Candy_boy

自信 热情 专注 有爱心

  • 博客(48)
  • 收藏
  • 关注

原创 python中的pd进行数据处理

1、用pd读取excel中的的某一列生成列表,并将集合或列表写进exceldef excel_one_line_to_list(): df = pd.read_excel(r"poi_grid.xlsx",usecols=[1], names=None) # 读取项目名称列,不要列名 df_li = df.values.tolist() # print(df_li) result = [] for s_li in df

2020-08-12 12:06:44 14541

原创 神经网络训练时只对指定的边更新参数

神经网络

2023-02-21 21:14:48 814

原创 linux常用命令

linux常用命令

2022-12-25 10:33:18 183

原创 python常用操作

【代码】python常用操作。

2022-10-21 11:03:56 257

原创 通俗理解图神经网络GNN

3)在搭建GNN网络时,搭建的其实是上面的参数α , β , f \alpha,\beta,fα,β,f的表示方法,因此这是与图的形状无关的。4)值得注意的是,GNN的一层是指节点们的一层embedings的表示,并且大多数GNN都是2-4层。1) GNN 一般处理的任务是图分类或者节点分类,可以看出GNN一般的处理过程是对节点特征进行的训练。2)GNN中的NN学习的是在聚合节点时自己多重要,周围节点多重要,以及周围节点该怎么聚合,这是与图的形状无关的;这就是GNN做的事情。...

2022-08-29 14:52:01 432

原创 Pytorch的shuffle

def Shuffle(self, x, y,random=None, int=int): """x, random=random.random -> shuffle list x in place; return None. Optional arg random is a 0-argument function returning a random float in [0.0, 1.0); by default, the standard ran.

2022-05-07 15:33:13 719

原创 python用Levenshtein计算文本相似度

from Levenshtein import *apply_edit() #根据第一个参数editops()给出的操作权重,对第一个字符串基于第二个字符串进行相对于权重的操作 distance() #计算2个字符串之间需要操作的绝对距离 editops() #找到将一个字符串转换成另外一个字符串的所有编辑操作序列 hamming() #计算2个字符串不同字符的个数,这2个字符串长度必须相同 inverse() #用于反转所有的编辑操作序列 jaro() #计算2个字符串的相识度.

2021-07-23 16:00:46 497

原创 判断一个链表是否有环 Python

# Definition for singly-linked list.# class ListNode:# def __init__(self, x):# self.val = x# self.next = Noneclass Solution: def hasCycle(self, head: ListNode) -> bool: if not head: return False

2021-04-15 16:13:07 169

原创 NC 78:单链表反转 Python实现

# class ListNode:# def __init__(self, x):# self.val = x# self.next = Noneclass Solution: # 返回ListNode def ReverseList(self, pHead): if not pHead or not pHead.next: return pHead last = None #指向上一

2021-04-15 12:41:45 209

原创 3 无重复字符的最长子串

给定一个字符串,请你找出其中不含有重复字符的 最长子串 的长度。示例输入: “abcabcbb”输出: 3解释: 因为无重复字符的最长子串是 “abc”,所以其长度为 3。解题思路双指针:指针l指在头,另一个指针r滑动遍历,在字典中记录遇到过的字符及下标若指针r指向的字符没有出现过,记录并更新当前字串的长度若出现过,l移到上次出现的坐标的下一位,不用比较当前的长度,因为当前的长度一定小于上一次的长度直到r指向字符串最后一位代码实现class Solution(object):

2021-03-19 15:41:29 93

原创 2 两数相加

给出两个 非空 的链表用来表示两个非负的整数。其中,它们各自的位数是按照 逆序 的方式存储的,并且它们的每个节点只能存储 一位 数字。如果,我们将这两个数相加起来,则会返回一个新的链表来表示它们的和。您可以假设除了数字 0 之外,这两个数都不会以 0 开头。示例输入:(2 -> 4 -> 3) + (5 -> 6 -> 4)输出:7 -> 0 -> 8原因:342 + 465 = 807解题思路两个列表同时遍历,逐位相加,保留进位代码实现# Defin

2021-03-19 15:04:01 109

原创 Python实现LeetCode 1、两数之和

给定一个整数数组 nums 和一个目标值 target,请你在该数组中找出和为目标值的那 两个 整数,并返回他们的数组下标。你可以假设每种输入只会对应一个答案。但是,你不能重复利用这个数组中同样的元素。示例给定 nums = [2, 7, 11, 15], target = 9因为 nums[0] + nums[1] = 2 + 7 = 9所以返回 [0, 1]解题思路用字典保存遍历过的数字和下标寻找target-nums[i]是否在字典中出现过,是则返回两数的下标否则存入nums[i]及

2021-03-19 11:02:53 68

转载 python实现数据结构(1)

数据结构一些概念数据结构就是研究数据的逻辑结构和物理结构以及它们之间相互关系,并对这种结构定义相应的运算,而且确保经过这些运算后所得到的新结构仍然是原来的结构类型。数据:所有能被输入到计算机中,且能被计算机处理的符号的集合。是计算机操作的对象的总称。数据元素:数据(集合)中的一个“个体”,数据及结构中讨论的基本单位数据项:数据的不可分割的最小单位。一个数据元素可由若干个数据项组成。数据类型:在一种程序设计语言中,变量所具有的数据种类。整型、浮点型、字符型等等逻辑结构:数

2021-03-19 10:42:39 1118

原创 Conda报错: HTTP 000 CONNECTION FAILED for url <https://repo.anaconda.co

错误原因:默认镜像源访问速度过慢,会导致超时从而导致更新和下载失败。解决方案:更换镜像源为清华镜像源,并且删除默认镜像源。首先执行如下几条命令更换清华镜像源conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-f

2020-10-28 15:55:33 5118 1

原创 WINDOWS下的启动BERT-SERVING-SERVER报错 TypeError: ‘NoneType‘ object is not iterable

原因分析python3.7.3版本下安装tensorflow默认2.0.0,不支持tensorflow1.10.0,而暂时bert-serving-server不支持tensorflow2.0.0,建议tensorflow1.10.0版本,python3.5。不然会报错:TypeError: ‘NoneType’ object is not iterable #377fail to optimize the graph!附github链接启动出错其他问题可查询链接一、ANACONDA环境配置

2020-10-28 14:16:33 2828 3

原创 python连接Hive数据库

import pandas as pdfrom impala.dbapi import connectclass Hive: def __init__(self, host, port=1050): self.conn = connect(host, port) self.cursor = self.conn.cursor() def close(self): self.cursor.close() self.conn.

2020-08-12 12:13:20 1200

原创 DeepWalk: Online Learning of Social Representations. KDD2014

video和slides:http://videolectures.net/kdd2014_perozzi_deep_walk/论文翻译:https://www.jianshu.com/p/5adcc3d94159问题:1.skipgram2.分层softmax3.代码阅读

2020-03-02 14:03:43 193

原创 人工智能的顶会简介

CVPR国际计算机视觉与模式识别会议(CVPR)是IEEE一年一度的学术性会议,会议的主要内容是计算机视觉与模式识别技术。CVPR是世界顶级的计算机视觉会议(三大顶会之一,另外两个是ICCV和ECCV),近年来每年有约1500名参加者,收录的论文数量一般300篇左右。本会议每年都会有固定的研讨主题,而每一年都会有公司赞助该会议并获得在会场展示的机会。2.ECCVECCV的全称是Europ...

2020-03-02 13:35:27 1414

原创 用U盘重装系统时无法识别的解决办法

不管是不是uefi启动,都要禁用Secure boot,否则无法识别启动盘,然后启动模式boot mode选择带有UEFI或Both的表示可以识别uefi启动盘如果你的BIOS里有这些选项请设置如下:Secure Boot 设置为Disabled【禁用启动安全检查,这个最重要】OS Optimized设置为Others或Disabled【系统类型设置】CSM(Compatibility S...

2020-03-02 13:05:57 3618

原创 JetBrains IDEA/Pycharm/Phpstorm/webstorm等破解教程:使用教育邮箱免费激活

1.在网址https://www.jetbrains.com/store/?fromMenu#edition=discounts中说明如下,可见JetBrains对于师生是免费的。2.在网址https://www.jetbrains.com/zh/student/即可申请。3.申请完成后,在自己的教育邮箱中点击Confirm Request,再在跳转的新网址中阅读协议并确认(好像是协议),即可...

2020-01-20 19:25:24 1582

原创 找回环境变量path里的值

按 win +R,输入 regedit以打开注册表。找到如下项HKEY_LOCAL_MACHINE\SYSTEM\ControlSet002\Control\Session Manager\Environment,如果没有,可以找HKEY_LOCAL_MACHINE\SYSTEM\ControlSet001\Control\Session Manager\Environment,把里面的path...

2019-12-14 09:43:13 533

原创 网页上文本框禁止复制粘贴怎么破解

我们首先来介绍如何实现禁止复制,知道了禁止的方式,再破解就容易了。实现禁止复制粘贴比较简单,直接上代码:<style type="text/css">/* 最简单的实现禁止复制的方法,采用css方式禁止文字选择,当然这只兼容webkit内核浏览器 */* { -webkit-user-select: none; }p {font-family: 'Microsoft Yah...

2019-12-03 21:54:42 9108 2

原创 大数据分析:利用LSI算法,求词项与文档的2维表示。

已知词项文档矩阵利用LSI算法,求词项与文档各自的2维表示。from numpy import linalg as lafrom numpy import matA = mat([[1,0,1,0,0,0],[0,1,0,0,0,0],[1,1,0,0,0,0],[1,0,0,1,1,0],[0,0,0,1,0,1]])U,S,T = la.svd(A)//SVD降维# pr...

2019-11-11 21:29:45 572 1

原创 python计算欧氏距离

计算两个点的欧式聚类,在Python里我们可以通过numpy 实现假设有两个List,或者元组的元素a=[1,2,3]b=[3,4,5]这个时候我们是需要先把这两个元素转换成array的形式。import numpy as npvec1 = np.array(a)vec2 = np.array(b)# 方法一distance= np.sqrt(np.sum(np.square...

2019-11-05 21:42:59 1693 1

原创 距离计算方法总结

计算推荐对象的内容特征和用户模型中兴趣特征二者之间的相似性是推荐算法中一个关键部分 ,相似性的度量可以通过计算距离来实现在做很多研究问题时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。本文的目的就是对常用的相似性度量作一个总结。本...

2019-11-05 21:34:27 1441

原创 大数据分析:利用SVD分解对数据进行降维

问题描述:写程序利用SVD分解对数据进行降维,并画出降维后各个节点在”新维度“上值的分布。例如对于矩阵 A(mxn) = UΣV^T, U 分解后每一列〖 u〗i 有m个元素对应m个点,记为〖 u〗(i*). 我们画出〖 u〗_1-〖 u〗_2的坐标下的m个点的散点图数据集1:https://github.com/shenghua-liu/HoloScope/blob/master/testd...

2019-10-05 20:28:23 1941 1

原创 使用scipy.sparse保存稀疏矩阵

from scipy import sparsefrom scipy.sparse import hstack, csr_matriximport osfname = 'df.npz'if not os.path.exists(fname): df = get_df() df = hstack([csr_matrix(df), csr_matrix(df)]) sp...

2019-09-21 12:05:42 1066

原创 转:Google大数据三篇著名论文中文版

Google File System中文版Google MapReduce中文版Google Bigtable中文版

2019-09-15 14:45:56 245

原创 设置Chrome浏览器点击Google搜索结果在新页面打开

1、登录Google Docs账号2、进入下面的设置界面http://www,google.com/prefences3、找到结果打开方式,打上勾即可最后不要忘了保存

2019-08-25 14:24:36 3639

原创 python爬取网页唯美图片

爬取过程分析:1、打开url:http://www.mmonly.cc/wmtp/wmwz/, 调出开发者工具,刷新页面2、算了,不想分析了,比较简单( ̄^ ̄゜)看看代码吧:import urllibimport requestsfrom bs4 import BeautifulSoupimport osdef Download(url, picAlt, name): ...

2019-08-02 16:48:55 346

原创 python去哪儿网的旅游景点信息

爬取过程分析:1、网站url:‘https://piao.qunar.com/ticket/list.htm?keyword=北京&page=1’2、http请求方法为get方法3、用beautifulsoup提取所需要的信息4、将爬取的信息存至本地具体代码如下:import requestsfrom bs4 import BeautifulSoupclass QuNa...

2019-08-02 10:17:37 1119

原创 python爬取北京政务公开惠民地图信息

爬取过程分析:1、分析网页可知上面的数据为json格式2、找到json数据的请求地址https://map.beijing.gov.cn/api/place_list_for_category.json?categoryId=3、设计数据库的表4、将爬取的数据存到mysql数据库中具体代码如下:import pprintimport requestsfrom DBcm impor...

2019-08-01 16:14:18 571

原创 mysql常用命令集合

mysql -u root -p //管理员登陆show databases; //显示所有的数据库use ‘databasename’; //进入数据库show tables; //显示数据库中所有的表des ‘tablename’; //显示表的结构create 'databasename'; // 创建数据库create user 'username'@'localhost...

2019-08-01 11:16:02 99

原创 python爬取链家二手房信息

爬取过程分析:1、链家网url:https://bj.lianjia.com/ershoufang/pg2/显示的二手房信息每个url递增一2、访问时要加头信息,否则无法访问3、用beautifulsoup解析网页,找到二手房信息4、将信息简单处理后保存成csv文件具体代码如下:import requestsimport refrom bs4 import BeautifulSo...

2019-07-31 15:10:28 3073 2

原创 python爬取豆瓣电影Top250表单

爬取过程分析:1、url:https://movie.douban.com/top250?start=0&filter=分析该url发现每页显示25部电影,url地址每次递增25显示下一页面2、利用beautifulsoup得到电影名字,评分和图片3、将得到的电影图片存至本地,以电影名+评分命名具体代码如下:import requestsfrom bs4 import Bea...

2019-07-31 09:36:59 788

原创 python爬取好豆网菜谱

爬取过程分析:1、分析网页,发现好豆网的菜谱的url均为:https://www.haodou.com/recipe/id/2、用beautifulsoup解析网页获得菜名,图片及菜谱3、将菜的图片存至本地,以菜名命名,将菜谱import requestsimport urllibimport reimport lxmlfrom bs4 import BeautifulSoup...

2019-07-30 18:13:04 1092

原创 python爬取网易云音乐专辑的所有歌曲

爬取过程分析:1、确定要爬取专辑的url实际地址2、通过xpath筛选数据,找出该专辑所有歌曲的id3、将歌曲的id与外链地址相拼接,得到歌曲的真是下载地址网易云音乐外链地址:https://link.hhtjim.com/4、下载,将歌曲写入文件代码如下:# import requests## url = 'https://m10.music.126.net/2019073...

2019-07-30 10:17:31 2114 1

原创 python3,使用sys.setdefaultencoding('utf-8'),编译时报错

正常情况下,我们在使用python做页面开发时,防止中文出现乱码问题,python2 情况下会使用:如下语句—import requests, re, sysreload(sys)sys.setdefaultencoding("utf-8")但在python3下,报错: sys.setdefaultencoding('utf-8')AttributeError: module ...

2019-07-29 10:40:39 3408

原创 基于STM32的智慧矿山之矿井安全监控终端的设计与实现

项目源码下载:https://github.com/wentaoStyle/STM32Project1.git一、技术参数:硬件平台为基于Cortex-M3内核的奋斗STM32F103开发板,各传感器模块采用数字化模块,LCD模块采用FSMC接口方式,利用GPIO控制通风装置的开启或关闭,STM32F103与窄带物联网(NB-IoT)模块的接口为USART。二、设计要求:具有对矿井温度、...

2019-07-29 08:17:04 4223 1

原创 Python入门基础知识(二)

一、构建一个Web应用除了已经掌握的python知识,要构建一个实际运行的服务器端Web应用,还需要了解Web应用框架,它提供了一组通用的基础技术,可以基于这些技术构建你的Web应用,在这里,我们直接选择一个名为Flask的流行框架安装Flaskwindows上,打开一个命令行提示窗口,一定要作为管理员运行,执行下面的命令:py -3 -m pip install flask在Mac ...

2019-07-26 16:54:49 329

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除