python
棒棒糖one
初来乍到,请多关照
展开
-
斐波那契数列
运用方法:递归调用代码实现:class Solution(object): def __init__(self, name, salary): self.name = name self.salary = salary def fib(self, n): """ :type n: int :rtype: int """ if n == 0: retu原创 2021-03-28 10:46:11 · 168 阅读 · 0 评论 -
Python机器学习——KNN
目录原理步骤案例原理1、KNN(K-nearest neighbors):意为K近邻。取名由来or算法思想:如果想要了解一个人的经济水平,只需要知道他最好的5个朋友的经济能力,对他的这五个朋友的经济水平求平均就是这个人的经济水平2、在一个没有标签的样本进入算法后,首先计算他与训练集中每个样本的距离,找到与他最近的K个样本,然后用他这K个最近邻居的标签来确定它的标签3、属于机器学习中有监督的分类预测模型,K表示要用到多少个邻居的数量步骤1、给定测试样本,计算每个测试样本与训练集中每个样本的距原创 2021-03-15 10:57:10 · 177 阅读 · 0 评论 -
Python 岛屿个数判断
Python 岛屿个数判断题目:解题思路:题目:给一个 01 矩阵,1 代表是陆地,0 代表海洋, 如果两个 1 相邻,那么这两个 1 属于同一个岛。我们只考虑上下左右为相邻。岛屿: 相邻陆地可以组成一个岛屿(相邻:上下左右) 判断岛屿个数。01 矩阵范围<=200*200# 例:a = [ [1,1,0,0,0], [0,1,0,1,1], [0,0,0,1,1], [0,0,0,0,0], [0,0,1,1,1]]# 有三个岛屿解题原创 2021-03-13 16:39:31 · 587 阅读 · 0 评论 -
Python 巨人吃豆
代码题:有一个巨人,每走一米需要吃一颗豆子,身上最多带m颗豆子,桥长n米,桥这边有无数颗豆子,问巨人过桥最少要吃多少颗豆子。(巨人可以在桥上放豆子折返)1、m=60,n=80 最少需要多少颗;如何证明是最少2、m=60, n=81 最少需要多少颗3、写代码实现 f(m,n)要求1个小时内返回结果,给出 分析、思路和代码。# coding=utf-8def f(tempM,tempN): count = 0 # [minN,maxN] minN = 0 m原创 2020-06-12 18:28:26 · 482 阅读 · 0 评论 -
python 分类型数据转化数值型
将分类型变量转换成数值型变量的两种方法一、map映射性别映射数值先创建一个map ,再将map映射到表格中的值sex_mapping = {"male": 0, "female": 1}train_df['Sex'] = train_df['Sex'].map(sex_mapping)二、get_dummies()函数pandas.get_dummies(data, prefix=...原创 2020-04-21 23:37:25 · 6743 阅读 · 0 评论 -
分别使用SQL、R和python将宽数据和长数据互相转换
在进行数据处理时,通常需要对表的格式进行调整,将长表转换成宽表,或将宽表转换成长表,那么在这里总结下集中常用工具来进行表格式转换的方法。一、什么是长数据和宽数据?长数据表格式如下:宽数据表格式如下:二、使用mysql 进行转换SELECT student,MAX(CASE subject WHEN '语文' THEN score END) AS '语文',MAX(CASE sub...原创 2020-03-17 23:37:51 · 2509 阅读 · 0 评论 -
将引用矩阵转换成vosviewer可识别的txt格式并作图
一、转换数据格式输入数据格式如下:代码import pandas as pdimport csv#读csv文件def readCsvFile(file_name): birth_data = [] with open(file_name,encoding = 'utf-8') as csvfile: csv_reader = csv.reader(csvfile) # 使...原创 2020-02-02 17:48:41 · 4004 阅读 · 11 评论 -
Python读取CSV成数据框并进行筛选和相关性检验
一、第一种方法读取后为list,再转化为数据框import csvfrom pandas.core.frame import DataFramecsv_file=csv.reader(open('合并.csv','r'))content=[] #用来存储整个文件的数据,存成一个列表,列表的每一个元素又是一个列表,表示的是文件的某一行for line in csv_file: #...原创 2019-09-27 17:20:17 · 7656 阅读 · 1 评论 -
由学科引用矩阵计算相似度
本文是用Excel表格内的学科引用矩阵计算得到学科相似度,分为以下几个步骤:第一步,读取Excel数据,返回行标签和列标签和内部的数值(n维数组)。第二步,对数据按行进行计算相似度。其中这里写了2个计算相似度的方法,一个是cosine相似度,另一个是由张琳的这篇文章《Diversity of References as an Indicator of theInterdisciplina...原创 2019-08-13 10:24:43 · 1800 阅读 · 9 评论 -
统计mysql中学科引用表中学科引用次数
将学科相互引用表中的数据,统计出来,做成学科引用次数的矩阵table2格式如下:字段re_sub即引文所在学科,ar_sb即文章所在学科,有这两个字段即可计算学科引用次数,并将其填充到Excel表格中,做成矩阵形式import pymysql.cursorsimport logginglogging.basicConfig(filename='log.log', ...原创 2019-07-12 15:37:00 · 223 阅读 · 0 评论 -
将列表导入excel并以矩阵形式排列
将 [[(0, 0.043816663), (1, 0.04390042), (2, 0.91228294)], [(0, 0.03811829), (1, 0.03805999), (2, 0.9238217)]]元组数据导入Excel并以矩阵的形式排列def saveAticleTopicsResultToFile(result,outPutFile): r = [] ...原创 2019-05-27 09:43:33 · 1597 阅读 · 0 评论 -
pandas_numpy小尝试
首次使用Jupyter notebook 来做笔记,先试验一下~print('hello,word')hello,word开始把前几天学过的pandas 和numpy两个包小试一下~import pandas as pdimport numpy as np使用pandas下的数据框展示数据gdp = pd.DataFrame([[11.61,13.08,13.67,15.05]...原创 2019-03-04 21:31:49 · 315 阅读 · 0 评论 -
diabetes多元线性回归
import matplotlib.pyplot as pltimport numpy as npfrom sklearn import datasets, linear_modelfrom sklearn.metrics import mean_squared_error, r2_scorediabetes = datasets.load_diabetes()diabetes_x ...原创 2019-04-07 13:05:19 · 695 阅读 · 0 评论 -
diabetes 一元线性回归
import matplotlib.pyplot as pltimport numpy as npfrom sklearn import datasets, linear_modelfrom sklearn.metrics import mean_squared_error, r2_score下载数据集diabetes = datasets.load_diabetes()diabe...原创 2019-04-07 13:11:12 · 1411 阅读 · 1 评论 -
用线性回归对波士顿房价预测
from __future__ import print_functionfrom sklearn import datasets #导入自带的数据库from sklearn.linear_model import LinearRegression #从线性模型中导入模块import matplotlib.pyplot as plt建立线性模型loaded_data = da...原创 2019-04-03 15:52:54 · 4060 阅读 · 0 评论 -
将列表(含字典)数据写入Excel
将Excel数据写入字典cmd小测试打开cmd 转入Excel所在文件夹下再打开python,步骤如下:F:进入F盘cd 打开F盘下子目录导入所需要的库pandasdf = pd.read_excel("data.xlsx")#读取Excelres = df.to_dict(orient = "record")#输出字典读取字典保成excel调用函数,传入参数即可if ...原创 2019-05-10 13:43:39 · 19236 阅读 · 6 评论 -
K最近邻算法—入门
首先做个热身准备:numpy的eye函数,生成了一个6*6的对角矩阵sparse将np数组转化成CSR格式的scipy稀疏矩阵,sparse函数只会存储非0元素import numpy as npfrom scipy import sparsematrix = np.eye(6)sparse_matrix = sparse.csr_matrix(matrix)print(matrix...原创 2019-05-24 18:40:31 · 771 阅读 · 0 评论 -
文件夹中的txt文本全部导入 python
循环将文件夹中的txt文本全部导入import osrootdir = 'F:/python_test/text/test'list = os.listdir(rootdir) #列出文件夹下所有的目录与文件for i in range(0,len(list)): path = os.path.join(rootdir,list[i]) if os.path.isfile(path):...原创 2019-05-27 08:59:37 · 830 阅读 · 0 评论 -
LDA python 用Gensim包处理LDA主题模型
from nltk.tokenize import word_tokenizefrom nltk.corpus import stopwordsfilepaths = []#循环将文件夹中的TXT全部导入import osrootdir = ‘F:/GEV/lda_dir/referenceData’list = os.listdir(rootdir) #列出文件夹下所有的目录与文件...原创 2019-05-27 09:05:41 · 2779 阅读 · 2 评论