- 博客(97)
- 收藏
- 关注
原创 knn算法
原理:返回欧式距离中最近的k个点中 分类数目最多的那个label#定义一个knn函数:class Knnclassify: def __init__(self,k): assert k>0,'error' self.k = k self._xtrain = None self._ytrain = None def fit(self,xdata,ydata): assert xdata.
2021-04-23 16:01:19
202
1
原创 箱型图绘制
macth_merge.boxplot(column = ['fortune','appearance','character'],by ='strategy_x' ,grid = True,figsize = (10,6),layout =(1,3))plt.ylim(0,150)plt.show()
2021-04-21 17:55:49
272
原创 matplotlib创建堆叠条形图
sample_m[['fortune','appearance','character']].iloc[:30].plot(kind = 'bar',grid = True,stacked = True, colormap = 'Blues_r',ax = axes[0])
2021-04-20 15:15:26
191
原创 sql中的正则表达式
REGEXP 就是 regular expression 正则表达式 的意思^ 表示以后面的字符为开头[] 表示括号内任意字符- 表示连续*表示重复前面任意字符任意次数\ 用来转义后面的特殊字符,以表示字符原本的样子,而不是将其作为特殊字符使用$ 表示以前面的字符为结尾例如:select * from userswhere mail REGEXP '^[a-zA-Z][a-zA-Z0-9\_\.\-]*@leetcode\.com$'#\\s表示空格...
2021-04-20 13:55:36
646
原创 编写一个函数来查找字符串数组中的最长公共前缀。
#way1:import osclass Solution: def longestCommonPrefix(self , strs ): return os.path.commonprefix(strs)#way2:class Solution: def longestCommonPrefix(self, strs): if not strs: return '' s = strs[0]
2021-04-16 00:07:17
154
原创 判断给定的链表中是否有环。如果有环则返回true,否则返回false。 你能给出空间复杂度的解法么?
# class ListNode:# def __init__(self, x):# self.val = x# self.next = None## # @param head ListNode类 # @return bool布尔型#快慢指针法:class Solution: def hasCycle(self , head ): if not head: return False .
2021-04-12 18:10:05
394
原创 判断给定的链表中是否有环。如果有环则返回true,否则返回false。 你能给出空间复杂度的解法么?
# class ListNode:# def __init__(self, x):# self.val = x# self.next = None## # @param head ListNode类 # @return bool布尔型#快慢指针法:class Solution: def hasCycle(self , head ): if not head: return False .
2021-04-12 18:06:52
105
原创 命令行加载csv文件到mysql数据库
如出现以下问题:1.Loading local data is disabled; this must be enabled on both the client and server sides2.ERROR3948: Loading local data is disabled - this must be enabled on both the client and server sides解决办法:1 登录mysql时: mysql --local-infile=1 -uroot -p2
2021-04-04 00:04:11
173
原创 sql常见问题和特别操作
关于时间的sqldatediff(date,’ 具体时间’) > ’ xxxxx’date > ’ 具体时间’;SQL_ERROR_INFO: “You can’t specify target table ‘titles_test’ for update in FROM clause”不能直接从表中删除筛选出的表。delete from titles_testwhere id not in(select min_id from(select min(id)as min_idf
2021-03-31 18:26:50
451
原创 给出一个用二维矩阵表示的图像 返回该图像顺时针旋转90度的结果
m = [[1,2,3],[4,5,6],[7,8,9]]l = len(m)for i in range(l): for j in range(i): m[i][j],m[j][i] = m[j][i],m[i][j]k = int(l/2)for i in range(l): for j in range(k): m[i][j], m[i][l-1-j] = m[i][l-1-j], m[i][j]
2021-03-30 15:27:38
132
原创 给定n个非负整数a1,a2,…,an,其中每个数字表示坐标(i, ai)处的一个点。以(i,ai)和(i,0)(i=1,2,3...n)为端点画出n条直线。你可以从中选择两条线与x轴一起构成一个容器,
class Solution: def maxArea(self, height): i, j, res = 0, len(height) - 1, 0 while i < j: if height[i] < height[j]: res = max(res, height[i] * (j - i)) i += 1 else:
2021-03-30 14:24:05
461
原创 给出一个整数数组,请在数组中找出两个加起来等于目标值的数, 你给出的函数twoSum 需要返回这两个数字的下标(index1,index2),需要满足 index1 小于index2.。注意:下标是从
class Solution: def twoSum(self , numbers , target ): # write code here ans={} for i in range(len(numbers)): if target - numbers[i] in ans: return [ans[target - numbers[i]], i + 1] else:
2021-03-30 12:08:47
523
原创 利用生成器输出杨辉三角
def tri(): l = [1] while True: yield l new_l = [l[i] + l[i+1] for i in range(len(l) -1)] l = new_l l.insert(0,1) l.append(1)n = int(input())for i in tri(): n -= 1 if n < 0: break pri
2021-03-29 18:19:37
257
原创 现在有一个整数类型的数组,数组中素只有一个元素只出现一次,其余的元素都出现两次.输出出现一次的数。
#异或两个相同的数相当于没有操作class Solution: def singleNumber(self , A ): res = 0 for i in range(len(A)): res ^= A[i] return resk = Solutionalist = list(map(int,input().split(' ')))print(k.singleNumber(alist))...
2021-03-29 15:56:21
941
原创 python求给定二叉树的最大深度
class Solution: def maxDepth(self, root): if not root: return 0 else: left_dep = self.maxDepth(root.left) right_dep = self.maxDepth(root.right) return max(left_dep,right_dep) + 1
2021-03-29 15:40:37
173
原创 2021-03-29
给出两个二叉树,请写出一个判断两个二叉树是否相等的函数。判断两个二叉树相等的条件是:两个二叉树的结构相同,并且相同的节点上具有相同的值。class Solution: def isSameTree(self, p, q): if p is None and q is None: return True elif (p is None and q is not None) or (p is not None and q is None):
2021-03-29 14:22:43
54
原创 给定一个m x n大小的矩阵(m行,n列),按螺旋的顺序返回矩阵中的所有元素。
给定一个m x n大小的矩阵(m行,n列),按螺旋的顺序返回矩阵中的所有元素。#way1:利用di,dj控制方向class Solution: def spiralOrder(self, matrix): res, i, j, di, dj = [], 0, 0, 0, 1 if matrix: for _ in range(len(matrix) * len(matrix[0])): res.append(
2021-03-29 13:40:05
674
原创 浅拷贝解决列表可变问题
lst = [1,2,3,4]for x in lst[:]: if x % 2 == 0: lst.remove(x)print(lst)浅拷贝只复制以及元素,深拷贝才辅助所有元素。
2021-03-25 20:09:48
60
原创 python中的闭包
闭包的最大特点是可以将外部函数的变量与内部函数绑定,并返回绑定变量后的函数(也即闭包),此时即便生成闭包的环境(外部函数)已经释放,闭包仍然存在。此例子转自伯乐在线def line_def(a, b):def line(x):return a * x + breturn lineif name == ‘main’:func = line_def(2, 3)print(func(5))输出13...
2021-03-25 14:00:31
90
原创 RFM
rfm的小技巧:#对指标进行分组并打分R_score = pd.cut(R_value,R_bins,labels = [5,4,3,2,1],right = False)F_score = pd.cut(F_value,F_bins,labels = [1,2,3,4,5],right = False)M_score = pd.cut(M_value,M_bins,labels = [1,2,3,4,5],right = False)#给不同等级的客户打标签rfm[‘R’] = np.wher
2021-03-24 22:03:53
157
原创 python的小操作
list[::-1] 直接将列表逆序字符串的常见输出格式:age,height = 21,1.785print('age:{0:>5d},height:{1:5.2f}'.format(age,height))列表排序小技巧:list.sort(key = len,reverse = True)元组:可边长位置参数:def foo(args1,*args2): print(args1,args2)foo('aas00','asas10','sddsd','qsqw.
2021-03-24 21:19:11
109
原创 re正则表示式爬取网页
#爬取豆瓣短评import requestsimport reheaders = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3676.400 QQBrowser/10.5.3738.400'}url = 'https://book.douban.com/subj
2021-03-24 17:04:36
115
原创 beautiful soup爬取网页
import requestsfrom bs4 import BeautifulSoupheaders = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3676.400 QQBrowser/10.5.3738.400'}url = 'https://book.d.
2021-03-24 16:37:15
118
原创 DataFrame的常见小操作
-改变列的数据类型:data_1[‘date’] = data_1[‘date’].astype(np.str)data_1[‘date’] = pd.to_datetime(data_1[‘date’])- 删除值:data_1 = data_1.drop_duplicates() 删除重复值data_1.fillna(value,axis = 1) 填充缺失值查看信息:data_1.info()data_1.describe()data_1.dtypes查看dataframe中的行和
2021-03-24 15:52:20
122
原创 python os库读取文件夹下多个文件
import osdef countlines(file_path): with open(file_path,'r',encoding='utf-8') as fp: k = len(fp.readlines()) print(file_path.split('\\')[-1].split('.')[0],'有',k,'行')path = r'E:\NLP\实验1\white_papers'for fname in os.listdir(path):
2021-03-23 17:45:21
424
原创 数据库常用操作:
打开数据库: mysql -hlocalhost -uroot -p ,输入密码即可。展示所有的数据库: show databases;(不可省略;)创建一个数据库:create database dbname;删除数据库:drop database dbname;使用数据库:use dbname;创建一个表如下:create table t_book(ISBN char(17),book_name varchar(50),book_author varchar(50),book_pr.
2021-03-18 22:13:36
409
原创 jupyter做数据分析和可视化常用的库:
jupyter做数据分析和可视化常用的库:import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsimport plotly as pyimport plotly.graph_objs as gopyplot = py.offline.iplotpy.offline.init_notebook_mode()
2021-03-18 16:55:43
605
原创 解决ModuleNotFoundError: No module named ‘pip‘问题
输入以下命令即可:python -m ensurepippython -m pip install --upgrade pip
2021-03-16 16:37:56
323
原创 解决matplotlib中文乱码的问题
解决matplotlib中文乱码的问题,插入两行代码:plt.rcParams[‘font.sans-serif’] = [‘SimHei’]plt.rcParams[‘axes.unicode_minus’] = False
2021-03-10 16:59:09
78
原创 2021-01-10
jupyter notebook中直接安装python的第三方库。例如安装pymysql : ! pip install pymysql。升级pip:
2021-01-10 11:25:22
1088
原创 SQLyog连接到本地问题
SQLyog连接失败,错误代码:2058如图:解决方法:1.用管理员身份打开cmd;2.输入 mysql -h localhost -P 3306 -u root -p 打开mysql;3.再输入 ALTER USER ‘root’@‘localhost’ IDENTIFIED WITH mysql_native_password BY ‘password’; 其中password是你要设置的密码。(;不能少)...
2021-01-05 22:01:47
984
原创 2020-12-30
在jupyter中用pandas 读取csv文件出现的问题解决方法:1.路径不能出现中文,否则显示:OSError: Initializing from file failed2.不能直接从属性中复制路径名,否则路径前面会有奇怪的东西,例如:这样就会报错:FileNotFoundError: File b’\xe2\x80\xaaC:\Users\1\Desktop\asas.csv’ does not exist3.正确的路径名前需要加’r’或者用’\\‘代替’\’,例如:或者是:以上
2020-12-30 16:36:46
208
原创 2020-12-29
关于Anaconda中的jupyter的配置问题!!!血泪史。。。出现的问题包括:1.DLL load failed: 找不到指定的模块的解决;2.‘jupyter’ 不是内部或外部命令,也不是可运行的程序;解决办法:首先找到Anacondade安装位置,之后操作如下。在电脑-属性-高级系统设置-环境变量-在用户变量和系统变量的path中都添加以下内容:<1>D:\Anaconda3<2>D:\Anaconda3\Scripts<3>D:\Anaconda
2020-12-29 16:42:50
154
原创 2020-10-19
python求杨辉三角简易代码,欢迎交流:a = [1]print(a[0])for i in range(10): a.append(0) a = [a[i-1] + a[i] for i in range(len(a))] for j in a: print(j,end=' ') print()
2020-10-19 15:25:25
69
原创 python解决约瑟夫环问题
题目内容:已知n个人(以编号0,1,2,3…n-1分别表示)围坐在一张圆桌周围。从编号为0的人开始报数1,数到m的那个人出列;他的下一个人又从1开始报数,数到m的那个人又出列;依此规律重复下去,直到圆桌周围的人全部出列。输入格式:两个正整数n, m,其中3<=n<=100, 1<=m<=n输出格式:按照顺序出列的人的编号列表输入样例:52输出样例:[1, 3, 0, 4, 2]输入样例:123输出样例:[2, 5, 8, 11, 3, 7, 0, 6,
2020-09-24 20:34:13
239
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅