- 博客(52)
- 收藏
- 关注
原创 Pycharm安装第三方库的详细教程
到文件的下载官网,在搜索框中直接输入想要安装的第三方库,点击界面中的“or browse projects”找到相关的库,然后选择自己要安装的库,选择合适的版本之后,直接点击下载文件安装。点击之后,在搜索框中输入需要安装的库,右下角的Specify version 可以查看选择版本,确定后点击Install Package就可以了。这种安装方法是我们经常使用的一种,进入到pycharm界面中,点击菜单栏上的file选项,选择settings,**常用方法一:**内部安装。:下载wheel文件安装。
2023-10-19 14:55:31 2850
转载 决策树(Decision Tree):通俗易懂之介绍
决策树是一种机器学习的方法。决策树的生成算法有ID3, C4.5和C5.0等。决策树是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果。决策树是一种十分常用的分类方法,需要监管学习(有教师的Supervised Learning),监管学习就是给出一堆样本,每个样本都有一组属性和一个分类结果,也就是分类结果已知,那么通过学习这些样本得到一个决策树,这个决策树能够对新的数据给出正确的分类。这里通过一个简单的例子来说明决策树的构成思路:给出如
2022-03-02 15:15:00 6549
转载 决策树(Decision Tree)
1. 决策树的基本概念我们这里介绍一下一个比较简单的机器学习系统----决策树. 它的概念最容易理解, 因为人类的许多决策实际上就是一个决策树.通常使用的分类回归树(class and regress tree)是一个二叉树。它的形式一般为:每个方框代表一个节点. 每个非叶子节点有2个分支, 一个是判定True, 一个判定False. 分别走两个不同的分支. 叶子节点具有决策权. 任何一个输入从root出发, 总是会达到且唯一到达一个叶子节点. 这就是决策树的工作原理.决策树有两种节点: 中间节点
2022-03-02 11:17:34 46227
转载 python中模块和包的区别
问:Python中包和模块都可以被都是用import关键字进行引入的, 那么两者有什么区别呢?模块: 一般来说, 单个py文件就叫模块(module), 调用这个模块直接使用"import 模块名"即可, 也可以使用"from 模块名 import 函数名/变量名/类名"和"from 模块名 import * "包: 当我们写了几个相近的py文件后, 想要集成起来给别人使用. 这时候就需要用到我们的包了.包就是为了多个py文件打包起来访问的东西. 只要在包里面放一个init.py文件, 在init.p
2022-02-13 20:02:50 6839
转载 Jupyter notebook中你所不知道的快捷键
转载自知乎“禾木清清”作者的文章。https://zhuanlan.zhihu.com/p/37107105Jupyter Notebook是数据科学家最重要的工具之一。这款工具很容易上手,但是你可能不知道它有强大的快捷键功能,可以大大加快你的开发效率。本文将介绍在MacBook中的快捷键操作。Windows用户和本文中的操作会略有不同。快捷键分为命令模式(Command Mode)和编辑模式(Edit Mode)。命令模式操作到对象是单元格(cell)。也就是可以对单元格进行插入删除等操作。当在命令模
2022-02-13 12:00:42 1003
原创 sql数据库的csv导入报错:Columns in table defination are 11, columns in file are 14:sjsysc-hh405-zbhx783w
问题:在sql数据库上传csv数据的时候,一直发生报错如下:解决方法:举例来说,如果你的csv文件是以“,”分割的,那极有可能是因为字段的文本数据中也包含此符号导致的,先对csv文件中所有字段中的“,”进行替换即可。(以“;”分割的csv文件也是一致的)...
2022-02-11 15:24:25 1480
原创 Jupyter notebook无法自动打开浏览器解决方法
大部分参考了链接:https://www.jb51.net/article/184474.htm问题:这几天要看几个ipython格式的文件,但是jupyter notebook打开之后一直卡在命令行的界面那里(如图),然后就不动了,浏览器也没有预期地自动弹出来.简单粗暴的解决方法一:如果你的命令行显示的结果和我的一样,那你只需要把如图的地址,复制粘贴到浏览器的地址栏,就能打开jupyter notebook.成功:将http://localhost:8888/tree复制到浏览器打开此
2022-02-10 22:16:55 27537 10
原创 excel的偏移函数offset与对应相乘函数sumproduct
1、offset函数:=offset(reference,rows,cols,height,width)公式效用:一种基于单元格的相对引用的实现方法,即各方向偏移单元格后选定单元格或者数组。其中:reference——参照单元格rows——行偏移量(正数代表向下移动单元格数,负数代表向上移动单元格数)。cols——列偏移量(正数代表向右移动单元格数,负数代表向左移动单元格数)height ——返回几行(必须为正数),即所要返回的引用区域的行数。width ——返回几列(必须为正数),即所要
2022-01-07 14:51:04 4415
转载 MySQL查询本周、上周、本月、上个月份的数据
/今天/select * from 表名 where to_days(时间字段) = to_days(now());/昨天/select * from 表名 where to_days(now())-to_days(时间字段) = 1;/近7天/select * from 表名 where date_sub(curdate(), interval 7 day) <= date(时间字段);/查询距离当前现在6个月的数据/select * from 表名 where 时间字段 bet
2021-12-08 10:16:09 698
原创 Oracle/PLSQL中获取字符串位置的instr()函数
使用方法:instr(string1, string2)从string1中检索string2字符所在的位置;instr(string1, string2, m,n)从m开始第n次在在string1中出现string2字符的位置。示例:
2021-11-08 10:01:07 3990
原创 对于联邦学习及相关技术的学习理解
注:最近在研究隐私计算、联邦学习、多方安全计算(MPC)、同态加密等概念,根据学习及自身的理解,记录整理:隐私计算作为近年来异军突起的赛道,能在保证数据“可用不可见”情况下,对数据进行开采、处理与分析,可充分助力数据流通与安全协作,其核心技术如下:==联邦学习(FL)==本质上是一种分布式机器学习技术,或机器学习框架。作为新一代人工智能基础技术,使各参与方无需交换存储在本地的原始数据,而是通过交换一些模型的信息,实现数据协作建模,解决数据隐私与数据共享的矛盾。联邦学习作为第三代隐私计算代表技术,能有效
2021-09-06 15:39:00 1526
转载 多方安全计算
原文链接:https://blog.csdn.net/yuxinqingge/article/details/104588197如今,互联网已经完成了从IT时代向DT时代转变,数据已经成为DT时代企业的核心竞争力。而数据作为一种新能源,只有流动起来才能产生价值。不过,大多数企业考虑到数据安全和个人隐私等问题,对数据共享都非常谨慎。在现实生活中,我们时常会受到下列问题的困扰:· 医院需要共享医疗信息,但是又不想泄露单个患者的隐私;· 政府机构需要统计选举数据,但是又不想公开投票选民的选举记录;· 一家
2021-09-06 15:29:42 1697
原创 通俗理解GET和POST两种基本请求方法的区别
参考:https://www.cnblogs.com/logsharing/p/8448446.html 的博客整理给出了一个“标准答案”:GET在浏览器回退时是无害的,而POST会再次提交请求。GET产生的URL地址可以被Bookmark,而POST不可以。GET请求会被浏览器主动cache,而POST不会,除非手动设置。GET请求只能进行url编码,而POST支持多种编码方式。GET请求参数会被完整保留在浏览器历史记录里,而POST中的参数不会被保留。GET请求在URL中传送的参数是有长
2021-08-25 11:19:38 244
原创 python警示:WARNING: Ignoring invalid distribution -umpy
在Python安装模块的时候总是会有警示信息WARNING: Ignoring invalid distribution -umpy,如下:解决方法:找到对应的文件路径,发现在sit-packages文件夹下面有几个名称前面带有“~”标识的文件夹,将其手动删除即可:...
2021-07-20 17:33:04 5141 1
原创 报错:Command “python setup.py egg_info“ failed with error code 1 in C
使用pip install 安装包的时候报错如下:Command “python setup.py egg_info” failed with error code 1 in C:\Users…解决方法:1、更新 setuptoolspip install --upgrade setuptools2、更新pip:python -m pip install --upgrade pip完成后再重新安装包即可。...
2021-07-20 17:26:40 5050 1
原创 因为编码产生的报错:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xbd in position 0: invalid start byte
发生此报错多半是因为编码。我这里是在读取txt文本的时候发生的报错,如下:修改编码为gbk后,就可以正常读取了:
2021-07-19 15:58:06 1511
原创 Python字符串去除空格的几种方法(遇到空格去不掉的时候用第3个方法)
1、strip()函数strip()函数去除字符串开头和结尾的空格;lstrip()函数去除字符串开头的空格;rstrip()函数去除字符串结尾的空格;2、replace()函数将空格替换掉3、将文本按照空格切割再拼接
2021-07-14 13:50:42 941
原创 AttributeError: module ‘numpy.random‘ has no attribute ‘default_rng‘
python在执行程序的时候发现报错:AttributeError: module ‘numpy.random’ has no attribute ‘default_rng’,如下:这类报错一般情况下是因为numpy模块的版本引起的,用pip install查看一下,发现我这里的numpy版本是1.15.4需要吧numpy模块的版本更新到1.17以上才可以...
2021-07-13 17:02:46 14846 1
原创 python配置SSH通道连接远程oracle数据库,并读取数据表为dataframe格式
python连接oracle数据库,并读取数据表为dataframe格式具体代码如下,代码中的中文部分需要自行修改成自己的相关信息。#!/usr/bin/env python#coding:utf-8#导入数据模块import cx_Oracleimport xlsxwriterimport timeimport pandas as pdfrom sshtunnel import SSHTunnelForwarder#远程服务器及其上的数据库相关信息userInfo = '数据库用
2021-07-12 16:11:28 516
原创 Python将PDF按页拆分为图片,并OCR识别为文本【windows,主要使用模块/工具包括wand、pytesseract、PIL等,附下载及安装】
Python将PDF按页拆分为图片,并OCR识别为文本下载所需安装包并完成安装1、下载并安装tesseract-ocr2、下载并安装imagemagic3、下载并安装GhostscriptPFD转成jpeg图片,并识别成文本下载所需安装包并完成安装1、下载并安装tesseract-ocr链接:https://pan.baidu.com/s/1FypYuviozcC4J0_1IR6hmQ提取码:e28y双击安装,默认下一步,并在这里选择简单中文:选择安装目录,并记住安装路径,因为后续安装完成之
2021-07-07 18:42:35 1415 2
原创 Markdown使用手册
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Mar
2021-07-07 16:14:14 131
原创 数据库导出来的配备有ctl文件的数据表入库说明
1、库中建表按ctl文件的格式建表2、修改ctl把ctl的表名改成自己新建的表名称3、把存储数据的csv文件和ctl文件放进同一个文件夹在文件夹目录下的长按shift键,空白处点击右键,选择在此处打开命令窗口4、在命令窗口输入sqlldr hwcd/ABC123 @ora11 control=wfybdb_sqlldr.ctl说明:hwcd(数据库名)、ABC123(数据库密码)、ora11(数据库上面有显示 ,如图:)...
2020-11-09 17:09:07 816
原创 word通过快捷键的方式添加标题3/4等
在word写文章的时候,有时在工具栏中没有“标题3\4”等选项,如下图: 这时候可以通过快捷键的方式设置: 在英文输入法的模式下,先选中要调整的标题,然后通过下面的快捷键进行标题层级的变化:Alt+Ctrl+1:应用“标题 1”样式。Alt+Ctrl+2:应用“标题 2”样式。Alt+Ctrl+3:应用“标题 3”样式。示例:原始是二级标题:选中3.1标题,按快捷键“Alt+Ctrl+3”,变成三级标题...
2020-11-09 10:14:05 1022
原创 箱线图、小提琴图、异常值
箱线图 箱线图包含:分位数、上线四分位数、上下触须边缘以及界外异常值,如下图:小提琴图 小提琴图如下图,可以看到其中包含了箱线图,另外外部轮廓则是给出了任意位置的密度图(频率)。因此,总结来说小提琴图结合了箱线图与核密度图。关于异常值 一批数据中的异常值值得关注,忽视异常值的存在是十分危险的,不加剔除地把异常值包括进数据的计算分析过程中,对结果会带来不良影响;重视异常值的出现,分析其产生的原因,常常成为发现问题进而改进决策的契机。箱形图为我们提供了识别异常值的一个标准:异常值被定义为小
2020-11-08 18:23:13 4319
原创 python画图时设置分辨率和画布大小-plt.figure()
python画图时设置分辨率和画布大小plt.figure()示例:import numpy as npimport pandas as pdimport warningswarnings.filterwarnings('ignore')import matplotlib.pyplot as pltimport seaborn as sns#读取示例数据df = pd.read_csv( 'https://labfile.oss.aliyuncs.com/courses/128
2020-11-05 13:53:42 94236
原创 pandas通过索引和某列的值排序-sort_index()/ sort_values()
pandas通过索引和某列的值排序sort_index()sort_values()示例:原始表:pd.set_option('display.max_row', None) df = pd.read_csv( 'https://labfile.oss.aliyuncs.com/courses/1283/telecom_churn.csv')df.head()按照索引排序:df.sort_index(ascending=False,inplace=True)df.hea
2020-11-05 13:39:22 1351 1
原创 pandas读取数据文件,解决行/列显示不全
pandas读取数据文件,解决行/列显示不全pd.set_option()进行设置#显示全部列pd.set_option('display.max_columns', None) #显示全部行pd.set_option('display.max_row', None) #设置数据的显示长度(解决自动换行)pd.set_option('display.width', None) 示例:原始显示为:设置后:...
2020-11-05 13:26:48 4308
原创 sql中将group by产生的同一分组中的值连接起来,返回一个字符串结果的函数:group_concat()
将group by后同一组的结果调整成一行的展示形式示例原始数据表为:select * from test_1对name字段进行group by拼接select name, group_concat(date), GROUP_CONCAT(salary) from test_1 group by name
2020-09-18 08:55:04 1408
原创 sql中将字符串和时间格式的互相转换:date_format()、str_to_date()
关于日期存储格式的互相转换:日期格式转换为字符串格式化:date_format();字符串格式转换为日期格式:str_to_date()示例:1、由日期格式转换为字符串格式:将日期存储格式的“date”字段转换为字符串存储格式select date, --原始存储为日期格式 date_format(date, '%Y-%m-%d') date_str --日期格式转换为字符串格式from test_1输出:2、由字符串存储格式转换为日期存储格式:将上面生成的结果表中
2020-08-27 10:47:48 26551 1
原创 sql中两个字段进行拼接用concat()函数
多个字段进行拼接:注意:如果有一个字段为空值,那拼接之后的字段为空值。示例:原始数据表为:select * from test_1对“姓名”和“薪水”字段进行拼接:select concat(name,salary) from test_1
2020-08-27 09:21:24 22928
原创 sql中timestamp和datetime之间的转换
互相转换说明:将datetime转换为timestamp格式,使用FROM_UNIXTIME()函数;将timestamp转换为datetime格式,使用UNIX_TIMESTAMP()函数;示例如下:1、现在数据库的datetime时间:select UNIX_TIMESTAMP(now()) from dual2、将现在数据库的datetime时间转换为timestamp格式:select UNIX_TIMESTAMP(now()) from dual3、将转换成的time
2020-08-26 15:49:09 19440
转载 sql案例练习
注:参考公众号“猴子数据分析”中的相关教程。题目:"课程订单表”里记录了某在线教育App的用户购买课程的信息(部分数据截图)。请使用sql将购买记录表中的信息,提取为下表(复购分析表)的格式。并用一条sql语句写出。复购用户:如果一个用户的首次购买日期是a,且该用户在a之后的第n月内,也有购买行为,这个用户被算做第n月复购用户。代码:select a.购买时间, count(distinct 用户id),count(distinct case when timestampdiff(mont
2020-08-21 16:44:38 527
转载 统计中的假设检验介绍-t检验-A/B测试及python示例
写在前面:假设检验,是根据一定的假设条件,由样本推断总体的一种方法。我以前常分不清楚如何定义原假设和被择假设,后来用一个例子才记得比较深刻:就像法庭审判犯人,会首先假设他是一个好人(备择假设),然后提交证据证明他是有罪的(原假设)。所以假设检验选择原假设和备择假设的原则如下:1)原假设:想要证明其不好的方向(证明有罪);2)备择假设:是想要证明其好的方向(若原假设发生概率比较低,也就是没有充分的理由证明有罪,那就是无罪的);以下大部分内容转载:https://zhuanlan.zhi
2020-07-31 18:05:48 5968 1
原创 python解决seaborn画图时的中文/负号显示为方框现象
在画图之前添加以下代码:sns.set(font='SimHei') #设置画图中的中文为黑体# SimHei代表黑体# simsun代表宋体示例:
2020-07-31 10:09:10 4980 4
原创 python读取及保存csv和excel数据文件
python读取及保存csv和excel数据文件读取csv文件读取excel文件dataframe数据保存成csv/excel数据文件读取csv文件一般情况下,用这个简单的代码就可以:import csvdata=pd.read_csv(r'E:\data\data1.csv',encoding='gbk') 下面详细解释一下pandas.read_csv()这个函数:help(pd.read_csv)输出:read_csv(filepath_or_buffer:Union
2020-07-30 11:19:23 3653
原创 oracle数据库之提取时间的方法
提取时间方法一般使用to_char()和to_date()函数来提取时间字段的年、月、日等维度,以及做字符串和时间类型的转换。从指定日期中获取部分数据:示例:提取jsrqsj字段中的日期:select jsrqsj, to_char(jsrqsj,'yyyymm'), --提取月份呢,转化为字符串类型 to_date(to_char(jsrqsj,'yyyymmdd'),'yyyymmdd') --提取日期,转化为时间类型from ir_gxp_200707_
2020-07-28 11:55:43 2513
转载 图片标注工具Labelme的安装及使用方法
转载:https://blog.csdn.net/u011574296/article/details/79740633在做目标检测任务时,需要用到labelImg进行画框标注,然而如果是做语义分割的任务时,就不能只是标注框里,需要用另外一种工具labelme进行标注,本文对该工具的安装使用方法进行介绍。官方教程:https://github.com/wkentaro/labelme#anaconda1 安装方法...
2020-07-28 09:22:19 596
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人