AI
文章平均质量分 71
.
海洋 之心
阿里云社区专家博主,图神经网络-大数据-推荐系统研究者,专注于计算机领域前沿技术的分享等人工智能算法研究工作
展开
-
自然语言处理Transformer模型最详细讲解(图解版)
近几年NLP较为流行的两大模型分别为Transformer和Bert,其中Transformer由论文《Attention is All You Need》提出。该模型由谷歌团队开发,Transformer是不同与传统RNN和CNN两大主流结构,它的内部是采用自注意力机制模块。原创 2022-10-16 11:26:46 · 32811 阅读 · 11 评论 -
安装百度文心大模型ERNIE-ViLG
【代码】安装百度文心大模型ERNIE-ViLG。原创 2022-09-30 20:41:05 · 1446 阅读 · 0 评论 -
【大学生活】谈谈我转专业的故事
今天是大年三十除夕夜,在今年在我身上发生最大的事情就是转专业了,趁着这个机会,我来讲述一下我的大学历程。在报考完学校后的一段时间,亲戚朋友问:报的什么专业啊?在我一番介绍自己的专业后,大家的脸上一脸诧异看着我:“啥?水利是什么专业,是干什么的……”我:“不知道……”原因:报志愿的时候出了问题,之前在电视上经常听到水利这两个字,觉得是国家基础建设方面,应该会很不错,没有参考老师的意见,毅然决然的来到了某理工大学的水利专业。但上了大学后,发现并不是那么回事。刚入大学还是不清楚自己的专业到底是什么?将来会.原创 2021-02-11 14:29:45 · 7806 阅读 · 42 评论 -
已知数据序列为(12,5,9,20,6,31,24),对该数据序列进行排序,写出插入排序、冒泡排序、快速排序、简单选择排序、堆排序以及二路归并排序每趟的结果。
已知数据序列为(12,5,9,20,6,31,24),对该数据序列进行排序,写出插入排序、冒泡排序、快速排序、简单选择排序、堆排序以及二路归并排序每趟的结果。代码已经写好,自己运行一下就好啦代码:package 八大排序;import java.util.Arrays;import java.util.Scanner;public class 八大排序 { public static void main(String[] args) { int[] a=new int[] {12,5,.原创 2020-12-19 21:58:55 · 4513 阅读 · 1 评论 -
Lambda基本使用方法(二)——再看不懂我找不到女朋友
不要自卑,去提升实力互联网行业谁技术牛谁是爹如果文章可以带给你能量,那是最好的事!请相信自己加油o~ Lambda基本使用方法举一些简单例子:无参,有返回值()->1有参,有返回值x->x+1两个参数,有返回值(a,b)->a+b有参,无返回值(s)->System.out.println(s)由上节可知道,当我们使用Lambda表达式时一般要实现抽象接口的抽象方法,那么这就需要我们当要使用Lambda时就要创建一个接口,这就会很麻烦,所以Jav..原创 2020-12-18 22:25:14 · 375 阅读 · 1 评论 -
理解Java序列化(二)——再看不懂我找不到女朋友
对象序列化当我们有时需要将Java中的对象进行传输时,需要将它转换成二进制流保存在文件中,然后其他程序通过这个二进制流再将其恢复成原有的Java类型数据序列化分为两种,第一种就是序列化,即将Java对象转换成字节序列保存起来第二种就是反序列化,即将处理后的字节序列恢复成Java对象实现序列化两种方式:方式一:实现Serializable接口当我们要将我们的类对象序列化的时候就要使这个类实现Serializable接口,这个接口只是作为一种标记,标记这个类是否可以被序列化,不需要实现任何抽象方法,原创 2020-12-17 12:57:03 · 235 阅读 · 0 评论 -
Hadoop学习:MapReduce实现两张表合并
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、思想二、代码1.Bean类2.Map类3.Reduce类4.Driver类前言一、思想示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。二、代码1.Bean类import org.apache.hadoop.io.Writable;import java.io.DataInput;import java.io.DataOutput;import java.io.IO原创 2021-03-19 17:40:05 · 976 阅读 · 6 评论 -
sklearn 多种模型的学习曲线 拟合中的特性与运行速度(机器学习)
文章目录案例实战:多种模型的学习曲线1、导入相关库2、定义画图函数3、准备数据4、循环调用函数画图案例实战:多种模型的学习曲线1、导入相关库from sklearn.ensemble import RandomForestClassifier # 随机森林模型from sklearn.tree import DecisionTreeClassifier # 决策树from sklearn.linear_model import LogisticRegression # 逻辑回归from skl原创 2021-02-08 22:20:19 · 831 阅读 · 1 评论 -
Java多线程与并发框(完结篇)——再看不懂我找不到女朋友
多线程关于多线程有关的概念:进程:进程指正在运行的程序,并且具有一定独立功能线程:线程是进程中的一个执行单位,负责当前进程程序的执行,一个进程中至少会有一个线程,如果一个进程中包含多个线程,那么可称为多线程程序单线程:当要执行多个任务时,cpu只会依次执行,当一个任务执行完后,再去执行另外一个任务多线程:多个任务可以同时进行在Java中,不同线程会有不同的优先级抢占cpu,如果线程优先级相同,就会随机先去一个线程去执行Java程序运行时会默认执行3个进程:main主线程gc垃圾回收机原创 2020-12-14 22:27:07 · 312 阅读 · 2 评论 -
Java8新特性:强大的Stream API——再看不懂我找不到女朋友
不要自卑,去提升实力互联网行业谁技术牛谁是爹如果文章可以带给你能量,那是最好的事!请相信自己加油o~ Java8新特性:StreamStream是Java8中产生的一个新特性,可以把它理解成一种流,但也可以把它当做是一种特殊的容器他可以结合Lambda表达式帮我们处理数据变得非常容易一般来说使用它有三个步骤:1、创建Stream2、中间操作3、终止操作(终端操作)还是举个例子吧:我们还是来遍历这个集合List<Employee> list= Arrays.asL..原创 2020-12-18 23:12:19 · 330 阅读 · 4 评论 -
Java8新特性:Lambda表达式终结篇(一)——再看不懂我找不到女朋友
Java8特性:Lambda表达式先举个例子,看一下Lambda表达式长什么样子Consumer<Integer> con=(i)->System.out.println(i+10);Function<Integer,Integer> fun=(i)->i*10;Runnable r=()->System.out.println("Lambda");通过这三个例子可以看出,Lambda表达式就是实现一些函数的功能,它的本质就是实现接口的抽象方法(原创 2020-12-17 22:40:04 · 380 阅读 · 0 评论 -
理解Java的IO流(一)——再看不懂我找不到女朋友
理解Java的IO流Java的IO流是实现输入/输出的基础,它可以方便的实现数据的输入/输出操作,在Java中把不同的输入/输出源(键盘、文件、网络连接等)抽象为表述为“流”。流(Stream)的分类1、字节流和字符流InputStreamReaderOutputStreamWriter这两种流的用法基本相似,主要是二者操纵的数据不同,字节流操作的是字节,就是那些二进制文件,而字符流一般就会处理我们能够标识的文本文件这些字符,字节流处理8位的字节,字符流处理16个字节的字符(在Java中原创 2020-12-17 08:04:55 · 281 阅读 · 5 评论 -
Hadoop学习:MapReduce不使用Reduce将表合并提高效率
✌✌✌古人有云,好记性不如烂笔头,千里之行,始于足下,每日千行代码必不可少,每日总结写一写,目标大厂,哈哈哈!!!✌✌✌一、✌题目要求record表:ID城市编号空气指数001032450020265500305743004042460050295600601637007058310080368300902349city表:城市编号城市名称01长沙02株洲原创 2021-03-19 20:54:03 · 363 阅读 · 0 评论 -
Java异常处理机制(完结篇)——再看不懂我找不到女朋友
异常处理异常:对于计算机程序来说,我们不会保证我们写的程序不会出任何问题,就算程序设计没有逻辑错误,那么你能够保证用户会合法按照自己的意愿去输入数据吗?就算用户相当的配合你,你能够保证你在运行程序时不会出现其他问题吗?比如说网络突然中断,或者是电源中断等。那么我们就要在设计程序时就要考虑到这些问题,保证当程序运行出错时,有相对应的解决方案,而不是直接将异常直接抛到虚拟机导致程序终止运行。常出现的异常IndexOutOfException:一般是数组下标越界异常int[] arr=new i原创 2020-12-15 12:44:27 · 369 阅读 · 1 评论 -
Python经典编程习题100例,供初学者学习
题目及题解持续更新中––––––––––1112131415161718191212223242526272829231323334353637383934142434445464748494515253545556575859561626364656667686967172737475767778797原创 2020-12-06 17:19:57 · 29578 阅读 · 19 评论 -
【吴恩达课后编程作业】第三周作业 (附答案、代码)隐藏层神经网络 神经网络、深度学习、机器学习
【吴恩达课后编程作业】第三周作业 (附答案、代码)隐藏层神经网络 神经网络和深度学习上一篇:【课程1 - 第二周作业】 ✌✌✌✌ 【目录】 ✌✌✌✌ 下一篇:【课程1 - 第三周作业】首先说明一下,大学生一枚,最近在学习神经网络,写这篇文章只是记录自己的学习历程,起总结复习的作用,别无它意,本文参考了zsffuture的博客、布衣先生real的博客、孔小爽的博客、何宽的博客以及Github上fengdu78老师的文章进行学习✌ 我们要实现一个能够分类样本点的神经网络numpy:常用数学工具库原创 2021-02-18 13:52:03 · 985 阅读 · 5 评论 -
梯度下降算法原理 神经网络(Gradient Descent)
在求解神经网络算法的模型参数,梯度下降(Gradient Descent)是最常采用的方法。下面是我个人学习时对梯度下降的理解,如有不对的地方欢迎指出。1、✌ 梯度定义 微积分我们学过,对多元函数的各个变量求偏导数,把求得的各个参数的偏导数以向量的形式写出来,就是梯度。比如函数f(x,y),原创 2021-02-17 17:26:47 · 1313 阅读 · 5 评论 -
【吴恩达课后编程作业】第二周作业 (附答案、代码) Logistic回归 神经网络、深度学习、机器学习
【吴恩达课后编程作业】Course 1 - 神经网络和深度学习 - 第二周作业 - 具有神经网络思维的Logistic回归上一篇:【课程1 - 第二周测验】 ✌✌✌✌目录 ✌✌✌✌下一篇:【课程1 - 第三周测验】首先说明一下,本问参考了zsffuture的博客、何宽的博客以及Github上fengdu78老师的文章进行学习我们要实现一个能够识别猫的图片的简单神经网络numpy:matplotlib:python的画图工具h5py:读取h5格式文件的工具lr_utils:用于加载训练及原创 2021-02-17 12:43:02 · 1199 阅读 · 3 评论 -
Tensorflow 出现 ‘Tensor‘ object is not callable解决办法
出现该现象原因可能是因为调取张量的属性,而写成了函数形式,把括号去掉原创 2021-02-15 14:08:18 · 4998 阅读 · 5 评论 -
Pytorch出现‘Tensor‘ object is not callable解决办法
出现该现象原因可能是因为调取张量的属性,而写成了函数形式,把括号去掉原创 2021-02-15 14:07:23 · 9776 阅读 · 6 评论 -
数据处理 过采样与欠采样 SMOTE与随机采样 达到样本均衡化
文章目录过采样与欠采样1、采样介绍2、过采样2.1 随机采样:2.2 SMOTE采样:3、欠采样2、代码演示1.1 创建数据1.2 随机采样1.3 SMOTE采样1.4 欠采样过采样与欠采样1、采样介绍在分类问题中,有存在正反例数目差异较大的情况,这种情况叫做类别不平衡。针对这种问题,解决方式有2种:假设正例数量大,反例数目极小。1、减少正例的数量,使得数据平衡,再进一步分类,这种情况属于“欠采样”;2、增加反例的数目平衡数据,再分类,这种称为“过采样”;2、过采样2.1 随机采样:增加原创 2021-02-11 17:51:56 · 4105 阅读 · 4 评论 -
Python 数据归一化、标准化、正则化 (机器学习)
文章目录数据归一化、标准化、正则化1、归一化2、标准化3、正则化4、代码测试4.1 导库4.2 创建数据4.3 查看原始数据的均值、方差4.4 归一化4.5 标准化4.6 正则化数据归一化、标准化、正则化1、归一化是将数据放缩到0~1区间,利用公式(x-min)/(max-min)2、标准化将数据转化为标准的正态分布,均值为0,方差为13、正则化正则化的主要作用是防止过拟合,对模型添加正则化项可以限制模型的复杂度,使得模型在复杂度和性能达到平衡。常用的正则化方法有L1正则化和L2正则化。L原创 2021-02-11 17:25:12 · 2549 阅读 · 6 评论 -
Python 异常值处理 箱线图、3σ原则 (机器学习)
文章目录查看数据异常值1、箱线图下四分位数Q1:中位数Q2:上四分位数Q3:四分位距IQR:下限:上限2、3σ原则3、代码测试3.1 导库3.2 创建数据3.3 箱线图3.4 3σ原则查看数据异常值1、箱线图下四分位数Q1:数据的1/4位置,Qi所在位置=i(n+1)/4,其中i=1,2,3。n表示序列中包含的项数。例如100个数据,Q1所在位置=(100+1)/ 4Q1=0.25×Q1位置+0.75×(Q1位置+1)中位数Q2:Q2所在位置=2 *(100+1)/ 4位于数据的中间位原创 2021-02-11 15:53:57 · 7221 阅读 · 8 评论 -
Python 填补缺失值 Pandas SimpleImputer 随机森林模型 (机器学习)
文章目录填补缺失值1、导入相关库2、创建数据3、利用Pandas填补数据4、sklearn库填补5、利用模型预测填补缺失值1、导入相关库import pandas as pdimport numpy as npfrom sklearn.impute import SimpleImputerfrom sklearn.ensemble import RandomForestRegressor2、创建数据x=np.random.randint(1,100,(10000,5))y=np.ra原创 2021-02-11 13:13:11 · 1485 阅读 · 7 评论 -
Pandas 数据重复处理 duplicated()和drop_duplicates()
文章目录duplicated()和drop_duplicates()导库创建数据集duplicated()计算重复数据数目drop_duplicates()duplicated()和drop_duplicates()导库import pandas as pdimport numpy as np创建数据集x=np.array([[1,2,3],[3,4,5],[1,2,3],[1,2,3]])x=pd.DataFrame(x)xduplicated()返回每行数据是否重复x.du原创 2021-02-11 11:49:22 · 1666 阅读 · 1 评论 -
独热编码(One-Hot Encoding)和 LabelEncoder标签编码 区别 数据预处理:(机器学习) sklearn
文章目录独热编码和 LabelEncoder标签编码1、介绍2、代码测试2.1 导入相关库2.2 读取数据2.3 查看缺失值2.4 利用中位数填补年龄2.5 删除Embarked的缺失行2.6 查看每个特征的类别2.7 对标签进行LabelEncoder编码2.8 利用pandas的哑变量处理2.9 对特征进行哑变量处理2.10 对特征进行独热编码2.11 、模型测试2.11.1 独热编码2.11.1 LabelEncoder编码独热编码和 LabelEncoder标签编码1、介绍对于一些特征工程,原创 2021-02-11 10:59:04 · 4459 阅读 · 1 评论 -
matplotlib python 画图中文显示乱码解决办法 Jupyter
在画图前,加入以下代码:import matplotlib#指定默认字体matplotlib.rcParams['font.sans-serif'] = ['SimHei']#解决负号'-'显示为方块的问题matplotlib.rcParams['axes.unicode_minus'] = False原创 2021-02-11 07:46:17 · 331 阅读 · 1 评论 -
多重共线性检验-方差膨胀系数(VIF)-相关系数(机器学习)sklearn
文章目录多重共线性检验-方差膨胀系数(VIF)1、原理:2、多重共线性:3、检验方法:方差膨胀系数(VIF):相关性检验:4、代码测试4.1 导入相关库4.2准备数据4.3计算膨胀因子4.4计算相关系数4.5分割测试集4.6模型选择4.7AUC值4.8模型调整4.8.1删除 账户资金4.8.2删除 累计交易佣金5、总结多重共线性检验-方差膨胀系数(VIF)1、原理:方差膨胀系数是衡量多元线性回归模型中多重共线性严重程度的一种度量。它表示回归系数估计量的方差与假设自变量间不线性相关时方差相比的比值。原创 2021-02-11 07:43:42 · 12770 阅读 · 2 评论 -
sklearn 中 ShuffleSplit 函数 的详细使用方法 (机器学习)
ShuffleSplit函数的使用方法1、原理用于将样本集合随机“打散”后划分为训练集、测试集(可理解为验证集,下同)类似于交叉验证2、函数形式ShuffleSplit(n_splits=10, test_size=’default’, train_size=None, random_state=None)3、重要参数n_splits:划分数据集的份数,类似于KFlod的折数,默认为10份test_size:测试集所占总样本的比例,如test_size=0.2即将划分后的数据集中20%作原创 2021-02-08 22:04:44 · 5894 阅读 · 4 评论 -
sklearn 中 learning_curve 函数 的详细使用方法 (机器学习)
文章目录learning_curve函数的使用1、原理2、函数形式3、重要参数estimator:x:y:cv:n_jobs:4、函数返回值train_sizes_abs:train_scores:test_scores:5、代码示例导库加载数据画图learning_curve函数的使用1、原理该函数是用来画学习曲线,可以直接返回训练样本、训练集分数、测试集分数内部是根据交叉验证来获得分数的学习曲线就是通过画出不同训练集大小时训练集和交叉验证的准确率,可以看到模型在新数据上的表现,进而来判断模型原创 2021-02-08 21:53:55 · 8186 阅读 · 9 评论 -
硬核:科学家打造全套人工神经系统,让瘫痪病人重新控制身体
来源【IT之家】来源:智东西 作者:信仪 责编:姜戈地址链接1 月 29 日消息,据外媒 IEEE Spectrum 报道,美国一组神经科学家和工程师研发了一套人造神经系统,能让瘫痪的人重新控制自己的肢体。2015 年,这组研究人员对他们的研究成果进行了测试检验。测试者当时胸部以下已瘫痪了三年有余,但借助这套设备,他可以握住简易的吉他接口,用右手的手指按下指板键,左手敲击弹奏杆,使用《吉他英雄》电子游戏弹奏了一些音符。测试者的动作不依赖于体内受损的脊柱,而是使用了一种叫做 “神经搭桥(neura原创 2021-02-04 12:03:51 · 514 阅读 · 1 评论 -
sklearn.preprocessing.PolynomialFeatures多项式特征
生成多项式和交互特征。生成一个新的特征矩阵,该矩阵由度小于或等于指定度的特征的所有多项式组合组成。例如,如果输入样本是二维且格式为[a,b],则2阶多项式特征为[1,a,b,a ^ 2,ab,b ^ 2]。参量属性度int,默认= 2多项式特征的程度。interact_only bool,默认为False如果为真,只有相互作用特征产生:是至多产品特征degree 不同输入特征(因此不是 ,等)。x[1] ** 2x[0] * x[2] ** 3include_bias bool,默认原创 2021-02-01 09:25:48 · 878 阅读 · 3 评论 -
iPhone13系列前瞻 去掉刘海屏 加入更快WiFi6E
来源:腾讯网https://new.qq.com/omn/20201219/20201219A0B4K900.html自从iPhone12系列发布,iPhone13系列各类配置传闻不断曝出,其中绝大多数都是毫无根据空穴来风,但也有来自供应链方面的消息值得注意。比如很多朋友在意的信号问题、刘海问题可能在iPhone13上面有所改善。尽管苹果和高通“冰释前嫌”,iPhone12系列用上高通骁龙X55基带,信号问题却没有改变多少,苹果将“锅”从英特尔身上甩给高通,表示信号不好的原因应该怪高通。无论这个说法是原创 2020-12-19 22:28:33 · 526 阅读 · 2 评论