人工智能
文章平均质量分 71
机器学习、深度学习、数据挖掘
热爱旅行的小李同学
沉淀。
展开
-
文心大模型使用——文心一言API
流式与非流式的区别:输出的response格式不一致。类似,可参考多轮对话,修改stream=True。API_KEY、SECRET_KEY自行购买。获取鉴权签名token,以及发送post请求。原创 2023-05-30 16:36:15 · 5845 阅读 · 6 评论 -
AI绘画初体验(6pen平台)
水滴形状,头部浑圆,尾部很尖,表面是极其光滑的全反射镜面,银河系在它的表面映成一片流畅的光纹,使得这滴水银看上去纯洁而唯美。它的液滴外形是那么栩栩如生,以至于观察者有时真以为它就是液态的,根本不可能有内部机械结构。豹头蛇身,鹿角虎爪,深绿色而深邃的眼睛,浓密的眉毛,长长的胡子,翱翔在天空。宇航员在火星上,坐着椅子下象棋,背景是远处的地球。蒲公英,萤火虫,夜晚,人影(数字油画)蒲公英,萤火虫,夜晚,人影(水墨画)远古时期猛犸象和剑齿虎搏斗。未来城市的灯光下逛街的人们。志愿者们为居民做核酸检测。原创 2022-09-14 23:23:59 · 2970 阅读 · 0 评论 -
猿创征文|信息抽取(3)——pytorch实现IDCNN-CRF模型进行实体抽取
模型:论文:摘要:对于序列标注来讲,普通CNN有一个劣势,就是卷积之后,末层神经元可能只是得到了原始输入数据中一小块的信息。而对NER来讲,整个句子的每个字都有可能都会对当前需要标注的字做出影响。为了覆盖到输入的全部信息就需要加入更多的卷积层, 导致层数越来越深,参数越来越多,而为了防止过拟合又要加入更多的Dropout之类的正则化,带来更多的超参数,整个模型变得庞大和难以训练。原创 2022-09-07 15:32:30 · 1678 阅读 · 26 评论 -
猿创征文|信息抽取(2)——pytorch实现Bert-BiLSTM-CRF、Bert-CRF模型进行实体抽取
猿创征文|信息抽取(2)——pytorch实现Bert-BiLSTM-CRF、Bert-CRF模型进行实体抽取原创 2022-09-04 21:56:45 · 7405 阅读 · 254 评论 -
猿创征文|信息抽取(1)——pytorch实现BiLSTM-CRF模型进行实体抽取
论文参考:Bidirectional LSTM-CRF Models for Sequence TaggingNeural Architectures for Named Entity Recognition使用数据集:https://www.datafountain.cn/competitions/529/ranking导包、路径、超参数、预设常量生成word2index字典、加载数据集3 数据处理文本、标签转换为索引(训练集)流程:文本转换为索引(测试集)测试集同上,没有标签4 模型原创 2022-08-29 17:01:17 · 2673 阅读 · 58 评论 -
数据挖掘实战(1)——手写数字识别
sklearn数据挖掘——多分类实现(手写数字识别)原创 2022-08-12 00:42:23 · 893 阅读 · 0 评论 -
数据挖掘实战(3)——时间序列预测ARIMA模型(附踩坑日志)
数据挖掘实战(3)——时间序列预测ARIMA模型(附踩坑日志)原创 2022-08-14 00:18:04 · 3269 阅读 · 14 评论 -
数据挖掘实战(2)——糖尿病数据集(回归问题)
数据挖掘实战(2)——糖尿病数据集(回归问题)包括18种模型:线性回归、岭回归、Lasso回归、KNN、SVR、决策树、Bagging、随机森林、极限树、AdaBoost、GBDT、XGBoost、LightGBM、CatBoost、Voting、Stacking、MLP...原创 2022-08-12 16:57:47 · 5295 阅读 · 10 评论 -
数据挖掘实战(6)——机器学习实现文本分类(今日头条tnews数据集)
1) StratifiedKFold()的split()函数要求同时传入X和y,且对X和y有要求:(特征数,样本数),所以提前将X和y转化为ndarray格式,并reshape(-1, 1)(2)CounterVectorizer()的fit_transform()函数最好传入[str1, str2, str3]格式的list,否则将报错(3)model.fit()报错,百度是不能传稀疏矩阵之类的,将之转化为ndarray解决了。......原创 2022-08-18 12:09:00 · 1176 阅读 · 1 评论 -
数据挖掘实战(5)——关联规则(美国国会投票数据集)
Support(支持度):表示某个项集出现的频率,也就是包含该项集的交易数与总交易数的比例。例如P(A)表示项集A的比例,P(A\cap B)P(A∩B)表示项集A和项集B同时出现的比例。Confidence(置信度):表示当A项出现时B项同时出现的频率,记作{A→B}。换言之,置信度指同时包含A项和B项的交易数与包含A项的交易数之比。公式表达:{A→B}的置信度=P(A|B)=P(A\cap B) / P(BP(A∣B)=P(A∩B)/P(BLift(提升度):指A项和B项一同出现的频率,但同时要考原创 2022-08-15 18:28:31 · 2887 阅读 · 13 评论 -
数据挖掘实战(4)——聚类(Kmeans、MiniBatchKmeans、DBSCAN、AgglomerativeClustering、MeanShift)
数据挖掘实战(4)——聚类(Kmeans、MiniBatchKmeans、DBSCAN、AgglomerativeClustering、Mean聚类的评价指标兰德指数:计算真实标签与聚类标签两种分布相似性之间的相似性,取值范围为[0,1]轮廓系数:是聚类效果好坏的一种评价方式。最早由 Peter J. Rousseeuw 在 1986 提出。它结合内聚度和分离度两种因素。可以用来在相同原始数据的基础上用来评价不同算法、或者算法不同运行方式对聚类结果所产生的影响。[-1,1],轮廓系数越大,聚类效果越好。原创 2022-08-14 22:20:07 · 982 阅读 · 0 评论 -
深度学习笔记(5)——pytorch实现Att-BiLSTM
模型图:LSTM层:Attention层M=tanh(H)α=softmax(ωT∗M)r=HαTh∗=tanh(r)M=tanh(H)α=softmax(ωT∗M)r=HαTh∗=tanh(r)其中H为LSTM输出的结果,对应于nn.lstm()输出的第一个结果。原创 2022-08-25 20:56:13 · 1725 阅读 · 2 评论 -
深度学习笔记(1)——pytorch实现线性回归
pytorch实现一元线性,回归代码如下:# pytorch实现一元线性回归import numpy as npimport matplotlib.pyplot as pltimport torchfrom torch import nn, optimfrom torch.autograd import Variable# 定义数据集x_data = np.random.rand(100)noise = np.random.normal(0, 0.01, x_data.shape) #原创 2022-03-23 22:02:05 · 3049 阅读 · 1 评论 -
深度学习笔记(3)——pytorch+TextCNN实现情感分类(外卖数据集)
使用数据集:某外卖数据集,共有11987条数据,标签数为2。配置环境:Rtx3060 Laptop。原创 2022-08-20 14:29:50 · 4343 阅读 · 21 评论 -
深度学习笔记(2)——pytorch实现MNIST数据集分类(FNN、CNN、RNN、LSTM、GRU)
快开学了,花了一个晚上时间复习深度学习基础代码,复习了最基础的MNIST手写数字识别数据集分类,使用FNN、CNN、RNN、LSTM、GRU实现。原创 2022-08-16 23:41:59 · 2623 阅读 · 4 评论 -
深度学习笔记(4)——TextCNN、BiLSTM实现情感分类(weibo100k数据集)
使用数据集:微博数据集,共有约12万条数据,标签数为2。配置环境:Rtx3060 Laptop/AutoDL。原创 2022-08-22 23:23:10 · 3225 阅读 · 9 评论 -
NLP工具学习(1)Thulac分词工具与WordCloud词云
数据集:某比赛数据集。原创 2022-08-23 17:06:36 · 937 阅读 · 0 评论 -
[知识图谱]cql与py2neo学习笔记
知识图谱,neo4j学习笔记原创 2022-03-29 14:02:55 · 2020 阅读 · 0 评论 -
[知识图谱]Neo4j安装
首先安装JDK11,这里之前安装了接着安装Neo4j 网址:https://neo4j.com/download-center/#community安装的是社区版,解压到任意目录就好了接着配置系统变量Path变量增加 %JAVA_HOME%\bin 和 %NEO4J_HOME%\bin控制台输入: neo4j.bat console打开浏览器进入默认地址重新设置密码成功...原创 2022-03-28 17:00:42 · 663 阅读 · 0 评论