Transformer_搜你所想

如何使用Transformer-TTS语音合成模型

1、技术原理及架构图 Transformer-TTS主要通过将Transformer模型与Tacotron2系统结合来实现文本到语音的转换。在这种结构中，原始的Transformer模型在输入阶段和输出阶段进行了适当的修改，以更好地处理语音数据。具体来说，Transformer-TTS利用自注意力机制来处理序列数据，这使得模型能够并行处理输入序列，从而提高训练效率。此外，Transformer-TTS还...

(view)

Vision Mamba：高效视觉表示学习双向状态空间模型，超越Vision Transformer！

的演变 1. Mamba模型的基本原理 Mamba模型是基于状态空间模型（SSM）的一种深度学习模型，它通过时间变化的参数和硬件感知的算法来实现高效的训练和推理。Mamba的优越性能表明它是语言建模中Transformer的一个有前途的替代品。Mamba模型的设计灵感来源于经典的卡尔曼滤波器模型，特别擅长捕捉长范围依赖关系，并且能够从并行训练中受益。 2. Vim模型的创新之处 Vim模型是在Mamba的基础上为视觉数...

(view)

INS 论文分享：一种用于交通流预测的多通道时空Transformer模型

我们在长期交通流预测方面的最新研究成果，该成果已发表在信息学领域的顶级期刊《Information Sciences》上，论文题目为《A Multi-Channel Spatial-Temporal Transformer Model for Traffic Flow Forecasting》。该论文的第一作者及通讯作者为肖建力老师，第二作者为硕士生龙佰超。此研究展示了我们团队在该领域的最新进展，并为未来的交通管理和规...

(view)

融合Transformer与CNN，实现各任务性能巅峰，可训练参数减少80%

论文er看过来，今天给各位推荐一个热门创新方向：CNN+Transformer。众所周知，CNN通过多层卷积自动学习空间层级特征，能够有效提取图像局部特征。而Transformer通过自注意力机制全局建模，能够有效处理长距离依赖关系。通过结合这两者的优势，我们不仅可以在保持运算效率的同时，提高模型在多种计算机视觉任务中的性能，还能实现较好的延迟和精度之间的权衡。目前，这种策略通过多种方式融合两种模型的优点。主流的...

(view)

AI大模型探索之路-训练篇10：大语言模型Transformer库-Tokenizer组件实践

篇4：大语言模型训练数据集概览 AI大模型探索之路-训练篇5：大语言模型预训练数据准备-词元化 AI大模型探索之路-训练篇6：大语言模型预训练数据准备-预处理 AI大模型探索之路-训练篇7：大语言模型Transformer库之HuggingFace介绍 AI大模型探索之路-训练篇8：大语言模型Transformer库-预训练流程编码体验 AI大模型探索之路-训练篇9：大语言模型Transformer库-Pipeline...

(view)

【Transformer系列（2）】Multi-head self-attention 多头自注意力

一、多头自注意力多头自注意力机制与自注意力机制的区别在于，Q，K，V向量被分为了num_heads份。实现流程（1）根据num_heads参数将单头变成多头，获取多头注意力中的各个头的Q，K，V值（2）Q叉乘K的转置，再使用softmax，获取attention （3）attention叉乘V，得到输出二、代码实现（1）根据num_heads参数将单头变成多头，获取多头注意力中的各个头的Q，K，V值 # ...

(view)

【Transformer系列（3）】cross attention（交叉注意力）

一、cross attention和self-attention的不同 Cross attention和self-attention是在自然语言处理中常用的两种注意力机制。 Self-attention是一种自我关注机制，用于计算输入序列中每个元素与其他元素的关联程度。具体来说，对于给定的输入序列，self-attention机制将每个元素与序列中的所有元素计算关联度，并根据关联度对序列中的每个元素进行加权求和。这种...

(view)

Mamba3D革新3D点云分析：超越Transformer，提升本地特征提取效率与性能！

DeepVisionary 每日深度学习前沿科技推送&顶会论文分享，与你一起了解前沿深度学习信息！ Mamba3D革新3D点云分析：超越Transformer，提升本地特征提取效率与性能！引言：3D点云分析的重要性与挑战 3D点云数据是现代许多应用领域中不可或缺的一部分，包括自动驾驶、虚拟现实（VR/AR）、机器人技术等。这些数据通常由3D扫描设备捕获，能够详细地描述物体的空间形状和外观。与传统的2D图像相比，3D...

(view)

AI大模型探索之路-训练篇11：大语言模型Transformer库-Model组件实践

(view)

Transformers：它们如何转换您的数据？

一、说明在快速发展的人工智能和机器学习领域，一项创新因其对我们处理、理解和生成数据的方式产生深远影响而脱颖而出：Transformers。Transformer 彻底改变了自然语言处理（NLP）及其他领域，为当今一些最先进的 AI 应用程序提供动力。但究竟什么是变形金刚，它们如何以如此开创性的方式转换数据？本文揭开了 Transformer 模型内部工作的神秘面纱，重点介绍了编码器架构。我们将首...

(view)

上一页 1 2 3 4 5 6 7 8 10 下一页