1. Главная
  2. Библиотека
  3. Высшая математика
  4. Используя матрицу Logits, полученную в результате решен...
Разбор задачи

Используя матрицу Logits, полученную в результате решения предыдущей задачи, найдите выходную матрицу Result для механизма self-attention. Для этого нужно матрицу Logits нормировать с помощью softmax по строкам AttScores softmax (Logits, row: , в

  • Предмет: Высшая математика
  • Автор: Кэмп
  • #Математический анализ
  • #Линейная алгебра и аналитическая геометрия
Используя матрицу Logits, полученную в результате решения предыдущей задачи, найдите выходную матрицу Result для механизма self-attention. Для этого нужно матрицу Logits нормировать с помощью softmax по строкам AttScores softmax (Logits, row: , в

Условие:

Используя матрицу Logits, полученную в результате решения предыдущей задачи, найдите выходную матрицу Result RInLen × EmbSize \in \mathbb{R}^{\text {InLen } \times \text { EmbSize }} для механизма self-attention.

Для этого нужно

  1. матрицу Logits нормировать с помощью softmax по строкам AttScores == softmax (Logits, row: , в результате 00 \leq AttScores [i,j]1[i, j] \leq 1 и j=0InLen1\sum_{j=0}^{I n \operatorname{Len}-1} AttScores [i,j]=1[i, j]=1
  2. найти взвешенную сумму исходных признаков с учётом найденых весов:\nResult == AttScores \cdot Input (c помощью матричного произведения)

Решение:

Для решения задачи, давайте пройдемся по шагам.

Шаг 1: Нормализация матрицы Logits с помощью softmax

Предположим, что у нас есть матрица Logits размером InLen×InLen\text{InLen} \times \text{InLen}. Для каждой строки ii мы применяем функцию softmax:

AttScores[i,j]=eLogits[i,j]k=0InLen1eLogits[i,k] \text{AttScores}[i, j] = \frac{e^{\text{Logits}[i, j]}}{\sum_{k=0}^{\text{InLen}-1} e^{\text{Logits}[i, k]}}

Это гарантирует, что все элементы в строке ii будут в диапазоне от 0 до 1 и сумма по строке будет равна 1.

Шаг 2: Вычисление выходной матрицы Result

После того как мы получили матрицу AttScores, мы можем вычислить вых...

Внутри — полный разбор, аргументация, алгоритм решения, частые ошибки и как отвечать на каверзные вопросы препода, если спросит

Попробуй решить по шагам

Попробуй один шаг и продолжи в режиме обучения или посмотри готовое решение

Какова цель применения функции softmax к матрице Logits по строкам в механизме self-attention?

Что нужно знать по теме:

Что нужно знать по теме

Алгоритм решения

Топ 3 ошибок

Что спросит препод

Выбери предмет