Intel Agilex - Page 58

To Next Page

To Previous Page

Figure 41. Direct Vector Dot Product Using FP16 Half-Precision Floating-Point Arithmetic

(A*B) + (C*D)+(E*F)+(H*G)

AB + CD+EF+GH

AB + CD + EF + GH + IJ + KL + MN + OP

*This block diagram shows the functional representation of the DSP block.

The pipeline registers are embedded within the various circuits of the DSP block.

Vector One

fp32_chainout[31:0]

fp32_adder_a[31:0]

fp16_mult_top_a[15:0]

fp32_result[31:0]

Input

Bank

Top

Multiplier

Adder

*Pipeline

fp16_mult_top_invalid

fp16_mult_top_underflow

fp16_mult_top_overflow

fp32_adder_invalid

fp32_adder_inexact

fp32_adder_overflow

fp32_adder_underflow

*Pipeline

Output

Bank

fp16_mult_top_b[15:0]

fp16_mult_bot_a[15:0]

Bottom

Multiplier

fp16_mult_bot_b[15:0]

*Pipeline

Adder

fp16_mult_top_inexact

fp16_mult_bot_invalid

fp16_mult_bot_underflow

fp16_mult_bot_overflow

fp16_mult_bot_inexact

fp16_adder_invalid

fp16_adder_inexact

fp16_adder_overflow

fp16_adder_underflow

fp16_mult_top_infinite(extended format)

fp16_mult_top_zero(extended format)

fp16_mult_bot_infinite(extended format)

fp16_mult_bot_zero(extended format)

fp16_adder_infinite(extended format)

fp16_adder_zero(extended format)

fp32_chainout[31:0]

fp32_chainin[31:0]

fp32_adder_a[31:0]

fp16_mult_top_a[15:0]

fp32_result[31:0]

Input

Bank

Top

Multiplier

Adder

*Pipeline

Output

Bank

fp16_mult_top_b[15:0]

fp16_mult_bot_a[15:0]

Bottom

Multiplier

fp16_mult_bot_b[15:0]

*Pipeline

Adder

fp16_mult_top_invalid

fp16_mult_top_underflow

fp16_mult_top_overflow

fp32_adder_invalid

fp32_adder_inexact

fp32_adder_overflow

fp32_adder_underflow

fp16_mult_top_inexact

fp16_mult_bot_invalid

fp16_mult_bot_underflow

fp16_mult_bot_overflow

fp16_mult_bot_inexact

fp16_adder_invalid

fp16_adder_inexact

fp16_adder_overflow

fp16_adder_underflow

fp16_mult_top_infinite(extended format)

fp16_mult_top_zero(extended format)

fp16_mult_bot_infinite(extended format)

fp16_mult_bot_zero(extended format)

fp16_adder_infinite(extended format)

fp16_adder_zero(extended format)

fp32_chainin[31:0]

Vector Two

Sum of Two FP16 Multiplication with

FP32 Addition

fp32_chainout[31:0]

fp32_chainin[31:0]

fp32_adder_a[31:0]

fp16_mult_top_a[15:0]

fp32_result[31:0]

Input

Bank

Top

Multiplier

Adder

*Pipeline

Output

Bank

fp16_mult_top_b[15:0]

fp16_mult_bot_a[15:0]

Bottom

Multiplier

fp16_mult_bot_b[15:0]

*Pipeline

Adder

fp16_mult_top_invalid

fp16_mult_top_underflow

fp16_mult_top_overflow

fp32_adder_invalid

fp32_adder_inexact

fp32_adder_overflow

fp32_adder_underflow

fp16_mult_top_inexact

fp16_mult_bot_invalid

fp16_mult_bot_underflow

fp16_mult_bot_overflow

fp16_mult_bot_inexact

fp16_adder_invalid

fp16_adder_inexact

fp16_adder_overflow

fp16_adder_underflow

fp16_mult_top_infinite(extended format)

fp16_mult_top_zero(extended format)

fp16_mult_bot_infinite(extended format)

fp16_mult_bot_zero(extended format)

fp16_adder_infinite(extended format)

fp16_adder_zero(extended format)

Vector One

IJ+KL+MN+OP

AB + CD + EF + GH + IJ + KL + MN + OP+QR+ST+UV+WX+YZ+ab+cd+ef

Vector One

fp32_chainout[31:0]

fp32_chainin[31:0]

fp32_adder_a[31:0]

fp16_mult_top_a[15:0]

fp32_result[31:0]

Input

Bank

Top

Multiplier

Adder

*Pipeline

Output

Bank

fp16_mult_top_b[15:0]

fp16_mult_bot_a[15:0]

Bottom

Multiplier

fp16_mult_bot_b[15:0]

*Pipeline

Adder

fp16_mult_top_invalid

fp16_mult_top_underflow

fp16_mult_top_overflow

fp32_adder_invalid

fp32_adder_inexact

fp32_adder_overflow

fp32_adder_underflow

fp16_mult_top_inexact

fp16_mult_bot_invalid

fp16_mult_bot_underflow

fp16_mult_bot_overflow

fp16_mult_bot_inexact

fp16_adder_invalid

fp16_adder_inexact

fp16_adder_overflow

fp16_adder_underflow

fp16_mult_top_infinite(extended format)

fp16_mult_top_zero(extended format)

fp16_mult_bot_infinite(extended format)

fp16_mult_bot_zero(extended format)

fp16_adder_infinite(extended format)

fp16_adder_zero(extended format)

Vector Two

AB + CD+EF+GH+IJ+KL+MN+OP

fp32_chainout[31:0]

fp32_chainin[31:0]

fp32_adder_a[31:0]

fp16_mult_top_a[15:0]

fp32_result[31:0]

Input

Bank

Top

Multiplier

Adder

*Pipeline

Output

Bank

fp16_mult_top_b[15:0]

fp16_mult_bot_a[15:0]

Bottom

Multiplier

fp16_mult_bot_b[15:0]

*Pipeline

Adder

fp16_mult_top_invalid

fp16_mult_top_underflow

fp16_mult_top_overflow

fp32_adder_invalid

fp32_adder_inexact

fp32_adder_overflow

fp32_adder_underflow

fp16_mult_top_inexact

fp16_mult_bot_invalid

fp16_mult_bot_underflow

fp16_mult_bot_overflow

fp16_mult_bot_inexact

fp16_adder_invalid

fp16_adder_inexact

fp16_adder_overflow

fp16_adder_underflow

fp16_mult_top_infinite(extended format)

fp16_mult_top_zero(extended format)

fp16_mult_bot_infinite(extended format)

fp16_mult_bot_zero(extended format)

fp16_adder_infinite(extended format)

fp16_adder_zero(extended format)

Vector One

QR+ST+UV+WX

QR+ST+UV+WX+YZ+ab+cd+efQR+ST+UV+WX+YZ+ab+cd+ef

Vector One

fp32_chainout[31:0]

fp32_chainin[31:0]

fp32_adder_a[31:0]

fp16_mult_top_a[15:0]

fp32_result[31:0]

Input

Bank

Top

Multiplier

Adder

*Pipeline

Output

Bank

fp16_mult_top_b[15:0]

fp16_mult_bot_a[15:0]

Bottom

Multiplier

fp16_mult_bot_b[15:0]

*Pipeline

Adder

fp16_mult_top_invalid

fp16_mult_top_underflow

fp16_mult_top_overflow

fp32_adder_invalid

fp32_adder_inexact

fp32_adder_overflow

fp32_adder_underflow

fp16_mult_top_inexact

fp16_mult_bot_invalid

fp16_mult_bot_underflow

fp16_mult_bot_overflow

fp16_mult_bot_inexact

fp16_adder_invalid

fp16_adder_inexact

fp16_adder_overflow

fp16_adder_underflow

fp16_mult_top_infinite(extended format)

fp16_mult_top_zero(extended format)

fp16_mult_bot_infinite(extended format)

fp16_mult_bot_zero(extended format)

fp16_adder_infinite(extended format)

fp16_adder_zero(extended format)

Vector Two

Connect this signal to

the fp32_chainout signal

of the next DSP in the chain

Connect this signal to

the fp32_result signal

of the next DSP in the chain

3.2.3.3. Complex Multiplication

The Intel Agilex devices support the floating-point arithmetic single precision complex

multiplier using four Intel Agilex variable-precision DSP blocks.

Figure 42.

Sample of Complex Multiplication Equation

3. Intel Agilex Variable Precision DSP Blocks Operational Modes

UG-20213 | 2019.04.02

Intel

Agilex

™

Variable Precision DSP Blocks User Guide

Send Feedback

Main Page

Intel Agilex - Page 58

Table of Contents

Other manuals for Intel Agilex

Related product manuals