Intel Agilex - Page 57

To Next Page

To Previous Page

Figure 40. Direct Vector Dot Product Using FP32 Single-Precision Floating-Point

Arithmetic

AB + CD

AB + CD + EF + GH

EF + GH

IJ +KL

Vector One

*This block diagram shows the functional representation of the DSP block.

The pipeline registers are embedded within the various circuits of the DSP block.

Connect this signal to

the fp32_chainout signal

of the next DSP block in chain.

fp32_chainout[31:0]

fp32_chainin[31:0]

accumulate

fp32_adder_a[31:0]

fp32_mult_a[31:0]

fp32_mult_b[31:0]

Output

Bank

Input

Bank

fp32_result[31:0]

Multiplier

Adder

*Pipeline

Bank

*Pipeline

Bank

*Pipeline

Bank

*Pipeline

Bank

*Pipeline

Bank

fp32_mult_invalid

fp32_mult_inexact

fp32_mult_overflow

fp32_mult_underflow

fp32_adder_invalid

fp32_adder_inexact

fp32_adder_overflow

fp32_adder_underflow

fp32_adder_b[31:0]

AB + CD + EF + GH

AB + CD +EF + GH + IJ +KL

fp32_chainout[31:0]

fp32_chainin[31:0]

accumulate

fp32_adder_a[31:0]

fp32_mult_a[31:0]

fp32_mult_b[31:0]

fp32_result[31:0]

Multiplier

Adder

*Pipeline

Bank

*Pipeline

Bank

*Pipeline

Bank

*Pipeline

Bank

fp32_mult_invalid

fp32_mult_inexact

fp32_mult_overflow

fp32_mult_underflow

fp32_adder_invalid

fp32_adder_inexact

fp32_adder_overflow

fp32_adder_underflow

Input

Bank

fp32_adder_b[31:0]

Output

Bank

*Pipeline

Bank

Vector Two

Vector One

fp32_chainin[31:0]

accumulate

fp32_adder_a[31:0]

fp32_mult_a[31:0]

fp32_mult_b[31:0]

Output

Bank

Input

Bank

fp32_result[31:0]

Multiplier

Adder

*Pipeline

Bank

*Pipeline

Bank

*Pipeline

Bank

*Pipeline

Bank

*Pipeline

Bank

fp32_mult_invalid

fp32_mult_inexact

fp32_mult_overflow

fp32_mult_underflow

fp32_adder_invalid

fp32_adder_inexact

fp32_adder_overflow

fp32_adder_underflow

fp32_adder_b[31:0]

fp32_chainout[31:0]

fp32_chainin[31:0]

accumulate

fp32_adder_a[31:0]

fp32_mult_a[31:0]

fp32_mult_b[31:0]

fp32_result[31:0]

Multiplier

Adder

*Pipeline

Bank

*Pipeline

Bank

*Pipeline

Bank

*Pipeline

Bank

fp32_mult_invalid

fp32_mult_inexact

fp32_mult_overflow

fp32_mult_underflow

fp32_adder_invalid

fp32_adder_inexact

fp32_adder_overflow

fp32_adder_underflow

Input

Bank

fp32_adder_b[31:0]

Output

Bank

*Pipeline

Bank

Vector Two

fp32_chainout[31:0]

fp32_chainin[31:0]

accumulate

fp32_adder_a[31:0]

fp32_result[31:0]

Multiplier

Adder

*Pipeline

Bank

*Pipeline

Bank

*Pipeline

Bank

*Pipeline

Bank

fp32_mult_invalid

fp32_mult_inexact

fp32_mult_overflow

fp32_mult_underflow

fp32_adder_invalid

fp32_adder_inexact

fp32_dder_overflow

fp32_adder_underflow

*Pipeline

Output

Bank

Input

Bank

fp32_adder_b[31:0]

fp32_mult_a[31:0]

fp32_mult_b[31:0]

Multiply Add

IJ +KL + MN + OP

For FP16 half-precision floating-point arithmetic, the direct vector dot product consists

of:

• Sum of two multiplication with FP32 addition mode with chainin feature enabled

• Vector one

• Vector two

3. Intel Agilex Variable Precision DSP Blocks Operational Modes

UG-20213 | 2019.04.02

Send Feedback

Intel

Agilex

™

Variable Precision DSP Blocks User Guide

Main Page

Intel Agilex - Page 57

Table of Contents

Other manuals for Intel Agilex

Related product manuals