Introduction

Tue Jul 25 09:54:31 2023 · without

    fdct_round_shift((a +/- b) * c)

    fdct_round_shift(a * c1  +/- b * c2)

    #define ROUND_POWER_OF_TWO(value, n) \
            (((value) + (1 << ((n)-1))) >> (n))

    #include <stdint.h>
    #define ROUND_POWER_OF_TWO(value, n) \
            (((value) + (1 << ((n)-1))) >> (n))
    void twin_int(int16_t *t, int16_t x0, int16_t x1, int16_t cospi_16_64) {
        t[0] = ROUND_POWER_OF_TWO((x0 + x1) * cospi_16_64, 14);
        t[1] = ROUND_POWER_OF_TWO((x0 - x1) * cospi_16_64, 14);
    }

    add 9,5,4
    subf 5,5,4
    mullw 9,9,6
    mullw 5,5,6
    addi 9,9,8192
    addi 5,5,8192
    srawi 9,9,14
    srawi 5,5,14

    |0     |6     |11      |16     |21      |26    |31 |
    | PO   |  RT  |   RA   |   RB  |   SH   |   XO |Rc |

    n <- SH
    sum <- (RT[0] || RT) + (RA[0] || RA)
    diff <- (RT[0] || RT) - (RA[0] || RA)
    prod1 <- MULS(RB, sum)
    prod2 <- MULS(RB, diff)
    if n = 0 then
        prod1_lo <- prod1[XLEN+1:(XLEN*2)]
        prod2_lo <- prod2[XLEN+1:(XLEN*2)]
        RT <- prod1_lo
        RS <- prod2_lo
    else
        round <- [0]*(XLEN*2 + 1)
        round[XLEN*2 - n + 1] <- 1
        prod1 <- prod1 + round
        prod2 <- prod2 + round
        res1 <- prod1[XLEN - n + 1:XLEN*2 - n]
        res2 <- prod2[XLEN - n + 1:XLEN*2 - n]
        RT <- res1
        RS <- res2

    None

    n <- SH
    prod <- MULS(RB, RA)
    if n = 0 then
        prod_lo <- prod[XLEN:(XLEN*2) - 1]
        RT <- (RT) + prod_lo
    else
        res[0:XLEN*2-1] <- (EXTSXL((RT)[0], 1) || (RT)) + prod
        round <- [0]*XLEN*2
        round[XLEN*2 - n] <- 1
        res <- res + round
        RT <- res[XLEN - n:XLEN*2 - n -1]

None

    n <- SH
    prod <- MULS(RB, RA)
    if n = 0 then
        prod_lo <- prod[XLEN:(XLEN*2) - 1]
        RT <- (RT) - prod_lo
    else
        res[0:XLEN*2-1] <- (EXTSXL((RT)[0], 1) || (RT)) - prod
        round <- [0]*XLEN*2
        round[XLEN*2 - n] <- 1
        res <- res + round
        RT <- res[XLEN - n:XLEN*2 - n -1]

None

    maddsubrs 1,10,0,11
    maddrs 1,10,12,14
    msubrs 2,10,12,14

    |0     |6     |11      |16     |21      |31 |
    | PO   |  FRT |  FRA   |  FRB  |   XO   |Rc |

    FRS <- FPADD32(FRT, FRB)
    sub <- FPSUB32(FRT, FRB)
    FRT <- FPMUL32(FRA, sub)

    FRS <- [(FRT) + (FRB)]
    FRT <- [(FRT) - (FRB)] * (FRA)

    FPRF FR FI
    FX OX UX XX
    VXSNAN VXISI VXIMZ

    |0     |6     |11      |16     |21      |31 |
    | PO   |  FRT |  FRA   |  FRB  |   XO   |Rc |

    FRS <- FPMULADD32(FRT, FRA, FRB, -1, 1)
    FRT <- FPMULADD32(FRT, FRA, FRB, 1, 1)

    FRS <- -([(FRT) * (FRA)] - (FRB))
    FRT <-   [(FRT) * (FRA)] + (FRB)

    FPRF FR FI
    FX OX UX XX
    VXSNAN VXISI VXIMZ

    |0     |6     |11      |16     |21      |31 |
    | PO   |  FRT |  FRA   |  FRB  |   XO   |Rc |

    FRS <- FPADD64(FRT, FRB)
    sub <- FPSUB64(FRT, FRB)
    FRT <- FPMUL64(FRA, sub)

    FRS <- [(FRT) + (FRB)]
    FRT <- [(FRT) - (FRB)] * (FRA)

    FPRF FR FI
    FX OX UX XX
    VXSNAN VXISI VXIMZ

    |0     |6     |11      |16     |21      |31 |
    | PO   |  FRT |  FRA   |  FRB  |   XO   |Rc |

    FRS <- FPMULADD64(FRT, FRA, FRB, -1, 1)
    FRT <- FPMULADD64(FRT, FRA, FRB, 1, 1)

    FRS <- -([(FRT) * (FRA)] - (FRB))
    FRT <-   [(FRT) * (FRA)] + (FRB)

    FPRF FR FI
    FX OX UX XX
    VXSNAN VXISI VXIMZ

    |0     |6     |11      |16     |21      |26    |31 |
    | PO   | FRT  |  FRA   |  FRB  |     /  |   XO |Rc |

    FRT <- FPADD32(FRA, FRB)
    FRS <- FPSUB32(FRB, FRA)

    FPRF FR FI
    FX OX UX XX
    VXSNAN VXISI

    |0     |6     |11      |16     |21      |26    |31 |
    | PO   | FRT  |  FRA   |  FRB  |     /  |   XO |Rc |

    FRT <- FPADD64(FRA, FRB)
    FRS <- FPSUB64(FRB, FRA)

    FPRF FR FI
    FX OX UX XX
    VXSNAN VXISI

    |0     |6     |11      |16     |21      |26    |31 |
    | PO   | FRT  |  FRA   |  FRB  |     /  |   XO |Rc |

    FRT <- FPSUB32(FRB, FRA)
    FRS <- FPADD32(FRA, FRB)

    FPRF FR FI
    FX OX UX XX
    VXSNAN VXISI

    |0     |6     |11      |16     |21      |26    |31 |
    | PO   | FRT  |  FRA   |  FRB  |     /  |   XO |Rc |

    FRT <- FPSUB64(FRB, FRA)
    FRS <- FPADD64(FRA, FRB)

    FPRF FR FI
    FX OX UX XX
    VXSNAN VXISI

Introduction

Rationale for Twin Butterfly Integer DCT Instruction(s)

Integer Butterfly Multiply Add/Sub FFT/DCT

[DRAFT] Integer Butterfly Multiply Add and Round Shift FFT/DCT

[DRAFT] Integer Butterfly Multiply Sub and Round Shift FFT/DCT

Twin Butterfly Floating-Point DCT and FFT Instruction(s)

Floating-Point Twin Multiply-Add DCT [Single]

Floating-Point Multiply-Add FFT [Single]

Floating-Point Twin Multiply-Add DCT

Floating-Point Twin Multiply-Add FFT

Floating-Point Add FFT/DCT [Single]

Floating-Point Add FFT/DCT [Double]

Floating-Point Subtract FFT/DCT [Single]

Floating-Point Subtract FFT/DCT [Double]