OPF ISA WG External RFC LS001 v3 24mar2023

Tue Sep 19 17:55:40 2023

    # load 64 registers off the stack, in-order, skipping unneeded ones
    # by using CR0-CR63's "EQ" bits to select only those needed.
    setvli 64
    sv.ld/sm=EQ *rt,0(ra)

 292     # checks that we are able to resume in the middle of a VL loop,
 293     # after an interrupt, or after the user has updated src/dst step
 294     # let's assume the user has prepared src/dst step before running this
 295     # vector instruction
 296     # test_intpred_reentrant
 297         #   reg num        0 1 2 3 4 5 6 7 8 9 10 11 12
 298         #   srcstep=1                           v
 299         #   src r3=0b0101                    Y  N  Y  N
 300         #                                    :     |
 301         #                              + - - +     |
 302         #                              :   +-------+
 303         #                              :   |
 304         #   dest ~r3=0b1010          N Y N Y
 305         #   dststep=2                    ^
 306
 307         sv.extsb/sm=r3/dm=~r3 *5, *9

  28     # test_sv_remap1   5x4 by 4x3 matrix multiply
  29                        svshape 5, 4, 3, 0, 0
  30                        svremap 31, 1, 2, 3, 0, 0, 0
  31                        sv.fmadds *0, *8, *16, *0

  75     # test_sv_remap2
  76                        svshape 7, 0, 0, 7, 0
  77                        svremap 31, 1, 0, 0, 0, 0, 0 # different order
  78                        sv.subf *0, *8, *16

1014     # test_sv_remap_fpmadds_ldbrev_idct_8_mode_4
1015                       # LOAD bit-reversed with half-swap
1016                       svshape 8, 1, 1, 14, 0
1017                       svremap 1, 0, 0, 0, 0, 0, 0
1018                       sv.lfs/els *0, 4(1)
1019                       # Outer butterfly, iterative sum
1020                       svremap 31, 0, 1, 2, 1, 0, 1
1021                       svshape 8, 1, 1, 11, 0
1022                       sv.fadds *0, *0, *0
1023                       # Inner butterfly, twin +/- MUL-ADD-SUB
1024                       svshape 8, 1, 1, 10, 0
1025                       sv.ffmadds *0, *0, *0, *8

  80   # test_sv_branch_cond_all
  81       for i in [7, 8, 9]:
  83               addi 1, 0, i+1        # set r1 to i
  84               addi 2, 0, i          # set r2 to i
  85               cmpi cr0, 1, 1, 8     # compare r1 with 8 and store to cr0
  86               cmpi cr1, 1, 2, 8     # compare r2 with 8 and store to cr1
  87               sv.bc/all 12, *1, 0xc # bgt 0xc - branch if BOTH
  88                                     # r1 AND r2 greater 8 to the nop below
  89               addi 3, 0, 0x1234,    # if tests fail this shouldn't execute
  90               or 0, 0, 0            # branch target

  26     # test_sv_bigint_add
  32
  33         r3/r2: 0x0000_0000_0000_0001 0xffff_ffff_ffff_ffff +
  34         r5/r4: 0x8000_0000_0000_0000 0x0000_0000_0000_0001 =
  35         r1/r0: 0x8000_0000_0000_0002 0x0000_0000_0000_0000
  36
  37                          sv.adde *0, *2, *4

  62     # test_sv_bigint_scalar_shiftright(self):
  64
  65     r3                    r2                    r1                       r4
  66     0x0000_0000_0000_0002 0x8000_8000_8000_8001 0xffff_ffff_ffff_ffff >> 4
  67     0x0000_0000_0000_0002 0x2800_0800_0800_0800 0x1fff_ffff_ffff_ffff
  68
  69                          sv.dsrd *0,*1,4,1

  41  "mtspr 9, 3",                   # move r3 to CTR
  42  "addi 0,0,0",                   # initialise r0 to zero
  43  # chr-copy loop starts here:
  44  #   for (i = 0; i < n && src[i] != '\0'; i++)
  45  #        dest[i] = src[i];
  46  # VL (and r1) = MIN(CTR,MAXVL=4)
  47  "setvl 1,0,%d,0,1,1" % maxvl,
  48  # load VL bytes (update r10 addr)
  49  "sv.lbzu/pi *16, 1(10)",
  50  "sv.cmpi/ff=eq/vli *0,1,*16,0",  # compare against zero, truncate VL
  51  # store VL bytes (update r12 addr)
  52  "sv.stbu/pi *16, 1(12)",
  53  "sv.bc/all 0, *2, -0x1c",       # test CTR, stop if cmpi failed
  54  # zeroing loop starts here:
  55  #   for ( ; i < n; i++)
  56  #       dest[i] = '\0';
  57  # VL (and r1) = MIN(CTR,MAXVL=4)
  58  "setvl 1,0,%d,0,1,1" % maxvl,
  59  # store VL zeros (update r12 addr)
  60  "sv.stbu/pi 0, 1(12)",
  61  "sv.bc 16, *0, -0xc",           # decrement CTR by VL, stop at zero

0-5	6	7	8-31	Description
PO	0	0	0000	new-suffix `RESERVED1`
PO	0	0	!zero	new-suffix, scalar (SVP64Single), or `RESERVED3`
PO	1	0	0000	new scalar-only word, or `RESERVED2`
PO	1	0	!zero	old-suffix, scalar (SVP64Single), or `RESERVED4`
PO	0	1	nnnn	new-suffix, vector (SVP64)
PO	1	1	nnnn	old-suffix, vector (SVP64)

	Scalar (bit7=0,8-31=0000)	Scalar (bit7=0,8-31=!zero)	Vector (bit7=1)
new bit6=0	`RESERVED1`:{EXT200-263}	`RESERVED3`:SVP64-Single:{EXT200-263}	SVP64:{EXT200-263}
old bit6=1	`RESERVED2`:{EXT300-363}	`RESERVED4`:SVP64-Single:{EXT000-063}	SVP64:{EXT000-063}

0-5	6	7	8-31	32:33	Description
PO9?	0	0	!zero	00-10	RESERVED (other)
PO9?	0	1	xxxx	00-10	RESERVED (other)
PO9?	x	0	0000	xx	RESERVED (other)
PO9?	0	0	!zero	11	SVP64 (current and future)
PO9?	0	1	xxxx	11	SVP64 (current and future)
PO9?	1	0	!zero	xx	SVP64 (current and future)
PO9?	1	1	xxxx	xx	SVP64 (current and future)

0-5	6	7	8-31	32-3	Description
PO	0	0	!zero	0b11	SVP64Single:EXT248-263, or `RESERVED3`
PO	0	0	0000	0b11	Scalar EXT248-263
PO	0	1	nnnn	0b11	SVP64:EXT248-263
PO	1	0	!zero	nn	SVP64Single:EXT000-063 or `RESERVED4`
PO	1	1	nnnn	nn	SVP64:EXT000-063

0-5	6	7	8-31	32-3	Description
PO9?	1	0	0000	xx	`RESERVED1` or EXT300-363 (32-bit)
PO9?	0	x	xxxx	0b00	`RESERVED2` or EXT200-216 (55-bit)
PO9?	0	x	xxxx	0b01	`RESERVED2` or EXT216-231 (55-bit)
PO9?	0	x	xxxx	0b10	`RESERVED2` or EXT232-247 (55-bit)

OPF ISA WG External RFC LS001 v3 24mar2023

Basic principle

Extension Levels

Binary Interoperability

Hardware Implementations

Simple-V Architectural Resources

SVP64 24-bit Prefixes

LD/ST RM Modes

CR Field RM Modes.

SVP64Single 24-bits

Vertical-First Mode

Simple-V REMAP subsystem

Scalar Operations

Adding new opcodes.

Potential Opcode allocation solution (superseded)

Potential Opcode allocation solution (2)

Example Legal Encodings and RESERVED spaces

Use cases

LD/ST-Multi

Twin-Predication, re-entrant

Matrix Multiply

Parallel Reduction

DCT

3D GPU style "Branch Conditional"

Big-Integer Math

Vectorized strncpy

Definitions

New Prefixed Instruction Encoding space

0-5	6	7	8-31	32	Description
PO9?	1	0	0000	x	EXT300-363 or `RESERVED1` (32-bit)
PO9?	0	x	xxxx	0	EXT200-232 or `RESERVED2` (56-bit)
PO9?	0	x	xxxx	1	EXT232-263 and SVP64(/V/S)

width	assembler	prefix?	suffix	description
32bit	fishmv	none	0x12345678	scalar EXT0nn
64bit	ss.fishmv	0x26!zero	0x12345678	scalar SVP64Single:EXT0nn
64bit	sv.fishmv	0x27nnnnnn	0x12345678	vector SVP64:EXT0nn

width	assembler	prefix?	suffix	description
64bit	fishmv	0x24000000	0x12345678	scalar EXT2nn
64bit	ss.fishmv	0x24!zero	0x12345678	scalar SVP64Single:EXT2nn
64bit	sv.fishmv	0x25nnnnnn	0x12345678	vector SVP64:EXT2nn

width	assembler	prefix?	suffix	description
32bit	mtmsr	none	0x12345678	scalar EXT0nn
64bit	ss.mtmsr	0x26!zero	0x12345678	scalar SVP64Single:EXT0nn
64bit	sv.mtmsr	0x27nnnnnn	0x12345678	vector SVP64:EXT0nn

width	assembler	prefix?	suffix	description
64bit	mtmsr2	0x24000000	0x12345678	scalar EXT2nn
64bit	ss.mtmsr2	0x24!zero	0x12345678	scalar SVP64Single:EXT2nn
64bit	sv.mtmsr2	0x25nnnnnn	0x12345678	vector SVP64:EXT2nn

width	assembler	prefix?	suffix	description
32bit	fredmv	none	0x12345678	scalar EXT0nn
64bit	ss.fredmv	0x26!zero	0x12345678	scalar SVP64Single:EXT0nn
64bit	sv.fishmv	0x27nnnnnn	0x12345678	vector SVP64:EXT0nn

width	assembler	prefix?	suffix	description
32bit	unallocated	none	0x12345678	scalar EXT0nn
64bit	ss.fredmv	0x26!zero	0x12345678	scalar SVP64Single:EXT0nn
64bit	sv.fishmv	0x27nnnnnn	0x12345678	vector SVP64:EXT0nn

width	assembler	prefix?	suffix	description
64bit	EXT001	0x04nnnnnn	any	scalar EXT001
96bit	sv.EXT001	0x24!zero	EXT001	scalar SVP64Single:EXT001
96bit	sv.EXT001	0x25nnnnnn	EXT001	vector SVP64:EXT001

0-5	6-29	30 31	32-37	38-63	Description
PO9	xxxx	x x	010001	xxxx	RESERVED(1)
PO9	xxxx	x x	000001	xxxx	RESERVED(2)
PO9	!ZERO	1 1	!PO9	nnnn	SVP64Single:EXT200-263
PO9	0000	1 1	!PO9	nnnn	Scalar EXT200-263
PO9	SVRM	1 0	!PO9	nnnn	SVP64:EXT200-263
PO9	0000	0 1	DWd	nnnn	32-bit EXT300-363
PO9	!ZERO	0 1	DWd	nnnn	SVP64Single:EXT000-063
PO9	SVRM	0 0	DWd	nnnn	SVP64:EXT000-063