ユーザ用ツール

サイト用ツール


opengl:cpufop

差分

このページの2つのバージョン間の差分を表示します。

この比較画面にリンクする

両方とも前のリビジョン 前のリビジョン
次のリビジョン
前のリビジョン
opengl:cpufop [2018/06/08 21:56]
oga [Scalar]
opengl:cpufop [2020/12/31 14:09] (現在)
oga [IPC]
行 8: 行 8:
  
  
-===== Scalar =====+ 
 +===== IPC ====== 
 + 
 +^ float 32bit                                                                                                         ^^^^^ Scalar (32bit)                   ^^^^ SIMD 2 (64bit)                     ^^^^ SIMD 4 (128bit)                     ^^^^ SIMD 8 (256bit)                     ^^^^ SIMD 16 (512bit)                    ^^^^ 
 +^ CPU/SoC                        ^ CPU core           ^ FPU                 ^ SIMD Width                                 ^^ add     ^ mul    ^ mad/fma  ^ total ^ add     ^ mul      ^ mad/fma  ^ total ^ add      ^ mul      ^ mad/fma  ^ total ^ add      ^ mul      ^ mad/fma  ^ total ^ add      ^ mul      ^ mad/fma  ^ total ^ 
 +| BCM2835                        | ARM1176JZF-S       | VFPv2                  64bit | 64bit mad                        |     0.5 |    0.5 |      0.5 |   0.5 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| S5PC100                        | Cortex-A8          | VFPv3 NEON          |   128bit | 128bit mad                           0.1 |    0.1 |      0.1 |   0.1 |       1 |        1 |        1 |     1 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| BCM2836                        | Cortex-A7          | VFPv4 NEON          |    32bit | 32bit fma                        |       1 |      1 |        1 |     1 |     0.5 |      0.5 |      0.5 |   0.5 |     0.25 |     0.25 |     0.25 |  0.25 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple S1                       | Cortex-A7          | VFPv4 NEON          |    32bit | 32bit fma                        |       1 |      1 |        1 |     1 |     0.5 |      0.5 |      0.5 |   0.5 |     0.25 |     0.25 |     0.25 |  0.25 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple S2                       | Cortex-A7          | VFPv4 NEON          |    32bit | 32bit fma                        |       1 |      1 |        1 |     1 |     0.5 |      0.5 |      0.5 |   0.5 |     0.25 |     0.25 |     0.25 |  0.25 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Tegra 2                        | Cortex-A9          | VFPv3                  64bit | 64bit mad                        |       1 |      1 |        1 |     1 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A5                       | Cortex-A9          | VFPv3 NEON          |   128bit | 128bit mad                             1 |      1 |        1 |     1 |       1 |        1 |        1 |     1 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Tegra 4                        | Cortex-A15         | VFPv4 NEON          |   128bit | 64bit fma x2                           1 |      1 |        1 |     1 |       2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| BCM2837                        | Cortex-A53         | AArch64 ASIMD         128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon 845                 | (Cortex-A55)       | AArch64 ASIMD FP16  |   128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Tegra X1                       | Cortex-A57         | AArch64 ASIMD         128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| BCM2711                        | Cortex-A72         | AArch64 ASIMD         128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon 835                 | (Cortex-A73)       | AArch64 ASIMD         128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon 845                 | (Cortex-A75)       | AArch64 ASIMD FP16  |   128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A6                       | Swift              | VFPv4 NEON          |   128bit | 128bit fma                             1 |      1 |        1 |     1 |       1 |        1 |        1 |     1 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A7                       | Cyclone            | AArch64 ASIMD         384bit | 128bit add + 128bit fma x2             3 |      2 |        2 |     3 |       3 |        2 |        2 |     3 |        3 |        2 |        2 |     3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A8                       | Typhoon            | AArch64 ASIMD         384bit | 128bit add + 128bit fma x2             3 |      2 |        2 |     3 |       3 |        2 |        2 |     3 |        3 |        2 |        2 |     3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A9                       | Twister            | AArch64 ASIMD         384bit | 128bit fma x3                    |       3 |      3 |        3 |     3 |       3 |        3 |        3 |     3 |        3 |        3 |        3 |     3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A10                      | Hurricane          | AArch64 ASIMD         384bit | 128bit fma x3                    |       3 |      3 |        3 |     3 |       3 |        3 |        3 |     3 |        3 |        3 |        3 |     3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A11                      | Monsoon            | AArch64 ASIMD         384bit | 128bit fma x3                    |       3 |      3 |        3 |     3 |       3 |        3 |        3 |     3 |        3 |        3 |        3 |     3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple M1                       | Firestorm          | AArch64 ASIMD FP16  |   512bit | 128bit add/mul + 128bit fma x3         4 |      4 |        3 |     4 |       4 |        4 |        3 |     4 |        4 |        4 |        3 |     4 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple S6                       | Icestorm?          | AArch64 ASIMD FP16  |   256bit | 128bit add + 128bit fma          |       2 |      1 |        1 |     2 |       2 |        1 |        1 |     2 |        2 |        1 |        1 |     2 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Tegra K1                       | Denver             | AArch64 ASIMD         256bit | 128bit add + 128bit fma          |       2 |      1 |        1 |     2 |       2 |        1 |        1 |     2 |        2 |        1 |        1 |     2 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon MSM8250             | Scorpion           | VFPv3 NEON          |   128bit | 128bit mad                             1 |      1 |        1 |     1 |       1 |        1 |        1 |     1 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon S4 Pro MSM8264      | Krait              | VFPv4 NEON          |   128bit | 128bit fma                             1 |      1 |        1 |     1 |       1 |        1 |        1 |     1 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon 820                 | Kryo               | AArch64 ASIMD         256bit | 128bit add + 128bit fma          |       2 |      1 |        1 |     2 |       2 |        1 |        1 |     2 |        2 |        1 |        1 |     2 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Atom Z2560                     | Saltwell           | SSSE3                 192bit | 128bit add + 64bit mul                 1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |      0.5 |    (0.7) |   0.7 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Celeron J1900                  | SIlvermont         | SSE4.2              |   192bit | 128bit add + 64bit mul                 1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |      0.5 |    (0.7) |   0.7 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Atom x7-Z8700                  | Airmont            | SSE4.2              |   192bit | 128bit add + 64bit mul                 1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |      0.5 |    (0.7) |   0.7 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Core 2                         | Penryn             | SSE4.1              |   256bit | 128bit add + 128bit mul          |       1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |        1 |      (1) |     2 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Core i7-2700                   | SandyBridge        | AVX                   512bit | 256bit add + 256bit mul          |       1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |        1 |      (1) |     2 |        1 |        1 |      (1) |     2 |       -- |       -- |       -- |    -- | 
 +| Core i7-3615QM                 | IvyBridge          | AVX                   512bit | 256bit add + 256bit mul          |       1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |        1 |      (1) |     2 |        1 |        1 |      (1) |     2 |       -- |       -- |       -- |    -- | 
 +| Core i7-4790K                  | Haswell            | AVX2/FMA3             512bit | 256bit fma/add + 256bit fma/mul  |       1 |      2 |        2 |     2 |      -- |       -- |       -- |    -- |        1 |        2 |        2 |     2 |        1 |        2 |        2 |     2 |       -- |       -- |       -- |    -- | 
 +| Core i7-6700K                  | Skylake            | AVX2/FMA3             512bit | 256bit fma + 256bit fma          |       2 |      2 |        2 |     2 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     2 |        2 |        2 |        2 |     2 |       -- |       -- |       -- |    -- | 
 +| Core i7-1030NG7                | IceLake            | AVX512FVLBWDQ         512bit | 256bit fma + 256bit fma          |       2 |      2 |        2 |     2 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     2 |        2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 | 
 +| Athlon 5350                    | Jaguar             | AVX                   256bit | 128bit add + 128bit mul          |       1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |        1 |      (1) |     2 |      0.5 |      0.5 |    (0.5) |   0.5 |       -- |       -- |       -- |    -- | 
 +| A10-7870K                      | Steamroller        | AVX/FMA3            |   256bit | 128bit fma + 128bit fma          |       2 |      2 |        2 |     2 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- | 
 +| Ryzen 7 1800X                  | Zen                | AVX2/FMA3             512bit | 128bit add x2 + 128bit mul x2    |       2 |      2 |        2 |     3 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     3 |        1 |        1 |        1 |     2 |       -- |       -- |       -- |    -- | 
 +| Ryzen 5 3400G                  | Zen+ APU           | AVX2/FMA3             512bit | 128bit add x2 + 128bit mul x2    |       2 |      2 |        2 |     3 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     3 |        1 |        1 |        1 |     2 |       -- |       -- |       -- |    -- | 
 +| Ryzen 7 PRO 4750G              | Zen2 APU           | AVX2/FMA3            1024bit | 256bit add x2 + 256bit mul x2    |       2 |      2 |        2 |     4 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     4 |        2 |        2 |        2 |     4 |       -- |       -- |       -- |    -- | 
 +| Ryzen 9 3950X                  | Zen2               | AVX2/FMA3            1024bit | 256bit add x2 + 256bit mul x2    |       2 |      2 |        2 |     4 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     4 |        2 |        2 |        2 |     4 |       -- |       -- |       -- |    -- | 
 + 
 + 
 + 
 + 
 +^ float 64bit                                                                                                         ^^^^^ Scalar (64bit)                   ^^^^ SIMD 2 (128bit)                    ^^^^ SIMD 4 (256bit)                     ^^^^ SIMD 8 (512bit)                     ^^^^ 
 +^ CPU/SoC                        ^ CPU core           ^ FPU                 ^ SIMD Width                                 ^^ add     ^ mul    ^ mad/fma  ^ total ^ add     ^ mul      ^ mad/fma  ^ total ^ add      ^ mul      ^ mad/fma  ^ total ^ add      ^ mul      ^ mad/fma  ^ total ^ 
 +| BCM2835                        | ARM1176JZF-S       | VFPv2                  64bit | 64bit mad                        |     0.5 |    0.5 |      0.5 |   0.5 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| S5PC100                        | Cortex-A8          | VFPv3 NEON          |   128bit | 128bit mad                           0.1 |    0.1 |      0.1 |   0.1 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| BCM2836                        | Cortex-A7          | VFPv4 NEON          |    32bit | 32bit fma                        |       1 |    0.2 |      0.2 |   0.2 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple S1                       | Cortex-A7          | VFPv4 NEON          |    32bit | 32bit fma                        |       1 |    0.2 |      0.2 |   0.2 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple S2                       | Cortex-A7          | VFPv4 NEON          |    32bit | 32bit fma                        |       1 |    0.2 |      0.2 |   0.2 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Tegra 2                        | Cortex-A9          | VFPv3                  64bit | 64bit mad                        |       1 |    0.5 |      0.5 |   0.5 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A5                       | Cortex-A9          | VFPv3 NEON          |   128bit | 128bit mad                             1 |    0.5 |      0.5 |   0.5 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Tegra 4                        | Cortex-A15         | VFPv4 NEON          |   128bit | 64bit fma x2                           1 |      1 |        1 |     1 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| BCM2837                        | Cortex-A53         | AArch64 ASIMD         128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon 845                 | (Cortex-A55)       | AArch64 ASIMD FP16  |   128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Tegra X1                       | Cortex-A57         | AArch64 ASIMD         128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| BCM2711                        | Cortex-A72         | AArch64 ASIMD         128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon 835                 | (Cortex-A73)       | AArch64 ASIMD         128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon 845                 | (Cortex-A75)       | AArch64 ASIMD FP16  |   128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A6                       | Swift              | VFPv4 NEON          |   128bit | 128bit fma                             1 |      1 |        1 |     1 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A7                       | Cyclone            | AArch64 ASIMD         384bit | 128bit add + 128bit fma x2             3 |      2 |        2 |     3 |       3 |        2 |        2 |     3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A8                       | Typhoon            | AArch64 ASIMD         384bit | 128bit add + 128bit fma x2             3 |      2 |        2 |     3 |       3 |        2 |        2 |     3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A9                       | Twister            | AArch64 ASIMD         384bit | 128bit fma x3                    |       3 |      2 |        2 |     3 |       3 |        2 |        2 |     3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A10                      | Hurricane          | AArch64 ASIMD         384bit | 128bit fma x3                    |       3 |      3 |        3 |     3 |       3 |        3 |        3 |     3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A11                      | Monsoon            | AArch64 ASIMD         384bit | 128bit fma x3                    |       3 |      3 |        3 |     3 |       3 |        3 |        3 |     3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple M1                       | Firestorm          | AArch64 ASIMD FP16  |   512bit | 128bit add/mul + 128bit fma x3         4 |      4 |        3 |     4 |       4 |        4 |        3 |     4 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple S6                       | Icestorm?          | AArch64 ASIMD FP16  |   256bit | 128bit add + 128bit fma          |       2 |      1 |        1 |     2 |       2 |        1 |        1 |     2 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Tegra K1                       | Denver             | AArch64 ASIMD         256bit | 128bit add + 128bit fma          |       2 |      1 |        1 |     2 |       2 |        1 |        1 |     2 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon MSM8250             | Scorpion           | VFPv3 NEON          |   128bit | 128bit mad                             1 |      1 |        1 |     1 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon S4 Pro MSM8264      | Krait              | VFPv4 NEON          |   128bit | 128bit fma                             1 |      1 |        1 |     1 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon 820                 | Kryo               | AArch64 ASIMD         256bit | 128bit add + 128bit fma          |       2 |      1 |        1 |     2 |       2 |        1 |        1 |     2 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Atom Z2560                     | Saltwell           | SSSE3                 192bit | 128bit add + 64bit mul                 1 |    0.5 |    (0.7) |   0.7 |     0.5 |     0.25 |    (0.3) |   0.3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Celeron J1900                  | SIlvermont         | SSE4.2              |   192bit | 128bit add + 64bit mul                 1 |    0.5 |    (0.7) |   0.7 |     0.5 |     0.25 |    (0.3) |   0.3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Atom x7-Z8700                  | Airmont            | SSE4.2              |   192bit | 128bit add + 64bit mul                 1 |    0.5 |    (0.7) |   0.7 |     0.5 |     0.25 |    (0.3) |   0.3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Core 2                         | Penryn             | SSE4.1              |   256bit | 128bit add + 128bit mul          |       1 |      1 |      (1) |     2 |       1 |        1 |      (1) |     2 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Core i7-2700                   | SandyBridge        | AVX                   512bit | 256bit add + 256bit mul          |       1 |      1 |      (1) |     2 |       1 |        1 |      (1) |     2 |        1 |        1 |      (1) |     2 |       -- |       -- |       -- |    -- | 
 +| Core i7-3615QM                 | IvyBridge          | AVX                   512bit | 256bit add + 256bit mul          |       1 |      1 |      (1) |     2 |       1 |        1 |      (1) |     2 |        1 |        1 |      (1) |     2 |       -- |       -- |       -- |    -- | 
 +| Core i7-4790K                  | Haswell            | AVX2/FMA3             512bit | 256bit fma/add + 256bit fma/mul  |       1 |      2 |        2 |     2 |       1 |        2 |        2 |     2 |        1 |        2 |        2 |     2 |       -- |       -- |       -- |    -- | 
 +| Core i7-6700K                  | Skylake            | AVX2/FMA3             512bit | 256bit fma + 256bit fma          |       2 |      2 |        2 |     2 |       2 |        2 |        2 |     2 |        2 |        2 |        2 |     2 |       -- |       -- |       -- |    -- | 
 +| Core i7-1030NG7                | IceLake            | AVX512FVLBWDQ         512bit | 256bit fma + 256bit fma          |       2 |      2 |        2 |     2 |       2 |        2 |        2 |     2 |        2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 | 
 +| Athlon 5350                    | Jaguar             | AVX                   256bit | 128bit add + 128bit mul          |       1 |      1 |      (1) |     2 |       1 |        1 |      (1) |     2 |      0.5 |      0.5 |    (0.5) |   0.5 |       -- |       -- |       -- |    -- | 
 +| A10-7870K                      | Steamroller        | AVX/FMA3            |   256bit | 128bit fma + 128bit fma          |       2 |      2 |        2 |     2 |       2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- | 
 +| Ryzen 7 1800X                  | Zen                | AVX2/FMA3             512bit | 128bit add x2 + 128bit mul x2    |       2 |      2 |        2 |     3 |       2 |        2 |        2 |     3 |        1 |        1 |        1 |     2 |       -- |       -- |       -- |    -- | 
 +| Ryzen 5 3400G                  | Zen+ APU           | AVX2/FMA3             512bit | 128bit add x2 + 128bit mul x2    |       2 |      2 |        2 |     3 |       2 |        2 |        2 |     3 |        1 |        1 |        1 |     2 |       -- |       -- |       -- |    -- | 
 +| Ryzen 7 PRO 4750G              | Zen2 APU           | AVX2/FMA3            1024bit | 256bit add x2 + 256bit mul x2    |       2 |      2 |        2 |     4 |       2 |        2 |        2 |     4 |        2 |        2 |        2 |     4 |       -- |       -- |       -- |    -- | 
 +| Ryzen 9 3950X                  | Zen2               | AVX2/FMA3            1024bit | 256bit add x2 + 256bit mul x2    |       2 |      2 |        2 |     4 |       2 |        2 |        2 |     4 |        2 |        2 |        2 |     4 |       -- |       -- |       -- |    -- | 
 + 
 + 
 +  * mad/fma カッコ付き表記は積和命令を持っていない代わりに add + mul の 2 命令を実行したときの値です。 
 +  * total = 同時に実行できる命令数の最大値 
 + 
 + 
 + 
 +---- 
 +===== FOP ===== 
 + 
 +==== Scalar ==== 
 + 
 +  * 注意: この数値は実行可能な命令数 (IPC) ではなく FLOPS の算出に用いる 1 cycle で実行可能な浮動小数点演算数 (FOP) です。例えば fma の値に CPU clock を乗算すると FLOPS が求まります。 
  
 ^ Scalar                                ^^ single float (32bit x1)    ^^^^ double float (64bit x1)    ^^^^    ^ ^ Scalar                                ^^ single float (32bit x1)    ^^^^ double float (64bit x1)    ^^^^    ^
行 51: 行 157:
  
  
-===== SIMD sp =====+==== SIMD sp ==== 
 + 
 +  * 注意: この数値は実行可能な命令数 (IPC) ではなく FLOPS の算出に用いる 1 cycle で実行可能な浮動小数点演算数 (FOP) です。例えば fma の値に CPU clock を乗算すると FLOPS が求まります。 
 + 
  
 ^ SIMD (Vector) sp                      ^^ SIMD2 single fp (32bit x2) ^^^^ SIMD4 single fp (32bit x4) ^^^^ SIMD8 single fp (32bit x8) ^^^^ ^ SIMD (Vector) sp                      ^^ SIMD2 single fp (32bit x2) ^^^^ SIMD4 single fp (32bit x4) ^^^^ SIMD8 single fp (32bit x8) ^^^^
行 90: 行 200:
  
  
-===== SIMD dp =====+==== SIMD dp ==== 
 + 
 +  * 注意: この数値は実行可能な命令数 (IPC) ではなく FLOPS の算出に用いる 1 cycle で実行可能な浮動小数点演算数 (FOP) です。例えば fma の値に CPU clock を乗算すると FLOPS が求まります。 
  
 ^ SIMD (Vector) dp                      ^^ SIMD2 double fp (64bit x2) ^^^^ SIMD4 double fp (64bit x4) ^^^^ ^ SIMD (Vector) dp                      ^^ SIMD2 double fp (64bit x2) ^^^^ SIMD4 double fp (64bit x4) ^^^^
opengl/cpufop.1528462618.txt.gz · 最終更新: 2018/06/08 21:56 by oga