ユーザ用ツール

サイト用ツール


opengl:cpufop

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
opengl:cpufop [2016/06/11 20:18] – [SIMD sp] ogaopengl:cpufop [2020/12/31 14:09] (現在) – [IPC] oga
行 8: 行 8:
  
  
-===== Scalar =====+ 
 +===== IPC ====== 
 + 
 +^ float 32bit                                                                                                         ^^^^^ Scalar (32bit)                   ^^^^ SIMD 2 (64bit)                     ^^^^ SIMD 4 (128bit)                     ^^^^ SIMD 8 (256bit)                     ^^^^ SIMD 16 (512bit)                    ^^^^ 
 +^ CPU/SoC                        ^ CPU core           ^ FPU                 ^ SIMD Width                                 ^^ add     ^ mul    ^ mad/fma  ^ total ^ add     ^ mul      ^ mad/fma  ^ total ^ add      ^ mul      ^ mad/fma  ^ total ^ add      ^ mul      ^ mad/fma  ^ total ^ add      ^ mul      ^ mad/fma  ^ total ^ 
 +| BCM2835                        | ARM1176JZF-S       | VFPv2                  64bit | 64bit mad                        |     0.5 |    0.5 |      0.5 |   0.5 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| S5PC100                        | Cortex-A8          | VFPv3 NEON          |   128bit | 128bit mad                           0.1 |    0.1 |      0.1 |   0.1 |       1 |        1 |        1 |     1 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| BCM2836                        | Cortex-A7          | VFPv4 NEON          |    32bit | 32bit fma                        |       1 |      1 |        1 |     1 |     0.5 |      0.5 |      0.5 |   0.5 |     0.25 |     0.25 |     0.25 |  0.25 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple S1                       | Cortex-A7          | VFPv4 NEON          |    32bit | 32bit fma                        |       1 |      1 |        1 |     1 |     0.5 |      0.5 |      0.5 |   0.5 |     0.25 |     0.25 |     0.25 |  0.25 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple S2                       | Cortex-A7          | VFPv4 NEON          |    32bit | 32bit fma                        |       1 |      1 |        1 |     1 |     0.5 |      0.5 |      0.5 |   0.5 |     0.25 |     0.25 |     0.25 |  0.25 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Tegra 2                        | Cortex-A9          | VFPv3                  64bit | 64bit mad                        |       1 |      1 |        1 |     1 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A5                       | Cortex-A9          | VFPv3 NEON          |   128bit | 128bit mad                             1 |      1 |        1 |     1 |       1 |        1 |        1 |     1 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Tegra 4                        | Cortex-A15         | VFPv4 NEON          |   128bit | 64bit fma x2                           1 |      1 |        1 |     1 |       2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| BCM2837                        | Cortex-A53         | AArch64 ASIMD         128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon 845                 | (Cortex-A55)       | AArch64 ASIMD FP16  |   128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Tegra X1                       | Cortex-A57         | AArch64 ASIMD         128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| BCM2711                        | Cortex-A72         | AArch64 ASIMD         128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon 835                 | (Cortex-A73)       | AArch64 ASIMD         128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon 845                 | (Cortex-A75)       | AArch64 ASIMD FP16  |   128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A6                       | Swift              | VFPv4 NEON          |   128bit | 128bit fma                             1 |      1 |        1 |     1 |       1 |        1 |        1 |     1 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A7                       | Cyclone            | AArch64 ASIMD         384bit | 128bit add + 128bit fma x2             3 |      2 |        2 |     3 |       3 |        2 |        2 |     3 |        3 |        2 |        2 |     3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A8                       | Typhoon            | AArch64 ASIMD         384bit | 128bit add + 128bit fma x2             3 |      2 |        2 |     3 |       3 |        2 |        2 |     3 |        3 |        2 |        2 |     3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A9                       | Twister            | AArch64 ASIMD         384bit | 128bit fma x3                    |       3 |      3 |        3 |     3 |       3 |        3 |        3 |     3 |        3 |        3 |        3 |     3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A10                      | Hurricane          | AArch64 ASIMD         384bit | 128bit fma x3                    |       3 |      3 |        3 |     3 |       3 |        3 |        3 |     3 |        3 |        3 |        3 |     3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A11                      | Monsoon            | AArch64 ASIMD         384bit | 128bit fma x3                    |       3 |      3 |        3 |     3 |       3 |        3 |        3 |     3 |        3 |        3 |        3 |     3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple M1                       | Firestorm          | AArch64 ASIMD FP16  |   512bit | 128bit add/mul + 128bit fma x3         4 |      4 |        3 |     4 |       4 |        4 |        3 |     4 |        4 |        4 |        3 |     4 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple S6                       | Icestorm?          | AArch64 ASIMD FP16  |   256bit | 128bit add + 128bit fma          |       2 |      1 |        1 |     2 |       2 |        1 |        1 |     2 |        2 |        1 |        1 |     2 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Tegra K1                       | Denver             | AArch64 ASIMD         256bit | 128bit add + 128bit fma          |       2 |      1 |        1 |     2 |       2 |        1 |        1 |     2 |        2 |        1 |        1 |     2 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon MSM8250             | Scorpion           | VFPv3 NEON          |   128bit | 128bit mad                             1 |      1 |        1 |     1 |       1 |        1 |        1 |     1 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon S4 Pro MSM8264      | Krait              | VFPv4 NEON          |   128bit | 128bit fma                             1 |      1 |        1 |     1 |       1 |        1 |        1 |     1 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon 820                 | Kryo               | AArch64 ASIMD         256bit | 128bit add + 128bit fma          |       2 |      1 |        1 |     2 |       2 |        1 |        1 |     2 |        2 |        1 |        1 |     2 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Atom Z2560                     | Saltwell           | SSSE3                 192bit | 128bit add + 64bit mul                 1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |      0.5 |    (0.7) |   0.7 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Celeron J1900                  | SIlvermont         | SSE4.2              |   192bit | 128bit add + 64bit mul                 1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |      0.5 |    (0.7) |   0.7 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Atom x7-Z8700                  | Airmont            | SSE4.2              |   192bit | 128bit add + 64bit mul                 1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |      0.5 |    (0.7) |   0.7 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Core 2                         | Penryn             | SSE4.1              |   256bit | 128bit add + 128bit mul          |       1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |        1 |      (1) |     2 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Core i7-2700                   | SandyBridge        | AVX                   512bit | 256bit add + 256bit mul          |       1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |        1 |      (1) |     2 |        1 |        1 |      (1) |     2 |       -- |       -- |       -- |    -- | 
 +| Core i7-3615QM                 | IvyBridge          | AVX                   512bit | 256bit add + 256bit mul          |       1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |        1 |      (1) |     2 |        1 |        1 |      (1) |     2 |       -- |       -- |       -- |    -- | 
 +| Core i7-4790K                  | Haswell            | AVX2/FMA3             512bit | 256bit fma/add + 256bit fma/mul  |       1 |      2 |        2 |     2 |      -- |       -- |       -- |    -- |        1 |        2 |        2 |     2 |        1 |        2 |        2 |     2 |       -- |       -- |       -- |    -- | 
 +| Core i7-6700K                  | Skylake            | AVX2/FMA3             512bit | 256bit fma + 256bit fma          |       2 |      2 |        2 |     2 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     2 |        2 |        2 |        2 |     2 |       -- |       -- |       -- |    -- | 
 +| Core i7-1030NG7                | IceLake            | AVX512FVLBWDQ         512bit | 256bit fma + 256bit fma          |       2 |      2 |        2 |     2 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     2 |        2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 | 
 +| Athlon 5350                    | Jaguar             | AVX                   256bit | 128bit add + 128bit mul          |       1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |        1 |      (1) |     2 |      0.5 |      0.5 |    (0.5) |   0.5 |       -- |       -- |       -- |    -- | 
 +| A10-7870K                      | Steamroller        | AVX/FMA3            |   256bit | 128bit fma + 128bit fma          |       2 |      2 |        2 |     2 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- | 
 +| Ryzen 7 1800X                  | Zen                | AVX2/FMA3             512bit | 128bit add x2 + 128bit mul x2    |       2 |      2 |        2 |     3 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     3 |        1 |        1 |        1 |     2 |       -- |       -- |       -- |    -- | 
 +| Ryzen 5 3400G                  | Zen+ APU           | AVX2/FMA3             512bit | 128bit add x2 + 128bit mul x2    |       2 |      2 |        2 |     3 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     3 |        1 |        1 |        1 |     2 |       -- |       -- |       -- |    -- | 
 +| Ryzen 7 PRO 4750G              | Zen2 APU           | AVX2/FMA3            1024bit | 256bit add x2 + 256bit mul x2    |       2 |      2 |        2 |     4 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     4 |        2 |        2 |        2 |     4 |       -- |       -- |       -- |    -- | 
 +| Ryzen 9 3950X                  | Zen2               | AVX2/FMA3            1024bit | 256bit add x2 + 256bit mul x2    |       2 |      2 |        2 |     4 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     4 |        2 |        2 |        2 |     4 |       -- |       -- |       -- |    -- | 
 + 
 + 
 + 
 + 
 +^ float 64bit                                                                                                         ^^^^^ Scalar (64bit)                   ^^^^ SIMD 2 (128bit)                    ^^^^ SIMD 4 (256bit)                     ^^^^ SIMD 8 (512bit)                     ^^^^ 
 +^ CPU/SoC                        ^ CPU core           ^ FPU                 ^ SIMD Width                                 ^^ add     ^ mul    ^ mad/fma  ^ total ^ add     ^ mul      ^ mad/fma  ^ total ^ add      ^ mul      ^ mad/fma  ^ total ^ add      ^ mul      ^ mad/fma  ^ total ^ 
 +| BCM2835                        | ARM1176JZF-S       | VFPv2                  64bit | 64bit mad                        |     0.5 |    0.5 |      0.5 |   0.5 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| S5PC100                        | Cortex-A8          | VFPv3 NEON          |   128bit | 128bit mad                           0.1 |    0.1 |      0.1 |   0.1 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| BCM2836                        | Cortex-A7          | VFPv4 NEON          |    32bit | 32bit fma                        |       1 |    0.2 |      0.2 |   0.2 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple S1                       | Cortex-A7          | VFPv4 NEON          |    32bit | 32bit fma                        |       1 |    0.2 |      0.2 |   0.2 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple S2                       | Cortex-A7          | VFPv4 NEON          |    32bit | 32bit fma                        |       1 |    0.2 |      0.2 |   0.2 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Tegra 2                        | Cortex-A9          | VFPv3                  64bit | 64bit mad                        |       1 |    0.5 |      0.5 |   0.5 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A5                       | Cortex-A9          | VFPv3 NEON          |   128bit | 128bit mad                             1 |    0.5 |      0.5 |   0.5 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Tegra 4                        | Cortex-A15         | VFPv4 NEON          |   128bit | 64bit fma x2                           1 |      1 |        1 |     1 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| BCM2837                        | Cortex-A53         | AArch64 ASIMD         128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon 845                 | (Cortex-A55)       | AArch64 ASIMD FP16  |   128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Tegra X1                       | Cortex-A57         | AArch64 ASIMD         128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| BCM2711                        | Cortex-A72         | AArch64 ASIMD         128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon 835                 | (Cortex-A73)       | AArch64 ASIMD         128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon 845                 | (Cortex-A75)       | AArch64 ASIMD FP16  |   128bit | 64bit fma x2                           2 |      2 |        2 |     2 |       1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A6                       | Swift              | VFPv4 NEON          |   128bit | 128bit fma                             1 |      1 |        1 |     1 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A7                       | Cyclone            | AArch64 ASIMD         384bit | 128bit add + 128bit fma x2             3 |      2 |        2 |     3 |       3 |        2 |        2 |     3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A8                       | Typhoon            | AArch64 ASIMD         384bit | 128bit add + 128bit fma x2             3 |      2 |        2 |     3 |       3 |        2 |        2 |     3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A9                       | Twister            | AArch64 ASIMD         384bit | 128bit fma x3                    |       3 |      2 |        2 |     3 |       3 |        2 |        2 |     3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A10                      | Hurricane          | AArch64 ASIMD         384bit | 128bit fma x3                    |       3 |      3 |        3 |     3 |       3 |        3 |        3 |     3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple A11                      | Monsoon            | AArch64 ASIMD         384bit | 128bit fma x3                    |       3 |      3 |        3 |     3 |       3 |        3 |        3 |     3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple M1                       | Firestorm          | AArch64 ASIMD FP16  |   512bit | 128bit add/mul + 128bit fma x3         4 |      4 |        3 |     4 |       4 |        4 |        3 |     4 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Apple S6                       | Icestorm?          | AArch64 ASIMD FP16  |   256bit | 128bit add + 128bit fma          |       2 |      1 |        1 |     2 |       2 |        1 |        1 |     2 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Tegra K1                       | Denver             | AArch64 ASIMD         256bit | 128bit add + 128bit fma          |       2 |      1 |        1 |     2 |       2 |        1 |        1 |     2 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon MSM8250             | Scorpion           | VFPv3 NEON          |   128bit | 128bit mad                             1 |      1 |        1 |     1 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon S4 Pro MSM8264      | Krait              | VFPv4 NEON          |   128bit | 128bit fma                             1 |      1 |        1 |     1 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Snapdragon 820                 | Kryo               | AArch64 ASIMD         256bit | 128bit add + 128bit fma          |       2 |      1 |        1 |     2 |       2 |        1 |        1 |     2 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Atom Z2560                     | Saltwell           | SSSE3                 192bit | 128bit add + 64bit mul                 1 |    0.5 |    (0.7) |   0.7 |     0.5 |     0.25 |    (0.3) |   0.3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Celeron J1900                  | SIlvermont         | SSE4.2              |   192bit | 128bit add + 64bit mul                 1 |    0.5 |    (0.7) |   0.7 |     0.5 |     0.25 |    (0.3) |   0.3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Atom x7-Z8700                  | Airmont            | SSE4.2              |   192bit | 128bit add + 64bit mul                 1 |    0.5 |    (0.7) |   0.7 |     0.5 |     0.25 |    (0.3) |   0.3 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Core 2                         | Penryn             | SSE4.1              |   256bit | 128bit add + 128bit mul          |       1 |      1 |      (1) |     2 |       1 |        1 |      (1) |     2 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | 
 +| Core i7-2700                   | SandyBridge        | AVX                   512bit | 256bit add + 256bit mul          |       1 |      1 |      (1) |     2 |       1 |        1 |      (1) |     2 |        1 |        1 |      (1) |     2 |       -- |       -- |       -- |    -- | 
 +| Core i7-3615QM                 | IvyBridge          | AVX                   512bit | 256bit add + 256bit mul          |       1 |      1 |      (1) |     2 |       1 |        1 |      (1) |     2 |        1 |        1 |      (1) |     2 |       -- |       -- |       -- |    -- | 
 +| Core i7-4790K                  | Haswell            | AVX2/FMA3             512bit | 256bit fma/add + 256bit fma/mul  |       1 |      2 |        2 |     2 |       1 |        2 |        2 |     2 |        1 |        2 |        2 |     2 |       -- |       -- |       -- |    -- | 
 +| Core i7-6700K                  | Skylake            | AVX2/FMA3             512bit | 256bit fma + 256bit fma          |       2 |      2 |        2 |     2 |       2 |        2 |        2 |     2 |        2 |        2 |        2 |     2 |       -- |       -- |       -- |    -- | 
 +| Core i7-1030NG7                | IceLake            | AVX512FVLBWDQ         512bit | 256bit fma + 256bit fma          |       2 |      2 |        2 |     2 |       2 |        2 |        2 |     2 |        2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 | 
 +| Athlon 5350                    | Jaguar             | AVX                   256bit | 128bit add + 128bit mul          |       1 |      1 |      (1) |     2 |       1 |        1 |      (1) |     2 |      0.5 |      0.5 |    (0.5) |   0.5 |       -- |       -- |       -- |    -- | 
 +| A10-7870K                      | Steamroller        | AVX/FMA3            |   256bit | 128bit fma + 128bit fma          |       2 |      2 |        2 |     2 |       2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- | 
 +| Ryzen 7 1800X                  | Zen                | AVX2/FMA3             512bit | 128bit add x2 + 128bit mul x2    |       2 |      2 |        2 |     3 |       2 |        2 |        2 |     3 |        1 |        1 |        1 |     2 |       -- |       -- |       -- |    -- | 
 +| Ryzen 5 3400G                  | Zen+ APU           | AVX2/FMA3             512bit | 128bit add x2 + 128bit mul x2    |       2 |      2 |        2 |     3 |       2 |        2 |        2 |     3 |        1 |        1 |        1 |     2 |       -- |       -- |       -- |    -- | 
 +| Ryzen 7 PRO 4750G              | Zen2 APU           | AVX2/FMA3            1024bit | 256bit add x2 + 256bit mul x2    |       2 |      2 |        2 |     4 |       2 |        2 |        2 |     4 |        2 |        2 |        2 |     4 |       -- |       -- |       -- |    -- | 
 +| Ryzen 9 3950X                  | Zen2               | AVX2/FMA3            1024bit | 256bit add x2 + 256bit mul x2    |       2 |      2 |        2 |     4 |       2 |        2 |        2 |     4 |        2 |        2 |        2 |     4 |       -- |       -- |       -- |    -- | 
 + 
 + 
 +  * mad/fma カッコ付き表記は積和命令を持っていない代わりに add + mul の 2 命令を実行したときの値です。 
 +  * total = 同時に実行できる命令数の最大値 
 + 
 + 
 + 
 +---- 
 +===== FOP ===== 
 + 
 +==== Scalar ==== 
 + 
 +  * 注意: この数値は実行可能な命令数 (IPC) ではなく FLOPS の算出に用いる 1 cycle で実行可能な浮動小数点演算数 (FOP) です。例えば fma の値に CPU clock を乗算すると FLOPS が求まります。 
  
 ^ Scalar                                ^^ single float (32bit x1)    ^^^^ double float (64bit x1)    ^^^^    ^ ^ Scalar                                ^^ single float (32bit x1)    ^^^^ double float (64bit x1)    ^^^^    ^
行 23: 行 129:
 | Scorpion            | VFPv3 + NEON         1 |     1 |     2 |    -- |   0.5 |     1 |     1 |    -- | Nexus One           | | Scorpion            | VFPv3 + NEON         1 |     1 |     2 |    -- |   0.5 |     1 |     1 |    -- | Nexus One           |
 | Krait (400)         | VFPv4 + NEON         1 |     1 |     2 |     2 |     1 |     1 |   1.6 |     2 | Nexus 4/5, Nexus 7 (2013)    | | Krait (400)         | VFPv4 + NEON         1 |     1 |     2 |     2 |     1 |     1 |   1.6 |     2 | Nexus 4/5, Nexus 7 (2013)    |
-Kyro 64             | AArch64 NEON         1 |     2 |     - |     |     1 |     2 |    -- |     | HTC 10      |+Kryo 64             | AArch64 NEON         1 |     2 |     - |     |     1 |     2 |    -- |     | HTC 10      |
 | A6 Swift            | VFPv4 + NEON         1 |     1 |     1 |     1 |     1 |     1 |     1 |     1 | iPhone 5, iPad 4     | | A6 Swift            | VFPv4 + NEON         1 |     1 |     1 |     1 |     1 |     1 |     1 |     1 | iPhone 5, iPad 4     |
 | A7 Cyclone 32       | AArch32 NEON         1 |     1 |     2 |     2 |     2 |     3 |     3 |     3 | iPhone 5s, iPad Air  | | A7 Cyclone 32       | AArch32 NEON         1 |     1 |     2 |     2 |     2 |     3 |     3 |     3 | iPhone 5s, iPad Air  |
行 36: 行 142:
 | Core i7 Sandy 64    | SSE4.2/AVX           1 |     1 |   (2) |    -- |     1 |     1 |   (2) |    -- |   | | Core i7 Sandy 64    | SSE4.2/AVX           1 |     1 |   (2) |    -- |     1 |     1 |   (2) |    -- |   |
 | Core i7 Ivy  64     | SSE4.2/AVX           1 |     1 |   (2) |    -- |     1 |     1 |   (2) |    -- |   | | Core i7 Ivy  64     | SSE4.2/AVX           1 |     1 |   (2) |    -- |     1 |     1 |   (2) |    -- |   |
-| Core i7 Haswell 64  | SSE4.2/AVX2/FMA3 |     2 |     1 |   (2    4 |     |     1 |   (2) |     | Core i7-4790K +| Core i7 Haswell 64  | SSE4.2/AVX2/FMA3 |   1.6 |     |    -- |   3.2 |   1.6 |     |    -- |   3.2 | Core i7-4790K 
-| Celeron Haswell 64  | SSE4.2               2 |     1 |   (2) |    -- |     2 |     |   (2|    -- | Celeron 2955U  |+| Celeron Haswell 64  | SSE4.2             1.6 |     |  (1.6) |   -- |   1.6 |     1 |  (1.6|   -- | Celeron 2955U  | 
 +| Core i7 Skylake 64  | SSE4.2/AVX2/FMA3 |     2 |     |    -- |     |     2 |     2 |    -- |     4 | Core i7-6700K 
 +| Ryzen 7 1800X 64    | SSE4.2/AVX2/FMA3 |     2 |     2 |    -- |   3.2 |     2 |     2 |    -- |   3.2 | Ryzen 7 1800X  |
  
  
行 49: 行 157:
  
  
-===== SIMD sp =====+==== SIMD sp ==== 
 + 
 +  * 注意: この数値は実行可能な命令数 (IPC) ではなく FLOPS の算出に用いる 1 cycle で実行可能な浮動小数点演算数 (FOP) です。例えば fma の値に CPU clock を乗算すると FLOPS が求まります。 
 + 
  
 ^ SIMD (Vector) sp                      ^^ SIMD2 single fp (32bit x2) ^^^^ SIMD4 single fp (32bit x4) ^^^^ SIMD8 single fp (32bit x8) ^^^^ ^ SIMD (Vector) sp                      ^^ SIMD2 single fp (32bit x2) ^^^^ SIMD4 single fp (32bit x4) ^^^^ SIMD8 single fp (32bit x8) ^^^^
行 62: 行 174:
 | Scorpion            | VFPv3 + NEON         2 |     2 |     4 |    -- |     4 |     4 |     8 |    -- |    -- |    -- |    -- |    -- | | Scorpion            | VFPv3 + NEON         2 |     2 |     4 |    -- |     4 |     4 |     8 |    -- |    -- |    -- |    -- |    -- |
 | Krait 400           | VFPv4 + NEON         2 |     2 |     4 |     4 |     4 |     4 |     8 |     8 |    -- |    -- |    -- |    -- | | Krait 400           | VFPv4 + NEON         2 |     2 |     4 |     4 |     4 |     4 |     8 |     8 |    -- |    -- |    -- |    -- |
-| Kyro                | AArch64 NEON         |     |    -- |       0.5 |     |    -- |   0.5 |    -- |    -- |    -- |    -- |+| Kyro                | AArch64 NEON         |     |    -- |         2 |     |    -- |     4 |    -- |    -- |    -- |    -- |
 | A6 Swift            | VFPv4 + NEON         2 |     2 |     4 |     4 |     4 |     4 |     8 |     8 |    -- |    -- |    -- |    -- | | A6 Swift            | VFPv4 + NEON         2 |     2 |     4 |     4 |     4 |     4 |     8 |     8 |    -- |    -- |    -- |    -- |
 | A7 Cyclone 32       | AArch32 NEON         4 |     6 |     8 |     8 |     8 |    12 |    16 |    16 |    -- |    -- |    -- |    -- | | A7 Cyclone 32       | AArch32 NEON         4 |     6 |     8 |     8 |     8 |    12 |    16 |    16 |    -- |    -- |    -- |    -- |
行 77: 行 189:
 | Core i7 Haswell 64  | SSE4.2/AVX2/FMA3 |    -- |    -- |    -- |    -- |     8 |     4 |   (8) |    16 |    16 |     8 |  (16) |    32 | | Core i7 Haswell 64  | SSE4.2/AVX2/FMA3 |    -- |    -- |    -- |    -- |     8 |     4 |   (8) |    16 |    16 |     8 |  (16) |    32 |
 | Celeron Haswell 64  | SSE4.2              -- |    -- |    -- |    -- |     8 |     4 |   (8) |    -- |    -- |    -- |    -- |    -- | | Celeron Haswell 64  | SSE4.2              -- |    -- |    -- |    -- |     8 |     4 |   (8) |    -- |    -- |    -- |    -- |    -- |
 +| Core i7 Skylake 64  | SSE4.2/AVX2/FMA3 |    -- |    -- |    -- |    -- |     8 |     8 |   (8) |    16 |    16 |    16 |  (16) |    32 |
 +| Ryzen 7 1800X 64    | SSE4.2/AVX2/FMA3 |    -- |    -- |    -- |    -- |     8 |     8 |  (12) |    12 |     8 |     8 |  (16) |    16 |
  
  
行 86: 行 200:
  
  
-===== SIMD dp =====+==== SIMD dp ==== 
 + 
 +  * 注意: この数値は実行可能な命令数 (IPC) ではなく FLOPS の算出に用いる 1 cycle で実行可能な浮動小数点演算数 (FOP) です。例えば fma の値に CPU clock を乗算すると FLOPS が求まります。 
  
 ^ SIMD (Vector) dp                      ^^ SIMD2 double fp (64bit x2) ^^^^ SIMD4 double fp (64bit x4) ^^^^ ^ SIMD (Vector) dp                      ^^ SIMD2 double fp (64bit x2) ^^^^ SIMD4 double fp (64bit x4) ^^^^
行 96: 行 213:
 | A8 Typhoon 64       | AArch64 NEON         4 |     6 |     -- |     8 |    -- |    -- |    -- |    -- | | A8 Typhoon 64       | AArch64 NEON         4 |     6 |     -- |     8 |    -- |    -- |    -- |    -- |
 | A9 Twister 64       | AArch64 NEON         4 |     6 |     -- |     8 |    -- |    -- |    -- |    -- | | A9 Twister 64       | AArch64 NEON         4 |     6 |     -- |     8 |    -- |    -- |    -- |    -- |
 +| Kyro 64             | AArch64 NEON         1 |     2 |     -- |     2 |    -- |    -- |    -- |    -- |
 | Denver 64           | AArch64 NEON         2 |     3 |     -- |     4 |    -- |    -- |    -- |    -- | | Denver 64           | AArch64 NEON         2 |     3 |     -- |     4 |    -- |    -- |    -- |    -- |
 | Atom Bonnell 32     | SSSE3            |   0.4 |   0.5 |     -- |    -- |    -- |    -- |    -- |    -- | | Atom Bonnell 32     | SSSE3            |   0.4 |   0.5 |     -- |    -- |    -- |    -- |    -- |    -- |
行 105: 行 223:
 | Core i7 Haswell 64  | SSE4.2/AVX2/FMA3 |     4 |     2 |    (4) |    8? |     8 |     4 |   (8) |   16? | | Core i7 Haswell 64  | SSE4.2/AVX2/FMA3 |     4 |     2 |    (4) |    8? |     8 |     4 |   (8) |   16? |
 | Celeron Haswell 64  | SSE4.2               4 |     2 |    (4) |    -- |    -- |    -- |    -- |    -- | | Celeron Haswell 64  | SSE4.2               4 |     2 |    (4) |    -- |    -- |    -- |    -- |    -- |
 +| Core i7 Skylake 64  | SSE4.2/AVX2/FMA3 |     4 |     4 |     -- |     8 |     8 |     8 |    -- |    16 |
 +| Ryzen 7 1800X 64    | SSE4.2/AVX2/FMA3 |     4 |     4 |     -- |   6.3 |     4 |     4 |   (8) |     8 |
  
  
opengl/cpufop.1465643919.txt.gz · 最終更新: 2016/06/11 20:18 by oga

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki