ユーザ用ツール

サイト用ツール


opengl:cpufop

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
次のリビジョン両方とも次のリビジョン
opengl:cpufop [2020/12/31 02:00] – [Scalar] ogaopengl:cpufop [2020/12/31 02:32] oga
行 12: 行 12:
  
  
-^ float 32bit                                                                                                         ^^^^^ Scalar                           ^^^^ SIMD 2                             ^^^^ SIMD 4                              ^^^^ SIMD 8                      ^^^^ SIMD 16                                     ^^^^+ 
 +^ float 32bit                                                                                                         ^^^^^ Scalar                           ^^^^ SIMD 2                             ^^^^ SIMD 4                              ^^^^ SIMD 8                              ^^^^ SIMD 16                             ^^^^
 ^ CPU/SoC                        ^ CPU core           ^ FPU                 ^ SIMD Width                                 ^^ add     ^ mul    ^ mad/fma  ^ total ^ add     ^ mul      ^ mad/fma  ^ total ^ add      ^ mul      ^ mad/fma  ^ total ^ add      ^ mul      ^ mad/fma  ^ total ^ add      ^ mul      ^ mad/fma  ^ total ^ ^ CPU/SoC                        ^ CPU core           ^ FPU                 ^ SIMD Width                                 ^^ add     ^ mul    ^ mad/fma  ^ total ^ add     ^ mul      ^ mad/fma  ^ total ^ add      ^ mul      ^ mad/fma  ^ total ^ add      ^ mul      ^ mad/fma  ^ total ^ add      ^ mul      ^ mad/fma  ^ total ^
 | BCM2835                        | ARM1176JZF-S       | VFPv2                  64bit | 64bit mad                        |     0.5 |    0.5 |      0.5 |     1 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | | BCM2835                        | ARM1176JZF-S       | VFPv2                  64bit | 64bit mad                        |     0.5 |    0.5 |      0.5 |     1 |      -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |
行 40: 行 41:
 | Snapdragon S4 Pro MSM8264      | Krait              | VFPv4 NEON          |   128bit | 128bit fma                             1 |      1 |        1 |     1 |       1 |        1 |        1 |     1 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | | Snapdragon S4 Pro MSM8264      | Krait              | VFPv4 NEON          |   128bit | 128bit fma                             1 |      1 |        1 |     1 |       1 |        1 |        1 |     1 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |
 | Snapdragon 820                 | Kryo               | AArch64 ASIMD         256bit | 128bit add + 128bit fma          |       2 |      1 |        1 |     2 |       2 |        1 |        1 |     2 |        2 |        1 |        1 |     2 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- | | Snapdragon 820                 | Kryo               | AArch64 ASIMD         256bit | 128bit add + 128bit fma          |       2 |      1 |        1 |     2 |       2 |        1 |        1 |     2 |        2 |        1 |        1 |     2 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |
 +| Atom Z2560                     | Saltwell           | SSSE3                 192bit | 128bit add + 64bit mul                 1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |      0.5 |   (0.75) |   1.5 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |
 +| Celeron J1900                  | SIlvermont         | SSE4.2              |   192bit | 128bit add + 64bit mul                 1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |      0.5 |   (0.75) |   1.5 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |
 +| Atom x7-Z8700                  | Airmont            | SSE4.2              |   192bit | 128bit add + 64bit mul                 1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |      0.5 |   (0.75) |   1.5 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |
 +| Core 2                         | Penryn             | SSE4.1              |   256bit | 128bit add + 128bit mul          |       1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |        1 |      (1) |     2 |       -- |       -- |       -- |    -- |       -- |       -- |       -- |    -- |
 +| Core i7-2700                   | SandyBridge        | AVX                   512bit | 256bit add + 256bit mul          |       1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |        1 |      (1) |     2 |        1 |        1 |      (1) |     2 |       -- |       -- |       -- |    -- |
 | Core i7-3615QM                 | IvyBridge          | AVX                   512bit | 256bit add + 256bit mul          |       1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |        1 |      (1) |     2 |        1 |        1 |      (1) |     2 |       -- |       -- |       -- |    -- | | Core i7-3615QM                 | IvyBridge          | AVX                   512bit | 256bit add + 256bit mul          |       1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |        1 |      (1) |     2 |        1 |        1 |      (1) |     2 |       -- |       -- |       -- |    -- |
 | Core i7-4790K                  | Haswell            | AVX2/FMA3             512bit | 256bit fma/add + 256bit fma/mul  |       1 |      2 |        2 |     2 |      -- |       -- |       -- |    -- |        1 |        2 |        2 |     2 |        1 |        2 |        2 |     2 |       -- |       -- |       -- |    -- | | Core i7-4790K                  | Haswell            | AVX2/FMA3             512bit | 256bit fma/add + 256bit fma/mul  |       1 |      2 |        2 |     2 |      -- |       -- |       -- |    -- |        1 |        2 |        2 |     2 |        1 |        2 |        2 |     2 |       -- |       -- |       -- |    -- |
 | Core i7-6700K                  | Skylake            | AVX2/FMA3             512bit | 256bit fma + 256bit fma          |       2 |      2 |        2 |     2 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     2 |        2 |        2 |        2 |     2 |       -- |       -- |       -- |    -- | | Core i7-6700K                  | Skylake            | AVX2/FMA3             512bit | 256bit fma + 256bit fma          |       2 |      2 |        2 |     2 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     2 |        2 |        2 |        2 |     2 |       -- |       -- |       -- |    -- |
 | Core i7-1030NG7                | IceLake            | AVX512FVLBWDQ         512bit | 256bit fma + 256bit fma          |       2 |      2 |        2 |     2 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     2 |        2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 | | Core i7-1030NG7                | IceLake            | AVX512FVLBWDQ         512bit | 256bit fma + 256bit fma          |       2 |      2 |        2 |     2 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     2 |        2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 |
 +| Athlon 5350                    | Jaguar             | AVX                   256bit | 128bit add + 128bit mul          |       1 |      1 |      (1) |     2 |      -- |       -- |       -- |    -- |        1 |        1 |      (1) |     2 |      0.5 |      0.5 |    (0.5) |   0.5 |       -- |       -- |       -- |    -- |
 +| A10-7870K                      | Steamroller        | AVX/FMA3            |   256bit | 128bit fma + 128bit fma          |       2 |      2 |        2 |     2 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     2 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |
 | Ryzen 7 1800X                  | Zen                | AVX2/FMA3             512bit | 128bit add x2 + 128bit mul x2    |       2 |      2 |        2 |     3 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     3 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- | | Ryzen 7 1800X                  | Zen                | AVX2/FMA3             512bit | 128bit add x2 + 128bit mul x2    |       2 |      2 |        2 |     3 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     3 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |
 | Ryzen 5 3400G                  | Zen+ APU           | AVX2/FMA3             512bit | 128bit add x2 + 128bit mul x2    |       2 |      2 |        2 |     3 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     3 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- | | Ryzen 5 3400G                  | Zen+ APU           | AVX2/FMA3             512bit | 128bit add x2 + 128bit mul x2    |       2 |      2 |        2 |     3 |      -- |       -- |       -- |    -- |        2 |        2 |        2 |     3 |        1 |        1 |        1 |     1 |       -- |       -- |       -- |    -- |
行 52: 行 60:
  
  
----- 
  
  
-===== Scalar =====+---- 
 +===== FOP ===== 
 + 
 +==== Scalar ====
  
   * 注意: この数値は実行可能な命令数 (IPC) ではなく FLOPS の算出に用いる 1 cycle で実行可能な浮動小数点演算数 (FOP) です。例えば fma の値に CPU clock を乗算すると FLOPS が求まります。   * 注意: この数値は実行可能な命令数 (IPC) ではなく FLOPS の算出に用いる 1 cycle で実行可能な浮動小数点演算数 (FOP) です。例えば fma の値に CPU clock を乗算すると FLOPS が求まります。
行 101: 行 111:
  
  
-===== SIMD sp =====+==== SIMD sp ====
  
   * 注意: この数値は実行可能な命令数 (IPC) ではなく FLOPS の算出に用いる 1 cycle で実行可能な浮動小数点演算数 (FOP) です。例えば fma の値に CPU clock を乗算すると FLOPS が求まります。   * 注意: この数値は実行可能な命令数 (IPC) ではなく FLOPS の算出に用いる 1 cycle で実行可能な浮動小数点演算数 (FOP) です。例えば fma の値に CPU clock を乗算すると FLOPS が求まります。
行 144: 行 154:
  
  
-===== SIMD dp =====+==== SIMD dp ====
  
   * 注意: この数値は実行可能な命令数 (IPC) ではなく FLOPS の算出に用いる 1 cycle で実行可能な浮動小数点演算数 (FOP) です。例えば fma の値に CPU clock を乗算すると FLOPS が求まります。   * 注意: この数値は実行可能な命令数 (IPC) ではなく FLOPS の算出に用いる 1 cycle で実行可能な浮動小数点演算数 (FOP) です。例えば fma の値に CPU clock を乗算すると FLOPS が求まります。
opengl/cpufop.txt · 最終更新: 2020/12/31 14:09 by oga

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki