ユーザ用ツール

サイト用ツール


opengl:vfpbenchlog

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
次のリビジョン両方とも次のリビジョン
opengl:vfpbenchlog [2019/06/16 01:04] – [Qualcomm Kryo 385 (Cortex-A55) (ARMv8.2A AArch64 arm64) FPU+ASIMD+HALFFP] ogaopengl:vfpbenchlog [2020/01/05 01:37] – [結果一覧] oga
行 12: 行 12:
  
 ^ Device                      ^ OS      ^ SoC                    ^ CPU                  ^ FPU              ^    ^ clock    ^Single-SP^Single-DP^ Multi-SP ^ Multi-DP ^ ^ Device                      ^ OS      ^ SoC                    ^ CPU                  ^ FPU              ^    ^ clock    ^Single-SP^Single-DP^ Multi-SP ^ Multi-DP ^
-| PC Intel Core i7-6700K      | Win10   Intel Core i7-6700K    Skylake       | x64    | SSE4.2/AVX2/FMA3 |  |   4.0GHz |  132.274 |  62.904  511.630 |  255.417 +| PC AMD Ryzen 9 3950X        | Win10   AMD Ryzen 9 3950X      Zen2          | x64    | SSE4.2/AVX2/FMA3 | 16 |   3.5GHz |  132.173 |  66.092 1904.671 |  949.919 
-| PC AMD Ryzen 7 1800X        | Win10   AMD Ryzen 7 1800X      Ryzen         | x64    | SSE4.2/AVX2/FMA3 |  |   3.6GHz |  58.991 |  29.264 |  473.954 |  239.370 +| PC Intel Core i7-6700K      | Win10   Intel Core i7-6700K    Skylake       | x64    | SSE4.2/AVX2/FMA3 |  |   4.0GHz |  135.577 |  67.698 |  542.267 |  271.127 
-| PC Intel Core i7-4790K      | Ubuntu  | Intel Core i7-4790K    | Haswell       | x64    | SSE4.2/AVX2/FMA3 |  4 |   4.0GHz |  85.112 |  31.917 |  510.509 |  128.452 |+| PC Intel Core i7-4790K      | Ubuntu  | Intel Core i7-4790K    | Haswell       | x64    | SSE4.2/AVX2/FMA3 |  4 |   4.0GHz |  140.339 |  46.722 |  537.865 |  268.264 | 
 +| PC AMD Ryzen 7 1800X        | Win10   | AMD Ryzen 7 1800X      | Zen           | x64    | SSE4.2/AVX2/FMA3 |  8 |   3.6GHz |  62.467 |  30.860 |  474.832 |  237.482 |
 | Apple Mac mini Late 2012    | OSX.10  | Intel Core i7-3615QM   | Ivy Birdge    | x64    | SSE4.2/AVX        4 |   2.3GHz |  51.427 |  25.693 |  194.698 |   96.913 | | Apple Mac mini Late 2012    | OSX.10  | Intel Core i7-3615QM   | Ivy Birdge    | x64    | SSE4.2/AVX        4 |   2.3GHz |  51.427 |  25.693 |  194.698 |   96.913 |
 | Apple MacBook Pro Late 2011 | OSX.10  | Intel Core i7-2720QM   | Sandy Bridge  | x64    | SSE4.2/AVX        4 |   2.2GHz |  52.260 |  26.137 |  162.316 |   74.049 | | Apple MacBook Pro Late 2011 | OSX.10  | Intel Core i7-2720QM   | Sandy Bridge  | x64    | SSE4.2/AVX        4 |   2.2GHz |  52.260 |  26.137 |  162.316 |   74.049 |
 | Pixel 3                     | A9.0    | Snapdragon 845         | Kryo 385(A75/55) | ARMv8A | AArch64          |  8 |   2.8GHz |  35.994 |  17.990 |  139.338 |   69.582 | | Pixel 3                     | A9.0    | Snapdragon 845         | Kryo 385(A75/55) | ARMv8A | AArch64          |  8 |   2.8GHz |  35.994 |  17.990 |  139.338 |   69.582 |
 +| PC AMD A10-7870K            | Win10   | AMD A10-7870K          | Steamroller   | x64    | SSE4.2/AVX/FMA3  |  2 |   3.9GHz |  64.743 |  32.400 |  124.500 |   62.247 |
 | Apple MacBook Pro Late 2013 | OSX.10  | Intel Core i5-3210M    | Ivy Birdge    | x64    | SSE4.2/AVX        2 |   2.5GHz |  48.604 |  24.317 |   90.247 |   45.223 | | Apple MacBook Pro Late 2013 | OSX.10  | Intel Core i5-3210M    | Ivy Birdge    | x64    | SSE4.2/AVX        2 |   2.5GHz |  48.604 |  24.317 |   90.247 |   45.223 |
 | iPhone SE                   | iOS9.3  | Apple A9               | Twister       | ARMv8A | AArch64          |  2 |  1.85GHz |  41.857 |  14.545 |   81.071 |   28.333 | | iPhone SE                   | iOS9.3  | Apple A9               | Twister       | ARMv8A | AArch64          |  2 |  1.85GHz |  41.857 |  14.545 |   81.071 |   28.333 |
行 29: 行 31:
 | NVIDIA Tegra Note 7         | A4.4    | NVIDIA Tegra 4         | Cortex-A15    | ARMv7A | VFPv4 NEON        4 |   1.8GHz |  13.371 |   2.655 |   51.345 |    9.860 | | NVIDIA Tegra Note 7         | A4.4    | NVIDIA Tegra 4         | Cortex-A15    | ARMv7A | VFPv4 NEON        4 |   1.8GHz |  13.371 |   2.655 |   51.345 |    9.860 |
 | PC Intel N3150 Braswell     | Ubuntu  | Intel Celeron N3150    | Airmont       | x64    | SSE4.2            4 |   1.6GHz |  12.468 |   3.117 |   49.679 |   12.469 | | PC Intel N3150 Braswell     | Ubuntu  | Intel Celeron N3150    | Airmont       | x64    | SSE4.2            4 |   1.6GHz |  12.468 |   3.117 |   49.679 |   12.469 |
 +| Raspberry Pi 4              | Ubuntu  | Broadcomm BCM2711      | Cortex-A72    | ARMv8A | AArch64          |  4 |   1.5GHz |  11.973 |   5.987 |   47.925 |   23.962 |
 | ASUS Nexus 7 2013           | A4.4    | Qualcomm S4 APQ8064    | Krait         | ARMv7A | VFPv4 NEON        4 |   1.5GHz |  11.947 |   3.005 |   47.808 |   11.751 | | ASUS Nexus 7 2013           | A4.4    | Qualcomm S4 APQ8064    | Krait         | ARMv7A | VFPv4 NEON        4 |   1.5GHz |  11.947 |   3.005 |   47.808 |   11.751 |
 | HTC J butterfly HTL21       | A4.1    | Qualcomm S4 APQ8064    | Krait         | ARMv7A | VFPv4 NEON        4 |   1.5GHz |  11.883 |   2.967 |   46.954 |   11.778 | | HTC J butterfly HTL21       | A4.1    | Qualcomm S4 APQ8064    | Krait         | ARMv7A | VFPv4 NEON        4 |   1.5GHz |  11.883 |   2.967 |   46.954 |   11.778 |
 +| NVIDIA Jetson nano          | Ubuntu  | NVIDIA Tegra X1        | Cortex-A57    | ARMv8A | AArch64          |  4 |   1.43GHz |  11.404 |  5.702 |   45.454 |   22.727 |
 | Apple TV (2015)             | tv9.0   | Apple A8               | Typhoon       | ARMv8A | AArch64          |  2 |   1.4GHz |  22.197 |  11.105 |   44.331 |   22.084 | | Apple TV (2015)             | tv9.0   | Apple A8               | Typhoon       | ARMv8A | AArch64          |  2 |   1.4GHz |  22.197 |  11.105 |   44.331 |   22.084 |
 | Apple iPhone 5s             | i8.0    | Apple A7               | Cyclone       | ARMv8A | AArch64          |  2 |   1.3GHz |  20.621 |  10.313 |   40.871 |   20.480 | | Apple iPhone 5s             | i8.0    | Apple A7               | Cyclone       | ARMv8A | AArch64          |  2 |   1.3GHz |  20.621 |  10.313 |   40.871 |   20.480 |
行 9224: 行 9228:
  
  
-==== Qualcomm Kryo 280 (Cortex-A73) (ARMv8A AArch64 arm64) FPU+ASIMD ====+==== Qualcomm Kryo 280 (Cortex-A73 + A53) (ARMv8A AArch64 arm64) FPU+ASIMD ====
  
  
-++++Essential Phone PH-1 Snapdragon 835 big core Kryo 280 2.32GHz x4 ARM64 (AArch64) Android 9.0|+++++Essential Phone PH-1 Snapdragon 835 Kryo 280 2.45GHz x4 + 1.9GHz x4 ARM64 (AArch64) Android 9.0|
  
 <code> <code>
-ARCH: ARMv8A 3 +ARCH: ARMv8A AArch64 
-FPU: AArch64 NEON +FPU : ASIMD(AArch64 NEON) 
-SingleT SP max19.546 GFLOPS +NameQualcomm Technologies, Inc MSM8998 
-SingleT DP max9.769 GFLOPS + 
-MultiT  SP max75.284 GFLOPS +CPU Thread 8 
-MultiT  DP max37.888 GFLOPS +CPU Core  :  8 
-CPU core: 4+CPU Group :  2 
 +  Group 0Thread= 4  Clock=1.900800 GHz  (mask:f) 
 +  Group 1Thread=  Clock=2.457600 GHz  (mask:f0) 
 +NEON  : yes 
 +FMA   : yes
 FPHP  : no FPHP  : no
 SIMDHP: no SIMDHP: no
  
-* FPU/NEON (single fp)+Total: 
 +SingleThread HP max: - 
 +SingleThread SP max:   34.353 GFLOPS 
 +SingleThread DP max:   17.178 GFLOPS 
 +MultiThread  HP max: - 
 +MultiThread  SP max:  129.511 GFLOPS 
 +MultiThread  DP max:   67.329 GFLOPS 
 + 
 +Group 0:  Thread=4  Clock=1.900800 GHz  (mask:f) 
 +  SingleThread HP max: - 
 +  SingleThread SP max:   14.806 GFLOPS 
 +  SingleThread DP max:    7.406 GFLOPS 
 +  MultiThread  HP max: - 
 +  MultiThread  SP max:   59.267 GFLOPS 
 +  MultiThread  DP max:   29.639 GFLOPS 
 + 
 +Group 1:  Thread=4  Clock=2.457600 GHz  (mask:f0) 
 +  SingleThread HP max: - 
 +  SingleThread SP max:   19.547 GFLOPS 
 +  SingleThread DP max:    9.772 GFLOPS 
 +  MultiThread  HP max: - 
 +  MultiThread  SP max:   70.244 GFLOPS 
 +  MultiThread  DP max:   37.690 GFLOPS 
 + 
 + 
 +* Group 0:  Thread=1  Clock=1.900800 GHz  (mask:f) 
 +* FPU/NEON (SP fp)
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-FPU fmul (32bit x1) n8        :    0.288     4163.    4163.(  1 1.7)    4163.3 +FPU fmul (32bit x1) n8        :    0.319     3574.    3574.(  1 1.9)    3574.0 
-FPU fadd (32bit x1) n8        :    0.258     4652.    4652.(  1 1.9)    4652.6 +FPU fadd (32bit x1) n8        :    0.334     3415.    3415.(  1 1.8)    3415.8 
-FPU fmadd (32bit x1) n8       :    0.491     4885.    2442.(  2 1.0)    4885.3 +FPU fmadd (32bit x1) n8       :    0.621     3675.    1837.(  2 1.0)    3675.2 
-NEON fmul.2s (32bit x2) n8    :    0.258     9300.    4650.(  2 1.9)    9300.2 +NEON fmul.2s (32bit x2) n8    :    0.334     6821.    3410.(  2 1.8)    6821.6 
-NEON fadd.2s (32bit x2) n8    :    0.258     9307.    4653.(  2 1.9)    9307.7 +NEON fadd.2s (32bit x2) n8    :    0.335     6807.    3403.(  2 1.8)    6807.5 
-NEON fmla.2s (32bit x2) n8    :    0.269    17816.    4454.(  4 1.8)   17816.9 +NEON fmla.2s (32bit x2) n8    :    0.334    13676.    3419.(  4 1.8)   13676.0 
-NEON fmul.4s (32bit x4) n8    :    0.491     9772.    2443.(  4 1.0)    9772.8 +NEON fmul.4s (32bit x4) n8    :    0.623     7325.    1831.(  4 1.0)    7325.9 
-NEON fadd.4s (32bit x4) n8    :    0.491     9773.    2443.(  4 1.0)    9773.2 +NEON fadd.4s (32bit x4) n8    :    0.628     7258.    1814.(  4 1.0)    7258.5 
-NEON fmla.4s (32bit x4) n8    :    0.491    19546.    2443.(  8 1.0)   19546.0 +NEON fmla.4s (32bit x4) n8    :    0.622    14677.    1834.(  8 1.0)   14677.4 
-FPU fmul (32bit x1) ns4       :    0.491     2442.    2442.(  1 1.0)    2442.8 +FPU fmul (32bit x1) ns4       :    0.607     1879.    1879.(  1 1.0)    1879.9 
-FPU fadd (32bit x1) ns4       :    0.491     2442.    2442.(  1 1.0)    2442.2 +FPU fadd (32bit x1) ns4       :    0.608     1874.    1874.(  1 1.0)    1874.4 
-FPU fmadd (32bit x1) ns4      :    0.614     3907.    1953.(  2 0.8)    3907.8 +FPU fmadd (32bit x1) ns4      :    0.685     3328.    1664.(  2 0.9)    3328.0 
-NEON fmul.2s (32bit x2) ns4   :    0.491     4884.    2442.(  2 1.0)    4884.8 +NEON fmul.2s (32bit x2) ns4   :    0.606     3761.    1880.(  2 1.0)    3761.1 
-NEON fadd.2s (32bit x2) ns4   :    0.491     4884.    2442.(  2 1.0)    4884.3 +NEON fadd.2s (32bit x2) ns4   :    0.606     3763.    1881.(  2 1.0)    3763.2 
-NEON fmla.2s (32bit x2) ns4   :    0.860     5582.6     1395.(  4 0.6)    5582.6 +NEON fmla.2s (32bit x2) ns4   :    1.212     3763.5      940.(  4 0.5)    3763.5 
-NEON fmul.4s (32bit x4) ns4   :    0.491     9768.    2442.(  4 1.0)    9768.4 +NEON fmul.4s (32bit x4) ns4   :    0.621     7346.    1836.(  4 1.0)    7346.7 
-NEON fadd.4s (32bit x4) ns4   :    0.491     9768.    2442.(  4 1.0)    9768.4 +NEON fadd.4s (32bit x4) ns4   :    0.621     7341.    1835.(  4 1.0)    7341.7 
-NEON fmla.4s (32bit x4) ns4   :    0.860    11165.6     1395.(  8 0.6  11165.6 +NEON fmla.4s (32bit x4) ns4   :    1.215     7511.8      939.0 (  8 0.5   7511.8 
-FPU fmul (32bit x1) n1        :    0.258     4653.    4653.(  1 1.9)    4653.4 +FPU fmul (32bit x1) n1        :    0.607     1878.    1878.(  1 1.0)    1878.9 
-FPU fadd (32bit x1) n1        :    0.258     4650.    4650.(  1 1.9)    4650.8 +FPU fadd (32bit x1) n1        :    0.606     1881.    1881.(  1 1.0)    1881.4 
-FPU fmadd (32bit x1) n1       :    3.438      698.     349.(  2 0.1)     698.1 +FPU fmadd (32bit x1) n1       :    4.848      470.     235.(  2 0.1)     470.5 
-NEON fmul.2s (32bit x2) n1    :    0.258     9308.    4654.(  2 1.9)    9308.7 +NEON fmul.2s (32bit x2) n1    :    0.606     3763.    1881.(  2 1.0)    3763.0 
-NEON fadd.2s (32bit x2) n1    :    0.258     9302.    4651.(  2 1.9)    9302.8 +NEON fadd.2s (32bit x2) n1    :    0.606     3765.    1882.(  2 1.0)    3765.6 
-NEON fmla.2s (32bit x2) n1    :    1.474     3256.     814.(  4 0.3)    3256.6 +NEON fmla.2s (32bit x2) n1    :    2.424     1882.     470.(  4 0.2)    1882.0 
-NEON fmul.4s (32bit x4) n1    :    0.491     9770.    2442.(  4 1.0)    9770.5 +NEON fmul.4s (32bit x4) n1    :    0.621     7342.    1835.(  4 1.0)    7342.7 
-NEON fadd.4s (32bit x4) n1    :    0.491     9770.4     2442.(  4 1.0)    9770.4 +NEON fadd.4s (32bit x4) n1    :    0.623     7321.4     1830.(  4 1.0)    7321.4 
-NEON fmla.4s (32bit x4) n1    :    1.474     6513.     814.(  8 0.3)    6513.1 +NEON fmla.4s (32bit x4) n1    :    2.428     3757.     469.(  8 0.2)    3757.9 
-NEON fmul.4s (32bit x4) n12   :    0.737     9773.    2443.(  4 1.0)    9773.4 +NEON fmul.4s (32bit x4) n12   :    0.926     7393.    1848.(  4 1.0)    7393.5 
-NEON fadd.4s (32bit x4) n12   :    0.737     9774.    2443.(  4 1.0)    9774.0 +NEON fadd.4s (32bit x4) n12   :    0.925     7398.    1849.(  4 1.0)    7398.8 
-NEON fmla.4s (32bit x4) n12   :    0.737    19544.    2443.(  8 1.0)   19544.1 +NEON fmla.4s (32bit x4) n12   :    0.924    14806.    1850.(  8 1.0)   14806.5 
-Average                       :    0.640     8036.    2818.3 (  3 1.1)    8036.0 +Average                       :    0.903     5648.    1906.3 (  3 1.0)    5648.8 
-Highest                       :    0.258    19546.    4654.(  8 1.9)   19546.0+Highest                       :    0.319    14806.    3574.(  8 1.9)   14806.5
  
  
-* FPU/NEON (double fp)+* Group 0:  Thread=1  Clock=1.900800 GHz  (mask:f) 
 +* FPU/NEON (DP fp)
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-FPU fmul (64bit x1) n8        :    0.280     4288.    4288.(  1 1.7)    4288.2 +FPU fmul (64bit x1) n8        :    0.336     3397.    3397.(  1 1.8)    3397.5 
-FPU fadd (64bit x1) n8        :    0.258     4650.    4650.(  1 1.9)    4650.7 +FPU fadd (64bit x1) n8        :    0.323     3529.    3529.(  1 1.9)    3529.5 
-FPU fmadd (64bit x1) n8       :    0.491     4886.    2443.(  2 1.0)    4886.6 +FPU fmadd (64bit x1) n8       :    0.607     3755.    1877.(  2 1.0)    3755.4 
-NEON fmul.2d (64bit x2) n8    :    0.491     4886.    2443.(  2 1.0)    4886.5 +NEON fmul.2d (64bit x2) n8    :    0.622     3664.    1832.(  2 1.0)    3664.8 
-NEON fadd.2d (64bit x2) n8    :    0.491     4885.    2442.(  2 1.0)    4885.3 +NEON fadd.2d (64bit x2) n8    :    0.626     3646.    1823.(  2 1.0)    3646.5 
-NEON fmla.2d (64bit x2) n8    :    0.492     9760.    2440.(  4 1.0)    9760.0 +NEON fmla.2d (64bit x2) n8    :    0.622     7331.    1832.(  4 1.0)    7331.3 
-FPU fmul (64bit x1) ns4       :    0.491     2443.    2443.(  1 1.0)    2443.4 +FPU fmul (64bit x1) ns4       :    0.606     1881.    1881.(  1 1.0)    1881.0 
-FPU fadd (64bit x1) ns4       :    0.491     2443.    2443.(  1 1.0)    2443.2 +FPU fadd (64bit x1) ns4       :    0.607     1879.    1879.(  1 1.0)    1879.0 
-FPU fmadd (64bit x1) ns4      :    0.431     5569.0     2784.(  2 1.1)    5569.0 +FPU fmadd (64bit x1) ns4      :    0.608     3750.0     1875.(  2 1.0)    3750.0 
-NEON fmul.2d (64bit x2) ns4   :    0.492     4877.    2438.8 (  2 1.0)    4877.7 +NEON fmul.2d (64bit x2) ns4   :    0.623     3661.    1830.8 (  2 1.0)    3661.5 
-NEON fadd.2d (64bit x2) ns4   :    0.492     4878.    2439.(  2 1.0)    4878.2 +NEON fadd.2d (64bit x2) ns4   :    0.621     3671.    1835.(  2 1.0)    3671.3 
-NEON fmla.2d (64bit x2) ns4   :    0.859     5585.1     1396.(  4 0.6)    5585.1 +NEON fmla.2d (64bit x2) ns4   :    1.215     3754.9      938.(  4 0.5)    3754.9 
-FPU fmul (64bit x1) n1        :    0.258     4650.    4650.(  1 1.9)    4650.7 +FPU fmul (64bit x1) n1        :    0.606     1881.    1881.(  1 1.0)    1881.6 
-FPU fadd (64bit x1) n1        :    0.258     4652.    4652.(  1 1.9)    4652.0 +FPU fadd (64bit x1) n1        :    0.606     1881.    1881.(  1 1.0)    1881.2 
-FPU fmadd (64bit x1) n1       :    3.439      697.     348.9 (  2 0.1)     697.8 +FPU fmadd (64bit x1) n1       :    4.854      469.     234.9 (  2 0.1)     469.9 
-NEON fmul.2d (64bit x2) n1    :    0.492     4882.8     2441.4 (  2 1.0)    4882.8 +NEON fmul.2d (64bit x2) n1    :    0.632     3610.8     1805.4 (  2 0.9)    3610.8 
-NEON fadd.2d (64bit x2) n1    :    0.491     4883.    2441.(  2 1.0)    4883.3 +NEON fadd.2d (64bit x2) n1    :    0.620     3680.    1840.(  2 1.0)    3680.9 
-NEON fmla.2d (64bit x2) n1    :    1.475     3255.1      813.(  4 0.3)    3255.1 +NEON fmla.2d (64bit x2) n1    :    2.429     1878.1      469.(  4 0.2)    1878.1 
-NEON fmul.2d (64bit x2) n12   :    0.738     4877.    2439.(  2 1.0)    4877.9 +NEON fmul.2d (64bit x2) n12   :    0.925     3698.    1849.(  2 1.0)    3698.7 
-NEON fadd.2d (64bit x2) n12   :    0.737     4883.    2441.(  2 1.0)    4883.0 +NEON fadd.2d (64bit x2) n12   :    0.924     3703.    1851.(  2 1.0)    3703.2 
-NEON fmla.2d (64bit x2) n12   :    0.737     9769.    2442.(  4 1.0)    9769.1 +NEON fmla.2d (64bit x2) n12   :    0.924     7406.    1851.(  4 1.0)    7406.2 
-Average                       :    0.685     4843.    2634.(  2 1.1)    4843.1 +Average                       :    0.949     3434.    1819.(  2 1.0)    3434.9 
-Highest                       :    0.258     9769.    4652.(  4 1.9)    9769.1+Highest                       :    0.323     7406.    3529.(  4 1.9)    7406.2
  
  
 +* Group 0:  Thread=1  Clock=1.900800 GHz  (mask:f)
 * Matrix 4x4 * Matrix 4x4
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-C++ code                      :    0.267     6712.    6712.(  1 2.7)    6712.0 +C++ code                      :    0.426     3998.    3998.(  1 2.1)    3998.6 
-NEON fmla.4s 128bit A         :    0.215     8320.    8320.(  1 3.4)    8320.7 +NEON fmla.4s 128bit A         :    0.714     2385.    2385.(  1 1.3)    2385.9 
-NEON fmla.4s 128bit B         :    0.213     8395.    8395.(  1 3.4)    8395.3 +NEON fmla.4s 128bit B         :    0.350     4870.    4870.(  1 2.6)    4870.7 
-Average                       :    0.232     7809.    7809.(  1 3.2)    7809.3 +Average                       :    0.496     3751.    3751.(  1 2.0)    3751.7 
-Highest                       :    0.213     8395.    8395.(  1 3.4)    8395.3+Highest                       :    0.350     4870.    4870.(  1 2.6)    4870.7
  
  
-* FPU/NEON (single fp) multi-thread+* Group 0:  Thread=4  Clock=1.900800 GHz  (mask:f) 
 +* FPU/NEON (SP fp) multi-thread
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-FPU fmul (32bit x1) n8        :    0.560     8571.    2142.9 (  4 0.9)    8571.6 +FPU fmul (32bit x1) n8        :    0.318    14335.    3583.9 (  4 1.9)   14335.7 
-FPU fadd (32bit x1) n8        :    0.538     8917.    2229.(  4 0.9   8917.4 +FPU fadd (32bit x1) n8        :    0.333    13704.    3426.(  4 1.8  13704.3 
-FPU fmadd (32bit x1) n8       :    1.020     9410.    1176.(  8 0.5   9410.2 +FPU fmadd (32bit x1) n8       :    0.620    14727.    1840.(  8 1.0  14727.6 
-NEON fmul.2s (32bit x2) n8    :    0.536    17918.8     2239.(  8 0.9)   17918.8 +NEON fmul.2s (32bit x2) n8    :    0.333    27405.8     3425.(  8 1.8)   27405.8 
-NEON fadd.2s (32bit x2) n8    :    0.538    17834.    2229.4 (  8 0.9)   17834.8 +NEON fadd.2s (32bit x2) n8    :    0.334    27323.    3415.4 (  8 1.8)   27323.1 
-NEON fmla.2s (32bit x2) n8    :    0.564    34051.0     2128.( 16 0.9)   34051.0 +NEON fmla.2s (32bit x2) n8    :    0.339    53820.0     3363.( 16 1.8)   53820.0 
-NEON fmul.4s (32bit x4) n8    :    1.021    18805.    1175.( 16 0.5)   18805.3 +NEON fmul.4s (32bit x4) n8    :    0.622    29351.    1834.( 16 1.0)   29351.1 
-NEON fadd.4s (32bit x4) n8    :    1.023    18774.    1173.( 16 0.5)   18774.0 +NEON fadd.4s (32bit x4) n8    :    0.622    29337.    1833.( 16 1.0)   29337.7 
-NEON fmla.4s (32bit x4) n8    :    1.023    37544.    1173.3 ( 32 0.5)   37544.7 +NEON fmla.4s (32bit x4) n8    :    0.621    58795.    1837.3 ( 32 1.0)   58795.1 
-FPU fmul (32bit x1) ns4       :    1.021     4701.    1175.(  4 0.5)    4701.3 +FPU fmul (32bit x1) ns4       :    0.616     7401.    1850.(  4 1.0)    7401.8 
-FPU fadd (32bit x1) ns4       :    1.023     4693.    1173.(  4 0.5)    4693.7 +FPU fadd (32bit x1) ns4       :    0.606     7530.    1882.(  4 1.0)    7530.2 
-FPU fmadd (32bit x1) ns4      :    1.277     7517.0      939.6 (  8 0.4   7517.0 +FPU fmadd (32bit x1) ns4      :    0.681    13398.8     1674.(  8 0.9  13398.8 
-NEON fmul.2s (32bit x2) ns4   :    1.023     9387.    1173.(  8 0.5   9387.1 +NEON fmul.2s (32bit x2) ns4   :    0.606    15060.    1882.(  8 1.0  15060.4 
-NEON fadd.2s (32bit x2) ns4   :    1.021     9402.6     1175.(  8 0.5   9402.6 +NEON fadd.2s (32bit x2) ns4   :    0.606    15044.6     1880.(  8 1.0  15044.6 
-NEON fmla.2s (32bit x2) ns4   :    1.788    10740.6      671.( 16 0.3)   10740.6 +NEON fmla.2s (32bit x2) ns4   :    1.213    15046.6      940.( 16 0.5)   15046.6 
-NEON fmul.4s (32bit x4) ns4   :    1.025    18740.    1171.( 16 0.5)   18740.8 +NEON fmul.4s (32bit x4) ns4   :    0.621    29394.    1837.( 16 1.0)   29394.4 
-NEON fadd.4s (32bit x4) ns4   :    1.021    18802.    1175.( 16 0.5)   18802.4 +NEON fadd.4s (32bit x4) ns4   :    0.622    29352.    1834.( 16 1.0)   29352.1 
-NEON fmla.4s (32bit x4) ns4   :    1.104    34796.9     1087.( 32 0.4)   34796.9 +NEON fmla.4s (32bit x4) ns4   :    1.219    29926.9      935.( 32 0.5)   29926.9 
-FPU fmul (32bit x1) n1        :    0.268    17912.    4478.(  4 1.8  17912.2 +FPU fmul (32bit x1) n1        :    0.608     7505.    1876.(  4 1.0   7505.8 
-FPU fadd (32bit x1) n1        :    0.268    17911.    4477.(  4 1.8  17911.6 +FPU fadd (32bit x1) n1        :    0.606     7528.    1882.(  4 1.0   7528.7 
-FPU fmadd (32bit x1) n1       :    3.572     2687.     335.(  8 0.1)    2687.6 +FPU fmadd (32bit x1) n1       :    4.859     1877.     234.(  8 0.1)    1877.9 
-NEON fmul.2s (32bit x2) n1    :    0.268    35833.    4479.(  8 1.8)   35833.5 +NEON fmul.2s (32bit x2) n1    :    0.616    14812.    1851.(  8 1.0)   14812.3 
-NEON fadd.2s (32bit x2) n1    :    0.268    35834.0     4479.2 (  8 1.8)   35834.0 +NEON fadd.2s (32bit x2) n1    :    0.605    15074.0     1884.2 (  8 1.0)   15074.0 
-NEON fmla.2s (32bit x2) n1    :    1.531    12542.     783.( 16 0.3  12542.3 +NEON fmla.2s (32bit x2) n1    :    2.433     7500.     468.( 16 0.2   7500.4 
-NEON fmul.4s (32bit x4) n1    :    0.510    37624.    2351.( 16 1.0)   37624.7 +NEON fmul.4s (32bit x4) n1    :    0.630    28977.    1811.( 16 1.0)   28977.6 
-NEON fadd.4s (32bit x4) n1    :    0.510    37627.    2351.( 16 1.0)   37627.6 +NEON fadd.4s (32bit x4) n1    :    0.622    29345.    1834.( 16 1.0)   29345.1 
-NEON fmla.4s (32bit x4) n1    :    1.531    25083.     783.( 32 0.3)   25083.1 +NEON fmla.4s (32bit x4) n1    :    2.434    14996.     468.( 32 0.2)   14996.4 
-NEON fmul.4s (32bit x4) n12   :    0.766    37619.    2351.( 16 1.0)   37619.1 +NEON fmul.4s (32bit x4) n12   :    0.935    29289.    1830.( 16 1.0)   29289.7 
-NEON fadd.4s (32bit x4) n12   :    0.766    37619.5     2351.( 16 1.0)   37619.5 +NEON fadd.4s (32bit x4) n12   :    0.923    29648.5     1853.( 16 1.0)   29648.5 
-NEON fmla.4s (32bit x4) n12   :    0.765    75284.    2352.( 32 1.0)   75284.4 +NEON fmla.4s (32bit x4) n12   :    0.924    59267.    1852.( 32 1.0)   59267.3 
-Average                       :    0.938    22139.    1899.( 13 0.8)   22139.7 +Average                       :    0.904    22559.    1904.( 13 1.0)   22559.3 
-Highest                       :    0.268    75284.    4479.( 32 1.8)   75284.4+Highest                       :    0.318    59267.    3583.( 32 1.9)   59267.3
  
  
-* FPU/NEON (double fp) multi-thread+* Group 0:  Thread=4  Clock=1.900800 GHz  (mask:f) 
 +* FPU/NEON (DP fp) multi-thread
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-FPU fmul (64bit x1) n8        :    0.417    11502.    2875.(  4 1.2)   11502.8 +FPU fmul (64bit x1) n8        :    0.336    13593.    3398.(  4 1.8)   13593.7 
-FPU fadd (64bit x1) n8        :    0.365    13164.    3291.(  4 1.3)   13164.7 +FPU fadd (64bit x1) n8        :    0.323    14139.    3534.(  4 1.9)   14139.0 
-FPU fmadd (64bit x1) n8       :    0.707    13577.    1697.2 (  8 0.7)   13577.9 +FPU fmadd (64bit x1) n8       :    0.606    15065.    1883.2 (  8 1.0)   15065.8 
-NEON fmul.2d (64bit x2) n8    :    0.692    13877.0     1734.(  8 0.7)   13877.0 +NEON fmul.2d (64bit x2) n8    :    0.621    14688.0     1836.(  8 1.0)   14688.0 
-NEON fadd.2d (64bit x2) n8    :    0.617    15560.    1945.(  8 0.8)   15560.5 +NEON fadd.2d (64bit x2) n8    :    0.621    14690.    1836.(  8 1.0)   14690.9 
-NEON fmla.2d (64bit x2) n8    :    0.540    35539.    2221.( 16 0.9)   35539.9 +NEON fmla.2d (64bit x2) n8    :    0.621    29407.    1838.( 16 1.0)   29407.3 
-FPU fmul (64bit x1) ns4       :    0.510     9407.    2351.(  4 1.0)    9407.3 +FPU fmul (64bit x1) ns4       :    0.605     7536.    1884.(  4 1.0)    7536.0 
-FPU fadd (64bit x1) ns4       :    0.510     9407.    2351.(  4 1.0)    9407.5 +FPU fadd (64bit x1) ns4       :    0.606     7532.    1883.(  4 1.0)    7532.2 
-FPU fmadd (64bit x1) ns4      :    0.448    21419.    2677.(  8 1.1)   21419.5 +FPU fmadd (64bit x1) ns4      :    0.606    15057.    1882.(  8 1.0)   15057.1 
-NEON fmul.2d (64bit x2) ns4   :    0.510    18813.    2351.(  8 1.0)   18813.0 +NEON fmul.2d (64bit x2) ns4   :    0.622    14660.    1832.(  8 1.0)   14660.2 
-NEON fadd.2d (64bit x2) ns4   :    0.510    18815.    2352.(  8 1.0)   18815.8 +NEON fadd.2d (64bit x2) ns4   :    0.621    14700.    1837.(  8 1.0)   14700.2 
-NEON fmla.2d (64bit x2) ns4   :    0.893    21505.0     1344.( 16 0.5)   21505.0 +NEON fmla.2d (64bit x2) ns4   :    1.212    15061.8      941.( 16 0.5)   15061.8 
-FPU fmul (64bit x1) n1        :    0.268    17919.    4480.(  4 1.8  17919.8 +FPU fmul (64bit x1) n1        :    0.605     7534.    1883.(  4 1.0   7534.9 
-FPU fadd (64bit x1) n1        :    0.268    17920.    4480.(  4 1.8  17920.0 +FPU fadd (64bit x1) n1        :    0.605     7535.    1883.(  4 1.0   7535.5 
-FPU fmadd (64bit x1) n1       :    3.571     2688.     336.(  8 0.1)    2688.1 +FPU fmadd (64bit x1) n1       :    4.867     1874.     234.(  8 0.1)    1874.5 
-NEON fmul.2d (64bit x2) n1    :    0.510    18812.    2351.(  8 1.0)   18812.5 +NEON fmul.2d (64bit x2) n1    :    0.621    14702.    1837.(  8 1.0)   14702.7 
-NEON fadd.2d (64bit x2) n1    :    0.510    18812.1     2351.(  8 1.0)   18812.1 +NEON fadd.2d (64bit x2) n1    :    0.621    14698.1     1837.(  8 1.0)   14698.1 
-NEON fmla.2d (64bit x2) n1    :    1.531    12541.     783.( 16 0.3  12541.7 +NEON fmla.2d (64bit x2) n1    :    2.424     7527.     470.( 16 0.2   7527.5 
-NEON fmul.2d (64bit x2) n12   :    0.766    18794.    2349.(  8 1.0)   18794.6 +NEON fmul.2d (64bit x2) n12   :    0.923    14822.    1852.(  8 1.0)   14822.0 
-NEON fadd.2d (64bit x2) n12   :    0.766    18810.    2351.(  8 1.0)   18810.3 +NEON fadd.2d (64bit x2) n12   :    0.934    14646.    1830.(  8 1.0)   14646.4 
-NEON fmla.2d (64bit x2) n12   :    0.760    37888.    2368.( 16 1.0)   37888.3 +NEON fmla.2d (64bit x2) n12   :    0.924    29638.    1852.( 16 1.0)   29638.6 
-Average                       :    0.746    17465.    2335.(  8 1.0)   17465.6 +Average                       :    0.949    13767.    1822.(  8 1.0)   13767.3 
-Highest                       :    0.268    37888.    4480.( 16 1.8)   37888.3+Highest                       :    0.323    29638.    3534.( 16 1.9)   29638.6
  
  
 +* Group 0:  Thread=4  Clock=1.900800 GHz  (mask:f)
 * Matrix 4x4 multi-thread * Matrix 4x4 multi-thread
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-C++ code                      :    0.569    12591.    3147.(  4 1.3)   12591.7 +C++ code                      :    0.436    15639.    3909.(  4 2.1)   15639.0 
-NEON fmla.4s 128bit A         :    0.441    16264.    4066.(  4 1.7  16264.1 +NEON fmla.4s 128bit A         :    0.713     9552.    2388.(  4 1.3   9552.5 
-NEON fmla.4s 128bit B         :    0.444    16160.    4040.(  4 1.6)   16160.5 +NEON fmla.4s 128bit B         :    0.348    19563.    4890.(  4 2.6)   19563.4 
-Average                       :    0.485    15005.    3751.(  4 1.5)   15005.4 +Average                       :    0.499    14918.    3729.(  4 2.0)   14918.3 
-Highest                       :    0.441    16264.    4066.(  4 1.7)   16264.1+Highest                       :    0.348    19563.    4890.(  4 2.6)   19563.4
  
  
-cpu0  1900800 300000 +* Group 1:  Thread=1  Clock=2.457600 GHz  (mask:f0) 
-cpu1  1900800 300000 +* FPU/NEON (SP fp) 
-cpu2  1900800 300000 +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-cpu3  1900800 300000 +FPU fmul (32bit x1) n8        :    0.317     4653.5     4653.5 (  1 1.9)    4653.5 
-cpu4  2457600 300000 +FPU fadd (32bit x1) n8        :    0.317     4654.9     4654.9 (  1 1.9)    4654.9 
-cpu5  2457600 300000 +FPU fmadd (32bit x1) n8       :    0.604     4884.5     2442.3 (  2 1.0)    4884.5 
-cpu6  2457600 300000 +NEON fmul.2s (32bit x2) n8    :    0.317     9309.0     4654.5 (  2 1.9)    9309.0 
-cpu7  2457600 300000+NEON fadd.2s (32bit x2) n8    :    0.317     9309.8     4654.9 (  2 1.9)    9309.8 
 +NEON fmla.2s (32bit x2) n8    :    0.329    17927.5     4481.9 (  4 1.8)   17927.5 
 +NEON fmul.4s (32bit x4) n8    :    0.603     9774.3     2443.6 (  4 1.0)    9774.3 
 +NEON fadd.4s (32bit x4) n8    :    0.603     9774.1     2443.5 (  4 1.0)    9774.1 
 +NEON fmla.4s (32bit x4) n8    :    0.603    19546.8     2443.4 (  8 1.0)   19546.8 
 +FPU fmul (32bit x1) ns4       :    0.603     2443.4     2443.4 (  1 1.0)    2443.4 
 +FPU fadd (32bit x1) ns4       :    0.604     2442.5     2442.5 (  1 1.0)    2442.5 
 +FPU fmadd (32bit x1) ns4      :    0.755     3908.4     1954.2 (  2 0.8)    3908.4 
 +NEON fmul.2s (32bit x2) ns4   :    0.603     4886.8     2443.4 (  2 1.0)    4886.8 
 +NEON fadd.2s (32bit x2) ns4   :    0.604     4886.1     2443.0 (  2 1.0)    4886.1 
 +NEON fmla.2s (32bit x2) ns4   :    1.057     5581.7     1395.4 (  4 0.6)    5581.7 
 +NEON fmul.4s (32bit x4) ns4   :    0.604     9768.5     2442.1 (  4 1.0)    9768.5 
 +NEON fadd.4s (32bit x4) ns4   :    0.604     9766.9     2441.7 (  4 1.0)    9766.9 
 +NEON fmla.4s (32bit x4) ns4   :    1.057    11163.0     1395.4 (  8 0.6)   11163.0 
 +FPU fmul (32bit x1) n1        :    0.317     4648.8     4648.8 (  1 1.9)    4648.8 
 +FPU fadd (32bit x1) n1        :    0.317     4652.1     4652.1 (  1 1.9)    4652.1 
 +FPU fmadd (32bit x1) n1       :    4.225      698.0      349.0 (  2 0.1)     698.0 
 +NEON fmul.2s (32bit x2) n1    :    0.317     9305.3     4652.6 (  2 1.9)    9305.3 
 +NEON fadd.2s (32bit x2) n1    :    0.317     9307.2     4653.6 (  2 1.9)    9307.2 
 +NEON fmla.2s (32bit x2) n1    :    1.810     3258.0      814.5 (  4 0.3)    3258.0 
 +NEON fmul.4s (32bit x4) n1    :    0.604     9771.8     2442.9 (  4 1.0)    9771.8 
 +NEON fadd.4s (32bit x4) n1    :    0.603     9775.4     2443.8 (  4 1.0)    9775.4 
 +NEON fmla.4s (32bit x4) n1    :    1.811     6513.9      814.2 (  8 0.3)    6513.9 
 +NEON fmul.4s (32bit x4) n12   :    0.905     9771.8     2442.9 (  4 1.0)    9771.8 
 +NEON fadd.4s (32bit x4) n12   :    0.905     9773.9     2443.5 (  4 1.0)    9773.9 
 +NEON fmla.4s (32bit x4) n12   :    0.905    19545.9     2443.2 (  8 1.0)   19545.9 
 +Average                       :    0.785     8056.8     2835.8 (  3 1.2)    8056.8 
 +Highest                       :    0.317    19546.8     4654.9 (  8 1.9)   19546.8
  
-Processor : AArch64 Processor rev 1 (aarch64) 
-processor : 0 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0xa 
-CPU part : 0x801 
-CPU revision : 4 
  
-processor : 1 +* Group 1 Thread= Clock=2.457600 GHz  (mask:f0) 
-BogoMIPS 38.00 +* FPU/NEON (DP fp) 
-Features fp asimd evtstrm aes pmull sha1 sha2 crc32 +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-CPU implementer 0x51 +FPU fmul (64bit x1) n8           0.317     4652.4     4652.4 (  1 1.9)    4652.4 
-CPU architecture: 8 +FPU fadd (64bit x1) n8           0.317     4652.7     4652.7 (  1 1.9)    4652.7 
-CPU variant 0xa +FPU fmadd (64bit x1) n8          0.604     4884.0     2442.0 (  2 1.0)    4884.0 
-CPU part 0x801 +NEON fmul.2d (64bit x2) n8       0.604     4885.3     2442.7 (  2 1.0)    4885.3 
-CPU revision : 4+NEON fadd.2d (64bit x2) n8    :    0.604     4885.3     2442.7 (  2 1.0)    4885.3 
 +NEON fmla.2d (64bit x2) n8    :    0.604     9771.4     2442.(  4 1.0)    9771.4 
 +FPU fmul (64bit x1) ns4          0.603     2443.4     2443.4 (  1 1.0)    2443.4 
 +FPU fadd (64bit x1) ns4          0.603     2443.9     2443.9 (  1 1.0)    2443.9 
 +FPU fmadd (64bit x1) ns4         0.528     5586.0     2793.0 (  2 1.1)    5586.0 
 +NEON fmul.2d (64bit x2) ns4   :    0.603     4887.    2443.7 (  2 1.0)    4887.4 
 +NEON fadd.2d (64bit x2) ns4   :    0.604     4886.0     2443.0 (  2 1.0)    4886.0 
 +NEON fmla.2d (64bit x2) ns4   :    1.056     5584.3     1396.1 (  4 0.6)    5584.3 
 +FPU fmul (64bit x1) n1        :    0.317     4653.7     4653.7 (  1 1.9)    4653.7 
 +FPU fadd (64bit x1) n1        :    0.317     4653.6     4653.6 (  1 1.9)    4653.6 
 +FPU fmadd (64bit x1) n1       :    4.225      698.1      349.0 (  2 0.1)     698.1 
 +NEON fmul.2d (64bit x2) n1    :    0.604     4884.5     2442.2 (  2 1.0)    4884.5 
 +NEON fadd.2d (64bit x2) n1    :    0.604     4885.6     2442.8 (  2 1.0)    4885.6 
 +NEON fmla.2d (64bit x2) n1    :    1.811     3257.1      814.3 (  4 0.3)    3257.1 
 +NEON fmul.2d (64bit x2) n12   :    0.906     4885.2     2442.6 (  2 1.0)    4885.2 
 +NEON fadd.2d (64bit x2) n12   :    0.905     4886.1     2443.1 (  2 1.0)    4886.1 
 +NEON fmla.2d (64bit x2) n12   :    0.905     9772.0     2443.0 (  4 1.0)    9772.0 
 +Average                       :    0.840     4863.7     2653.5 (  2 1.1)    4863.7 
 +Highest                       :    0.317     9772.0     4653.7 (  4 1.9)    9772.0
  
-processor : 2 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0xa 
-CPU part : 0x801 
-CPU revision : 4 
  
-processor +* Group 1 Thread=1  Clock=2.457600 GHz  (mask:f0) 
-BogoMIPS : 38.00 +* Matrix 4x4 
-Features fp asimd evtstrm aes pmull sha1 sha2 crc32 +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-CPU implementer : 0x51 +C++ code                         0.360     6110.8     6110.8 (  1 2.5)    6110.
-CPU architecture: 8 +NEON fmla.4s 128bit A            0.266     8285.3     8285.3 (  1 3.4)    8285.3 
-CPU variant 0xa +NEON fmla.4s 128bit B            0.257     8569.7     8569.7 (  1 3.5)    8569.7 
-CPU part 0x801 +Average                          0.294     7655.3     7655.3 (  1 3.1)    7655.3 
-CPU revision 4+Highest                       :    0.257     8569.7     8569.7 (  1 3.5)    8569.7
  
-processor : 4 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0xa 
-CPU part : 0x800 
-CPU revision : 1 
  
-processor : 5 +* Group 1 Thread=4  Clock=2.457600 GHz  (mask:f0) 
-BogoMIPS 38.00 +* FPU/NEON (SP fp) multi-thread 
-Features fp asimd evtstrm aes pmull sha1 sha2 crc32 +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-CPU implementer 0x51 +FPU fmul (32bit x1) n8        :    0.455    12977.3     3244.3 (  4 1.3)   12977.3 
-CPU architecture: 8 +FPU fadd (32bit x1) n8        :    0.494    11946.6     2986.6 (  4 1.2)   11946.6 
-CPU variant 0xa +FPU fmadd (32bit x1) n8       :    0.823    14333.1     1791.6 (  8 0.7)   14333.1 
-CPU part 0x800 +NEON fmul.2s (32bit x2) n8    :    0.479    24612.2     3076.(  8 1.3)   24612.2 
-CPU revision : 1+NEON fadd.2s (32bit x2) n8       0.476    24783.8     3098.0 (  8 1.3)   24783.8 
 +NEON fmla.2s (32bit x2) n8       0.479    49204.8     3075.3 ( 16 1.3)   49204.8 
 +NEON fmul.4s (32bit x4) n8       0.942    25056.7     1566.0 ( 16 0.6)   25056.7 
 +NEON fadd.4s (32bit x4) n8       0.941    25058.9     1566.2 ( 16 0.6)   25058.9 
 +NEON fmla.4s (32bit x4) n8    :    0.925    51022.2     1594.4 ( 32 0.6)   51022.2 
 +FPU fmul (32bit x1) ns4       :    0.785     7517.1     1879.3 (  4 0.8)    7517.1 
 +FPU fadd (32bit x1) ns4          0.721     8177.4     2044.3 (  4 0.8)    8177.4 
 +FPU fmadd (32bit x1) ns4         1.134    10401.5     1300.2 (  8 0.5)   10401.5 
 +NEON fmul.2s (32bit x2) ns4      0.901    13086.    1635.8 (  8 0.7)   13086.1 
 +NEON fadd.2s (32bit x2) ns4   :    0.709    16646.2     2080.8 (  8 0.8)   16646.2 
 +NEON fmla.2s (32bit x2) ns4   :    1.552    15203.5      950.2 ( 16 0.4)   15203.5 
 +NEON fmul.4s (32bit x4) ns4   :    0.785    30068.4     1879.3 ( 16 0.8)   30068.4 
 +NEON fadd.4s (32bit x4) ns4   :    0.887    26589.4     1661.8 ( 16 0.7)   26589.4 
 +NEON fmla.4s (32bit x4) ns4   :    1.446    32632.2     1019.8 ( 32 0.4)   32632.2 
 +FPU fmul (32bit x1) n1        :    0.403    14651.9     3663.0 (  4 1.5)   14651.9 
 +FPU fadd (32bit x1) n1        :    0.434    13582.6     3395.6 (  4 1.4)   13582.6 
 +FPU fmadd (32bit x1) n1       :    6.024     1958.2      244.8 (  8 0.1)    1958.2 
 +NEON fmul.2s (32bit x2) n1    :    0.412    28620.6     3577.6 (  8 1.5)   28620.6 
 +NEON fadd.2s (32bit x2) n1    :    0.384    30747.3     3843.4 (  8 1.6)   30747.3 
 +NEON fmla.2s (32bit x2) n1    :    2.123    11112.1      694.5 ( 16 0.3)   11112.1 
 +NEON fmul.4s (32bit x4) n1    :    0.684    34490.5     2155.7 ( 16 0.9)   34490.5 
 +NEON fadd.4s (32bit x4) n1    :    0.636    37116.4     2319.8 ( 16 0.9)   37116.4 
 +NEON fmla.4s (32bit x4) n1    :    1.902    24810.3      775.3 ( 32 0.3)   24810.3 
 +NEON fmul.4s (32bit x4) n12   :    0.941    37611.8     2350.7 ( 16 1.0)   37611.8 
 +NEON fadd.4s (32bit x4) n12   :    0.997    35498.0     2218.6 ( 16 0.9)   35498.0 
 +NEON fmla.4s (32bit x4) n12   :    1.008    70243.7     2195.1 ( 32 0.9)   70243.7 
 +Average                       :    1.029    24658.7     2129.5 ( 13 0.9)   24658.7 
 +Highest                       :    0.384    70243.7     3843.4 ( 32 1.6)   70243.7
  
-processor : 6 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0xa 
-CPU part : 0x800 
-CPU revision : 1 
  
-processor : 7 +* Group 1 Thread=4  Clock=2.457600 GHz  (mask:f0) 
-BogoMIPS 38.00 +* FPU/NEON (DP fp) multi-thread 
-Features fp asimd evtstrm aes pmull sha1 sha2 crc32 +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-CPU implementer 0x51 +FPU fmul (64bit x1) n8        :    1.267     4656.8     1164.2 (  4 0.5)    4656.8 
-CPU architecture: 8 +FPU fadd (64bit x1) n8        :    1.271     4641.6     1160.4 (  4 0.5)    4641.6 
-CPU variant 0xa +FPU fmadd (64bit x1) n8       :    2.422     4870.5      608.8 (  8 0.2)    4870.5 
-CPU part 0x800 +NEON fmul.2d (64bit x2) n8    :    2.414     4885.7      610.7 (  8 0.2)    4885.
-CPU revision : 1+NEON fadd.2d (64bit x2) n8       2.417     4880.5      610.1 (  8 0.2)    4880.5 
 +NEON fmla.2d (64bit x2) n8       2.422     9740.1      608.8 ( 16 0.2)    9740.1 
 +FPU fmul (64bit x1) ns4          2.415     2442.0      610.5 (  4 0.2)    2442.0 
 +FPU fadd (64bit x1) ns4          2.419     2437.9      609.5 (  4 0.2)    2437.9 
 +FPU fmadd (64bit x1) ns4      :    2.116     5575.9      697.0 (  0.3)    5575.9 
 +NEON fmul.2d (64bit x2) ns4      2.420     4873.8      609.2 (  8 0.2)    4873.8 
 +NEON fadd.2d (64bit x2) ns4      2.417     4880.3      610.0 (  8 0.2)    4880.3 
 +NEON fmla.2d (64bit x2) ns4      4.230     5578.0      348.6 ( 16 0.1)    5578.0 
 +FPU fmul (64bit x1) n1        :    1.274     4629.5     1157.4 (  4 0.5)    4629.5 
 +FPU fadd (64bit x1) n1        :    1.268     4650.9     1162.7 (  4 0.5)    4650.9 
 +FPU fmadd (64bit x1) n1       :    9.906     1190.9      148.9 (  8 0.1)    1190.9 
 +NEON fmul.2d (64bit x2) n1    :    0.821    14364.5     1795.6 (  8 0.7)   14364.5 
 +NEON fadd.2d (64bit x2) n1    :    0.937    12586.2     1573.3 (  8 0.6)   12586.2 
 +NEON fmla.2d (64bit x2) n1    :    2.334    10110.2      631.9 ( 16 0.3)   10110.2 
 +NEON fmul.2d (64bit x2) n12   :    0.941    18803.3     2350.4 (  8 1.0)   18803.3 
 +NEON fadd.2d (64bit x2) n12   :    1.053    16807.8     2101.0 (  8 0.9)   16807.8 
 +NEON fmla.2d (64bit x2) n12   :    0.939    37690.3     2355.6 ( 16 1.0)   37690.3 
 +Average                       :    2.272     8585.6     1025.0 (  8 0.4)    8585.6 
 +Highest                       :    0.821    37690.3     2355.6 ( 16 1.0)   37690.3
  
-Hardware : Qualcomm Technologies, Inc MSM8998 
  
-Qualcomm Technologies, Inc MSM8998+* Group 1:  Thread=4  Clock=2.457600 GHz  (mask:f0) 
 +* Matrix 4x4 multi-thread 
 +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
 +C++ code                      :    0.540    16309.5     4077.4 (  4 1.7)   16309.5 
 +NEON fmla.4s 128bit A         :    0.312    28256.8     7064.2 (  4 2.9)   28256.8 
 +NEON fmla.4s 128bit B         :    0.282    31246.1     7811.5 (  4 3.2)   31246.1 
 +Average                       :    0.378    25270.8     6317.7 (  4 2.6)   25270.8 
 +Highest                       :    0.282    31246.1     7811.5 (  4 3.2)   31246.1 
  
-2019/01/19 16:23:31  
  
 </code> </code>
opengl/vfpbenchlog.txt · 最終更新: 2020/12/30 23:46 by oga

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki