ユーザ用ツール

サイト用ツール


opengl:vfpbenchlog

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
次のリビジョン両方とも次のリビジョン
opengl:vfpbenchlog [2019/02/17 01:02] – [結果一覧] ogaopengl:vfpbenchlog [2019/06/16 01:04] – [Qualcomm Kryo 385 (Cortex-A55) (ARMv8.2A AArch64 arm64) FPU+ASIMD+HALFFP] oga
行 9218: 行 9218:
  
 2019/01/05 16:44:55  2019/01/05 16:44:55 
-</code> 
- 
-++++ 
- 
- 
-==== Qualcomm Kryo 385 (Cortex-A55) (ARMv8.2A AArch64 arm64) FPU+ASIMD+HALFFP ==== 
- 
-++++Pixel 3 Snapdragon 845 little core Kryo 385 1.76GHz x4 ARM64 (AArch64) Android 9.0| 
- 
-<code> 
-ARCH: ARMv8A 3 
-FPU: AArch64 NEON 
-SingleT SP max: 13.701 GFLOPS 
-SingleT DP max: 6.859 GFLOPS 
-MultiT  SP max: 54.948 GFLOPS 
-MultiT  DP max: 27.386 GFLOPS 
-CPU core: 4 
-FPHP  : yes 
-SIMDHP: yes 
- 
-* FPU/NEON (single fp) 
-                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-FPU fmul (32bit x1) n8        :    0.396     3031.5     3031.5 (  1 1.7)    3031.5 
-FPU fadd (32bit x1) n8        :    0.362     3318.3     3318.3 (  1 1.9)    3318.3 
-FPU fmadd (32bit x1) n8       :    0.361     6648.5     3324.2 (  2 1.9)    6648.5 
-NEON fmul.2s (32bit x2) n8    :    0.378     6348.4     3174.2 (  2 1.8)    6348.4 
-NEON fadd.2s (32bit x2) n8    :    0.361     6643.3     3321.6 (  2 1.9)    6643.3 
-NEON fmla.2s (32bit x2) n8    :    0.378    12691.6     3172.9 (  4 1.8)   12691.6 
-NEON fmul.4s (32bit x4) n8    :    0.705     6810.6     1702.6 (  4 1.0)    6810.6 
-NEON fadd.4s (32bit x4) n8    :    0.705     6804.8     1701.2 (  4 1.0)    6804.8 
-NEON fmla.4s (32bit x4) n8    :    0.705    13619.2     1702.4 (  8 1.0)   13619.2 
-FPU fmul (32bit x1) ns4       :    0.688     1745.1     1745.1 (  1 1.0)    1745.1 
-FPU fadd (32bit x1) ns4       :    0.688     1745.1     1745.1 (  1 1.0)    1745.1 
-FPU fmadd (32bit x1) ns4      :    0.688     3488.5     1744.3 (  2 1.0)    3488.5 
-NEON fmul.2s (32bit x2) ns4   :    0.689     3484.1     1742.1 (  2 1.0)    3484.1 
-NEON fadd.2s (32bit x2) ns4   :    0.690     3479.1     1739.6 (  2 1.0)    3479.1 
-NEON fmla.2s (32bit x2) ns4   :    0.692     6937.5     1734.4 (  4 1.0)    6937.5 
-NEON fmul.4s (32bit x4) ns4   :    0.711     6753.1     1688.3 (  4 1.0)    6753.1 
-NEON fadd.4s (32bit x4) ns4   :    0.708     6781.7     1695.4 (  4 1.0)    6781.7 
-NEON fmla.4s (32bit x4) ns4   :    0.706    13594.8     1699.3 (  8 1.0)   13594.8 
-FPU fmul (32bit x1) n1        :    0.688     1743.0     1743.0 (  1 1.0)    1743.0 
-FPU fadd (32bit x1) n1        :    0.690     1739.2     1739.2 (  1 1.0)    1739.2 
-FPU fmadd (32bit x1) n1       :    2.753      871.9      435.9 (  2 0.2)     871.9 
-NEON fmul.2s (32bit x2) n1    :    0.688     3488.3     1744.1 (  2 1.0)    3488.3 
-NEON fadd.2s (32bit x2) n1    :    0.688     3487.0     1743.5 (  2 1.0)    3487.0 
-NEON fmla.2s (32bit x2) n1    :    2.754     1742.8      435.7 (  4 0.2)    1742.8 
-NEON fmul.4s (32bit x4) n1    :    0.706     6798.9     1699.7 (  4 1.0)    6798.9 
-NEON fadd.4s (32bit x4) n1    :    0.706     6797.1     1699.3 (  4 1.0)    6797.1 
-NEON fmla.4s (32bit x4) n1    :    2.757     3482.1      435.3 (  8 0.2)    3482.1 
-NEON fmul.4s (32bit x4) n12   :    1.050     6860.4     1715.1 (  4 1.0)    6860.4 
-NEON fadd.4s (32bit x4) n12   :    1.050     6856.1     1714.0 (  4 1.0)    6856.1 
-NEON fmla.4s (32bit x4) n12   :    1.051    13700.7     1712.6 (  8 1.0)   13700.7 
-Average                       :    0.873     5716.4     1893.3 (  3 1.1)    5716.4 
-Highest                       :    0.361    13700.7     3324.2 (  8 1.9)   13700.7 
- 
- 
-* FPU/NEON (double fp) 
-                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-FPU fmul (64bit x1) n8        :    0.377     3179.8     3179.8 (  1 1.8)    3179.8 
-FPU fadd (64bit x1) n8        :    0.381     3151.9     3151.9 (  1 1.8)    3151.9 
-FPU fmadd (64bit x1) n8       :    0.380     6317.6     3158.8 (  2 1.8)    6317.6 
-NEON fmul.2d (64bit x2) n8    :    0.706     3399.5     1699.7 (  2 1.0)    3399.5 
-NEON fadd.2d (64bit x2) n8    :    0.706     3401.4     1700.7 (  2 1.0)    3401.4 
-NEON fmla.2d (64bit x2) n8    :    0.706     6800.3     1700.1 (  4 1.0)    6800.3 
-FPU fmul (64bit x1) ns4       :    0.688     1743.9     1743.9 (  1 1.0)    1743.9 
-FPU fadd (64bit x1) ns4       :    0.689     1741.5     1741.5 (  1 1.0)    1741.5 
-FPU fmadd (64bit x1) ns4      :    0.689     3483.2     1741.6 (  2 1.0)    3483.2 
-NEON fmul.2d (64bit x2) ns4   :    0.706     3399.6     1699.8 (  2 1.0)    3399.6 
-NEON fadd.2d (64bit x2) ns4   :    0.707     3395.2     1697.6 (  2 1.0)    3395.2 
-NEON fmla.2d (64bit x2) ns4   :    0.705     6806.5     1701.6 (  4 1.0)    6806.5 
-FPU fmul (64bit x1) n1        :    0.689     1742.5     1742.5 (  1 1.0)    1742.5 
-FPU fadd (64bit x1) n1        :    0.689     1742.3     1742.3 (  1 1.0)    1742.3 
-FPU fmadd (64bit x1) n1       :    2.754      871.5      435.7 (  2 0.2)     871.5 
-NEON fmul.2d (64bit x2) n1    :    0.706     3399.8     1699.9 (  2 1.0)    3399.8 
-NEON fadd.2d (64bit x2) n1    :    0.709     3387.2     1693.6 (  2 1.0)    3387.2 
-NEON fmla.2d (64bit x2) n1    :    2.754     1742.8      435.7 (  4 0.2)    1742.8 
-NEON fmul.2d (64bit x2) n12   :    1.050     3429.4     1714.7 (  2 1.0)    3429.4 
-NEON fadd.2d (64bit x2) n12   :    1.051     3426.6     1713.3 (  2 1.0)    3426.6 
-NEON fmla.2d (64bit x2) n12   :    1.050     6858.5     1714.6 (  4 1.0)    6858.5 
-Average                       :    0.900     3496.2     1800.5 (  2 1.0)    3496.2 
-Highest                       :    0.377     6858.5     3179.8 (  4 1.8)    6858.5 
- 
- 
-* Matrix 4x4 
-                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-C++ code                      :    0.412     4345.1     4345.1 (  1 2.5)    4345.1 
-NEON fmla.4s 128bit A         :    0.771     2323.2     2323.2 (  1 1.3)    2323.2 
-NEON fmla.4s 128bit B         :    0.374     4790.6     4790.6 (  1 2.7)    4790.6 
-Average                       :    0.519     3819.6     3819.6 (  1 2.2)    3819.6 
-Highest                       :    0.374     4790.6     4790.6 (  1 2.7)    4790.6 
- 
- 
-* FPU/NEON (single fp) multi-thread 
-                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-FPU fmul (32bit x1) n8        :    0.393    12208.3     3052.1 (  4 1.7)   12208.3 
-FPU fadd (32bit x1) n8        :    0.363    13232.9     3308.2 (  4 1.9)   13232.9 
-FPU fmadd (32bit x1) n8       :    0.363    26410.1     3301.3 (  8 1.9)   26410.1 
-NEON fmul.2s (32bit x2) n8    :    0.383    25035.2     3129.4 (  8 1.8)   25035.2 
-NEON fadd.2s (32bit x2) n8    :    0.362    26526.6     3315.8 (  8 1.9)   26526.6 
-NEON fmla.2s (32bit x2) n8    :    0.384    50053.8     3128.4 ( 16 1.8)   50053.8 
-NEON fmul.4s (32bit x4) n8    :    0.705    27222.9     1701.4 ( 16 1.0)   27222.9 
-NEON fadd.4s (32bit x4) n8    :    0.720    26648.3     1665.5 ( 16 0.9)   26648.3 
-NEON fmla.4s (32bit x4) n8    :    0.708    54231.1     1694.7 ( 32 1.0)   54231.1 
-FPU fmul (32bit x1) ns4       :    0.691     6944.1     1736.0 (  4 1.0)    6944.1 
-FPU fadd (32bit x1) ns4       :    0.689     6965.7     1741.4 (  4 1.0)    6965.7 
-FPU fmadd (32bit x1) ns4      :    0.688    13949.1     1743.6 (  8 1.0)   13949.1 
-NEON fmul.2s (32bit x2) ns4   :    0.687    13980.1     1747.5 (  8 1.0)   13980.1 
-NEON fadd.2s (32bit x2) ns4   :    0.704    13643.3     1705.4 (  8 1.0)   13643.3 
-NEON fmla.2s (32bit x2) ns4   :    0.693    27724.8     1732.8 ( 16 1.0)   27724.8 
-NEON fmul.4s (32bit x4) ns4   :    0.704    27275.6     1704.7 ( 16 1.0)   27275.6 
-NEON fadd.4s (32bit x4) ns4   :    0.706    27179.5     1698.7 ( 16 1.0)   27179.5 
-NEON fmla.4s (32bit x4) ns4   :    0.704    54563.8     1705.1 ( 32 1.0)   54563.8 
-FPU fmul (32bit x1) n1        :    0.688     6977.6     1744.4 (  4 1.0)    6977.6 
-FPU fadd (32bit x1) n1        :    0.688     6976.2     1744.0 (  4 1.0)    6976.2 
-FPU fmadd (32bit x1) n1       :    2.752     3488.4      436.0 (  8 0.2)    3488.4 
-NEON fmul.2s (32bit x2) n1    :    0.689    13937.2     1742.2 (  8 1.0)   13937.2 
-NEON fadd.2s (32bit x2) n1    :    0.688    13955.2     1744.4 (  8 1.0)   13955.2 
-NEON fmla.2s (32bit x2) n1    :    2.750     6982.3      436.4 ( 16 0.2)    6982.3 
-NEON fmul.4s (32bit x4) n1    :    0.704    27255.8     1703.5 ( 16 1.0)   27255.8 
-NEON fadd.4s (32bit x4) n1    :    0.706    27191.7     1699.5 ( 16 1.0)   27191.7 
-NEON fmla.4s (32bit x4) n1    :    2.764    13891.8      434.1 ( 32 0.2)   13891.8 
-NEON fmul.4s (32bit x4) n12   :    1.050    27432.7     1714.5 ( 16 1.0)   27432.7 
-NEON fadd.4s (32bit x4) n12   :    1.050    27433.8     1714.6 ( 16 1.0)   27433.8 
-NEON fmla.4s (32bit x4) n12   :    1.048    54948.4     1717.1 ( 32 1.0)   54948.4 
-Average                       :    0.874    22808.9     1888.1 ( 13 1.1)   22808.9 
-Highest                       :    0.362    54948.4     3315.8 ( 32 1.9)   54948.4 
- 
- 
-* FPU/NEON (double fp) multi-thread 
-                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-FPU fmul (64bit x1) n8        :    0.377    12737.2     3184.3 (  4 1.8)   12737.2 
-FPU fadd (64bit x1) n8        :    0.379    12652.6     3163.2 (  4 1.8)   12652.6 
-FPU fmadd (64bit x1) n8       :    0.386    24901.6     3112.7 (  8 1.8)   24901.6 
-NEON fmul.2d (64bit x2) n8    :    0.707    13571.8     1696.5 (  8 1.0)   13571.8 
-NEON fadd.2d (64bit x2) n8    :    0.707    13570.5     1696.3 (  8 1.0)   13570.5 
-NEON fmla.2d (64bit x2) n8    :    0.709    27085.1     1692.8 ( 16 1.0)   27085.1 
-FPU fmul (64bit x1) ns4       :    0.692     6937.9     1734.5 (  4 1.0)    6937.9 
-FPU fadd (64bit x1) ns4       :    0.690     6954.9     1738.7 (  4 1.0)    6954.9 
-FPU fmadd (64bit x1) ns4      :    0.691    13893.6     1736.7 (  8 1.0)   13893.6 
-NEON fmul.2d (64bit x2) ns4   :    0.706    13598.6     1699.8 (  8 1.0)   13598.6 
-NEON fadd.2d (64bit x2) ns4   :    0.706    13607.3     1700.9 (  8 1.0)   13607.3 
-NEON fmla.2d (64bit x2) ns4   :    0.706    27205.9     1700.4 ( 16 1.0)   27205.9 
-FPU fmul (64bit x1) n1        :    0.695     6906.3     1726.6 (  4 1.0)    6906.3 
-FPU fadd (64bit x1) n1        :    0.687     6983.9     1746.0 (  4 1.0)    6983.9 
-FPU fmadd (64bit x1) n1       :    2.751     3490.2      436.3 (  8 0.2)    3490.2 
-NEON fmul.2d (64bit x2) n1    :    0.706    13591.6     1698.9 (  8 1.0)   13591.6 
-NEON fadd.2d (64bit x2) n1    :    0.710    13522.7     1690.3 (  8 1.0)   13522.7 
-NEON fmla.2d (64bit x2) n1    :    2.752     6976.4      436.0 ( 16 0.2)    6976.4 
-NEON fmul.2d (64bit x2) n12   :    1.048    13743.6     1717.9 (  8 1.0)   13743.6 
-NEON fadd.2d (64bit x2) n12   :    1.050    13718.1     1714.8 (  8 1.0)   13718.1 
-NEON fmla.2d (64bit x2) n12   :    1.052    27385.7     1711.6 ( 16 1.0)   27385.7 
-Average                       :    0.900    13954.1     1796.9 (  8 1.0)   13954.1 
-Highest                       :    0.377    27385.7     3184.3 ( 16 1.8)   27385.7 
- 
- 
-* Matrix 4x4 multi-thread 
-                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-C++ code                      :    0.421    17033.9     4258.5 (  4 2.4)   17033.9 
-NEON fmla.4s 128bit A         :    0.769     9320.7     2330.2 (  4 1.3)    9320.7 
-NEON fmla.4s 128bit B         :    0.373    19223.3     4805.8 (  4 2.7)   19223.3 
-Average                       :    0.521    15192.6     3798.2 (  4 2.2)   15192.6 
-Highest                       :    0.373    19223.3     4805.8 (  4 2.7)   19223.3 
- 
- 
-cpu0  1766400 300000 
-cpu1  1766400 300000 
-cpu2  1766400 300000 
-cpu3  1766400 300000 
-cpu4  2803200 825600 
-cpu5  2803200 825600 
-cpu6  2803200 825600 
-cpu7  2803200 825600 
- 
-Processor : AArch64 Processor rev 13 (aarch64) 
-processor : 0 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0x7 
-CPU part : 0x803 
-CPU revision : 12 
- 
-processor : 1 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0x7 
-CPU part : 0x803 
-CPU revision : 12 
- 
-processor : 2 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0x7 
-CPU part : 0x803 
-CPU revision : 12 
- 
-processor : 3 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0x7 
-CPU part : 0x803 
-CPU revision : 12 
- 
-processor : 4 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0x6 
-CPU part : 0x802 
-CPU revision : 13 
- 
-processor : 5 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0x6 
-CPU part : 0x802 
-CPU revision : 13 
- 
-processor : 6 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0x6 
-CPU part : 0x802 
-CPU revision : 13 
- 
-processor : 7 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0x6 
-CPU part : 0x802 
-CPU revision : 13 
- 
-Hardware : Qualcomm Technologies, Inc SDM845 
- 
-Qualcomm Technologies, Inc SDM845 
- 
-2019/01/05 13:41:12  
 </code> </code>
  
行 9729: 行 9478:
  
  
-==== Qualcomm Kryo 385 (Cortex-A75) (ARMv8.2A AArch64 arm64) FPU+ASIMD+HALFFP ====+==== Qualcomm Kryo 385 (Cortex-A75 + A55) (ARMv8.2A AArch64 arm64) FPU+ASIMD+HALFFP ====
  
  
-++++Pixel 3 Snapdragon 845 big core Kryo 385 2.8GHz x4 ARM64 (AArch64) Android 9.0|+++++Pixel 3 Snapdragon 845 Kryo 385 2.8GHz x4 + 1.77GHz x4 ARM64 (AArch64) Android 9.0|
  
 <code> <code>
-ARCH: ARMv8A 3 +ARCH: ARMv8.2A 
-FPU: AArch64 NEON +FPU : ASIMD(AArch64 NEON) FPHP ASIMDHP 
-SingleT SP max22.293 GFLOPS +NameQualcomm Technologies, Inc SDM845 
-SingleT DP max11.137 GFLOPS + 
-MultiT  SP max84.390 GFLOPS +CPU Thread 8 
-MultiT  DP max42.196 GFLOPS +CPU Core  :  8 
-CPU core: 4+CPU Group :  2 
 +  Group 0Thread= 4  Clock=1.766400 GHz  (mask:f) 
 +  Group 1Thread=  Clock=2.803200 GHz  (mask:f0) 
 +NEON  : yes 
 +FMA   : yes
 FPHP  : yes FPHP  : yes
 SIMDHP: yes SIMDHP: yes
  
-* FPU/NEON (single fp)+Total: 
 +SingleThread HP max:   71.675 GFLOPS 
 +SingleThread SP max:   35.892 GFLOPS 
 +SingleThread DP max:   17.940 GFLOPS 
 +MultiThread  HP max:  277.711 GFLOPS 
 +MultiThread  SP max:  138.445 GFLOPS 
 +MultiThread  DP max:   68.745 GFLOPS 
 + 
 +Group 0:  Thread=4  Clock=1.766400 GHz  (mask:f) 
 +  SingleThread HP max:   27.426 GFLOPS 
 +  SingleThread SP max:   13.683 GFLOPS 
 +  SingleThread DP max:    6.851 GFLOPS 
 +  MultiThread  HP max:  108.928 GFLOPS 
 +  MultiThread  SP max:   54.046 GFLOPS 
 +  MultiThread  DP max:   27.273 GFLOPS 
 + 
 +Group 1:  Thread=4  Clock=2.803200 GHz  (mask:f0) 
 +  SingleThread HP max:   44.248 GFLOPS 
 +  SingleThread SP max:   22.209 GFLOPS 
 +  SingleThread DP max:   11.090 GFLOPS 
 +  MultiThread  HP max:  168.783 GFLOPS 
 +  MultiThread  SP max:   84.400 GFLOPS 
 +  MultiThread  DP max:   41.472 GFLOPS 
 + 
 + 
 +* Group 0:  Thread=1  Clock=1.766400 GHz  (mask:f) 
 +* FPU/NEON (HP fp)
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-FPU fmul (32bit x1) n8        :    0.238     5039.    5039.(  1 1.8)    5039.7 +FPU fmul (16bit x1) n8        :    0.320     3308.    3308.(  1 1.9)    3308.5 
-FPU fadd (32bit x1) n8        :    0.215     5577.    5577.(  1 2.0)    5577.2 +FPU fadd (16bit x1) n8        :    0.320     3315.    3315.(  1 1.9)    3315.6 
-FPU fmadd (32bit x1) n8       :    0.271     8852.    4426.(  2 1.6)    8852.5 +FPU fmadd (16bit x1) n8       :    0.320     6633.    3316.(  2 1.9)    6633.8 
-NEON fmul.2s (32bit x2) n8    :    0.215    11156.    5578.(  2 2.0)   11156.0 +NEON fmul.4h (16bit x4) n8    :    0.319    13282.    3320.(  4 1.9)   13282.9 
-NEON fadd.2s (32bit x2) n8    :    0.216    11132.2     5566.(  2 2.0)   11132.2 +NEON fadd.4h (16bit x4) n8    :    0.319    13288.2     3322.(  4 1.9)   13288.2 
-NEON fmla.2s (32bit x2) n8    :    0.215    22293.    5573.(  4 2.0)   22293.3 +NEON fmla.4h (16bit x4) n8    :    0.321    26420.    3302.(  8 1.9)   26420.5 
-NEON fmul.4s (32bit x4) n8    :    0.431    11142.    2785.(  1.0)   11142.5 +NEON fmul.8h (16bit x8) n8    :    0.624    13586.    1698.(  1.0)   13586.0 
-NEON fadd.4s (32bit x4) n8    :    0.432    11111.    2778.(  1.0)   11111.8 +NEON fadd.8h (16bit x8) n8    :    0.625    13575.    1696.(  1.0)   13575.5 
-NEON fmla.4s (32bit x4) n8    :    0.431    22273.6     2784. 1.0)   22273.6 +NEON fmla.8h (16bit x8) n8    :    0.624    27177.6     1698.16 1.0)   27177.6 
-FPU fmul (32bit x1) ns4       :    0.330     3640.    3640.(  1 1.3)    3640.4 +FPU fmul (16bit x1) ns4       :    0.609     1739.    1739.(  1 1.0)    1739.8 
-FPU fadd (32bit x1) ns4       :    0.325     3692.    3692.(  1 1.3)    3692.3 +FPU fadd (16bit x1) ns4       :    0.608     1742.    1742.(  1 1.0)    1742.0 
-FPU fmadd (32bit x1) ns4      :    0.342     7012.    3506.(  2 1.3)    7012.3 +FPU fmadd (16bit x1) ns4      :    0.609     3480.    1740.(  2 1.0)    3480.4 
-NEON fmul.2s (32bit x2) ns4   :    0.330     7262.    3631.(  1.3)    7262.7 +NEON fmul.4h (16bit x4) ns4   :    0.608     6968.    1742.(  1.0)    6968.8 
-NEON fadd.2s (32bit x2) ns4   :    0.333     7211.    3605.(  1.3)    7211.6 +NEON fadd.4h (16bit x4) ns4   :    0.608     6972.    1743.(  1.0)    6972.5 
-NEON fmla.2s (32bit x2) ns4   :    0.541     8865.    2216.(  4 0.8)    8865.1 +NEON fmla.4h (16bit x4) ns4   :    0.608    13942.    1742.(  8 1.0  13942.5 
-NEON fmul.4s (32bit x4) ns4   :    0.434    11047.    2761.(  1.0)   11047.6 +NEON fmul.8h (16bit x8) ns4   :    0.623    13604.    1700.(  1.0)   13604.7 
-NEON fadd.4s (32bit x4) ns4   :    0.434    11061.    2765.(  1.0)   11061.1 +NEON fadd.8h (16bit x8) ns4   :    0.623    13611.    1701.(  1.0)   13611.3 
-NEON fmla.4s (32bit x4) ns4   :    0.541    17730.    2216.4 (  0.8)   17730.9 +NEON fmla.8h (16bit x8) ns4   :    0.623    27206.    1700.4 ( 16 1.0)   27206.0 
-FPU fmul (32bit x1) n1        :    0.217     5537.    5537.(  1 2.0)    5537.5 +FPU fmul (16bit x1) n1        :    0.608     1743.    1743.(  1 1.0)    1743.3 
-FPU fadd (32bit x1) n1        :    0.217     5537.    5537.(  1 2.0)    5537.6 +FPU fadd (16bit x1) n1        :    0.608     1743.    1743.(  1 1.0)    1743.3 
-FPU fmadd (32bit x1) n1       :    2.157     1112.9      556.4 (  2 0.2)    1112.9 +FPU fmadd (16bit x1) n1       :    2.434      870.9      435.4 (  2 0.2)     870.9 
-NEON fmul.2s (32bit x2) n1    :    0.215    11153.8     5576.(  2 2.0)   11153.8 +NEON fmul.4h (16bit x4) n1    :    0.608     6974.8     1743.(  4 1.0)    6974.8 
-NEON fadd.2s (32bit x2) n1    :    0.215    11149.0     5574.(  2 2.0)   11149.0 +NEON fadd.4h (16bit x4) n1    :    0.609     6963.0     1740.(  4 1.0)    6963.0 
-NEON fmla.2s (32bit x2) n1    :    1.300     3692.     923.1 (  0.3)    3692.2 +NEON fmla.4h (16bit x4) n1    :    2.436     3480.     435.1 (  0.2)    3480.6 
-NEON fmul.4s (32bit x4) n1    :    0.433    11081.    2770.(  1.0)   11081.5 +NEON fmul.8h (16bit x8) n1    :    0.623    13606.    1700.(  1.0)   13606.3 
-NEON fadd.4s (32bit x4) n1    :    0.434    11050.    2762.(  1.0)   11050.7 +NEON fadd.8h (16bit x8) n1    :    0.623    13609.    1701.(  1.0)   13609.6 
-NEON fmla.4s (32bit x4) n1    :    1.301     7377.     922. 0.3)    7377.7 +NEON fmla.8h (16bit x8) n1    :    2.435     6964.     435.16 0.2)    6964.1 
-NEON fmul.4s (32bit x4) n12   :    0.652    11049.    2762.(  1.0)   11049.6 +NEON fmul.8h (16bit x8) n12   :    0.929    13696.    1712.(  1.0)   13696.8 
-NEON fadd.4s (32bit x4) n12   :    0.651    11065.    2766.(  1.0)   11065.8 +NEON fadd.8h (16bit x8) n12   :    0.928    13698.    1712.(  1.0)   13698.7 
-NEON fmla.4s (32bit x4) n12   :    0.652    22101.    2762. 1.0)   22101.1 +NEON fmla.8h (16bit x8) n12   :    0.927    27426.    1714.16 1.0)   27426.4 
-Average                       :    0.491     9933.    3553.(  1.3   9933.7 +Average                       :    0.769    10687.    1911.(  1.1  10687.8 
-Highest                       :    0.215    22293.    5578.0 (  8 2.0)   22293.3+Highest                       :    0.319    27426.    3322.0 ( 16 1.9)   27426.4
  
  
-* FPU/NEON (double fp)+* Group 0:  Thread=1  Clock=1.766400 GHz  (mask:f) 
 +* FPU/NEON (SP fp) 
 +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
 +FPU fmul (32bit x1) n8        :    0.322     3288.9     3288.9 (  1 1.9)    3288.9 
 +FPU fadd (32bit x1) n8        :    0.320     3313.9     3313.9 (  1 1.9)    3313.9 
 +FPU fmadd (32bit x1) n8       :    0.320     6626.9     3313.5 (  2 1.9)    6626.9 
 +NEON fmul.2s (32bit x2) n8    :    0.320     6621.5     3310.7 (  2 1.9)    6621.5 
 +NEON fadd.2s (32bit x2) n8    :    0.319     6646.4     3323.2 (  2 1.9)    6646.4 
 +NEON fmla.2s (32bit x2) n8    :    0.319    13292.4     3323.1 (  4 1.9)   13292.4 
 +NEON fmul.4s (32bit x4) n8    :    0.623     6806.8     1701.7 (  4 1.0)    6806.8 
 +NEON fadd.4s (32bit x4) n8    :    0.623     6807.9     1702.0 (  4 1.0)    6807.9 
 +NEON fmla.4s (32bit x4) n8    :    0.623    13611.7     1701.5 (  8 1.0)   13611.7 
 +FPU fmul (32bit x1) ns4       :    0.608     1741.8     1741.8 (  1 1.0)    1741.8 
 +FPU fadd (32bit x1) ns4       :    0.609     1741.4     1741.4 (  1 1.0)    1741.4 
 +FPU fmadd (32bit x1) ns4      :    0.609     3483.1     1741.6 (  2 1.0)    3483.1 
 +NEON fmul.2s (32bit x2) ns4   :    0.609     3481.9     1740.9 (  2 1.0)    3481.9 
 +NEON fadd.2s (32bit x2) ns4   :    0.608     3486.4     1743.2 (  2 1.0)    3486.4 
 +NEON fmla.2s (32bit x2) ns4   :    0.608     6970.1     1742.5 (  4 1.0)    6970.1 
 +NEON fmul.4s (32bit x4) ns4   :    0.623     6805.1     1701.3 (  4 1.0)    6805.1 
 +NEON fadd.4s (32bit x4) ns4   :    0.623     6808.5     1702.1 (  4 1.0)    6808.5 
 +NEON fmla.4s (32bit x4) ns4   :    0.623    13605.8     1700.7 (  8 1.0)   13605.8 
 +FPU fmul (32bit x1) n1        :    0.608     1743.0     1743.0 (  1 1.0)    1743.0 
 +FPU fadd (32bit x1) n1        :    0.618     1714.5     1714.5 (  1 1.0)    1714.5 
 +FPU fmadd (32bit x1) n1       :    2.444      867.3      433.6 (  2 0.2)     867.3 
 +NEON fmul.2s (32bit x2) n1    :    0.608     3484.3     1742.2 (  2 1.0)    3484.3 
 +NEON fadd.2s (32bit x2) n1    :    0.610     3475.9     1737.9 (  2 1.0)    3475.9 
 +NEON fmla.2s (32bit x2) n1    :    2.435     1740.9      435.2 (  4 0.2)    1740.9 
 +NEON fmul.4s (32bit x4) n1    :    0.625     6785.7     1696.4 (  4 1.0)    6785.7 
 +NEON fadd.4s (32bit x4) n1    :    0.624     6792.8     1698.2 (  4 1.0)    6792.8 
 +NEON fmla.4s (32bit x4) n1    :    2.435     3482.4      435.3 (  8 0.2)    3482.4 
 +NEON fmul.4s (32bit x4) n12   :    0.932     6824.5     1706.1 (  4 1.0)    6824.5 
 +NEON fadd.4s (32bit x4) n12   :    0.930     6836.9     1709.2 (  4 1.0)    6836.9 
 +NEON fmla.4s (32bit x4) n12   :    0.930    13682.7     1710.3 (  8 1.0)   13682.7 
 +Average                       :    0.770     5752.4     1909.9 (  3 1.1)    5752.4 
 +Highest                       :    0.319    13682.7     3323.2 (  8 1.9)   13682.7 
 + 
 + 
 +* Group 0:  Thread=1  Clock=1.766400 GHz  (mask:f) 
 +* FPU/NEON (DP fp)
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-FPU fmul (64bit x1) n8        :    0.232     5168.    5168.(  1 1.8)    5168.4 +FPU fmul (64bit x1) n8        :    0.335     3167.    3167.(  1 1.8)    3167.7 
-FPU fadd (64bit x1) n8        :    0.216     5568.1     5568.1 (  1 2.0)    5568.1 +FPU fadd (64bit x1) n8        :    0.338     3131.1     3131.1 (  1 1.8)    3131.1 
-FPU fmadd (64bit x1) n8       :    0.273     8794.    4397.(  2 1.6)    8794.3 +FPU fmadd (64bit x1) n8       :    0.335     6330.    3165.(  2 1.8)    6330.9 
-NEON fmul.2d (64bit x2) n8    :    0.431     5570.    2785.(  2 1.0)    5570.4 +NEON fmul.2d (64bit x2) n8    :    0.623     3399.    1699.(  2 1.0)    3399.7 
-NEON fadd.2d (64bit x2) n8    :    0.431     5569.    2784.(  2 1.0)    5569.6 +NEON fadd.2d (64bit x2) n8    :    0.624     3399.    1699.(  2 1.0)    3399.0 
-NEON fmla.2d (64bit x2) n8    :    0.431    11136.    2784.(  4 1.0)   11136.7 +NEON fmla.2d (64bit x2) n8    :    0.623     6802.    1700.(  4 1.0)    6802.3 
-FPU fmul (64bit x1) ns4       :    0.329     3649.    3649.(  1 1.3)    3649.2 +FPU fmul (64bit x1) ns4       :    0.608     1742.    1742.(  1 1.0)    1742.8 
-FPU fadd (64bit x1) ns4       :    0.326     3680.    3680.(  1 1.3)    3680.4 +FPU fadd (64bit x1) ns4       :    0.608     1742.    1742.(  1 1.0)    1742.2 
-FPU fmadd (64bit x1) ns4      :    0.332     7227.    3613.(  2 1.3)    7227.5 +FPU fmadd (64bit x1) ns4      :    0.609     3478.    1739.(  2 1.0)    3478.8 
-NEON fmul.2d (64bit x2) ns4   :    0.431     5570.    2785.(  2 1.0)    5570.1 +NEON fmul.2d (64bit x2) ns4   :    0.626     3385.    1692.(  2 1.0)    3385.4 
-NEON fadd.2d (64bit x2) ns4   :    0.431     5573.    2786.(  2 1.0)    5573.0 +NEON fadd.2d (64bit x2) ns4   :    0.625     3389.    1694.(  2 1.0)    3389.2 
-NEON fmla.2d (64bit x2) ns4   :    0.539     8908.    2227.(  4 0.8)    8908.7 +NEON fmla.2d (64bit x2) ns4   :    0.632     6708.    1677.(  4 0.9)    6708.4 
-FPU fmul (64bit x1) n1        :    0.216     5553.    5553.(  1 2.0)    5553.8 +FPU fmul (64bit x1) n1        :    0.616     1721.    1721.(  1 1.0)    1721.3 
-FPU fadd (64bit x1) n1        :    0.218     5516.    5516.(  1 2.0)    5516.9 +FPU fadd (64bit x1) n1        :    0.609     1740.    1740.(  1 1.0)    1740.1 
-FPU fmadd (64bit x1) n1       :    2.177     1102.7      551.(  2 0.2)    1102.7 +FPU fmadd (64bit x1) n1       :    2.437      869.7      434.(  2 0.2)     869.7 
-NEON fmul.2d (64bit x2) n1    :    0.431     5570.    2785.(  2 1.0)    5570.2 +NEON fmul.2d (64bit x2) n1    :    0.626     3387.    1693.(  2 1.0)    3387.6 
-NEON fadd.2d (64bit x2) n1    :    0.431     5573.0     2786.(  2 1.0)    5573.0 +NEON fadd.2d (64bit x2) n1    :    0.626     3386.0     1693.(  2 1.0)    3386.0 
-NEON fmla.2d (64bit x2) n1    :    1.293     3711.0      927.(  4 0.3)    3711.0 +NEON fmla.2d (64bit x2) n1    :    2.441     1737.0      434.(  4 0.2)    1737.0 
-NEON fmul.2d (64bit x2) n12   :    0.654     5508.    2754.(  2 1.0)    5508.0 +NEON fmul.2d (64bit x2) n12   :    0.930     3419.    1709.(  2 1.0)    3419.8 
-NEON fadd.2d (64bit x2) n12   :    0.653     5513.    2756.(  2 1.0)    5513.7 +NEON fadd.2d (64bit x2) n12   :    0.928     3425.    1712.(  2 1.0)    3425.3 
-NEON fmla.2d (64bit x2) n12   :    0.653    11027.    2756.(  4 1.0)   11027.4 +NEON fmla.2d (64bit x2) n12   :    0.928     6850.    1712.(  4 1.0)    6850.5 
-Average                       :    0.530     5975.    3267.(  2 1.2)    5975.9 +Average                       :    0.797     3486.    1795.(  2 1.0)    3486.4 
-Highest                       :    0.216    11136.    5568.(  4 2.0  11136.7+Highest                       :    0.335     6850.    3167.(  4 1.8   6850.5
  
  
 +* Group 0:  Thread=1  Clock=1.766400 GHz  (mask:f)
 * Matrix 4x4 * Matrix 4x4
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-C++ code                      :    0.207     8655.    8655.(  1 3.1)    8655.6 +C++ code                      :    0.371     4269.    4269.(  1 2.4)    4269.4 
-NEON fmla.4s 128bit A         :    0.154    11604.1    11604.(  1 4.1)   11604.1 +NEON fmla.4s 128bit A         :    0.673     2351.3     2351.(  1 1.3   2351.3 
-NEON fmla.4s 128bit B         :    0.162    11093.5    11093.(  1 4.0  11093.5 +NEON fmla.4s 128bit B         :    0.324     4890.2     4890.(  1 2.8   4890.2 
-Average                       :    0.174    10451.1    10451.(  1 3.7  10451.1 +Average                       :    0.456     3837.0     3837.(  1 2.2   3837.0 
-Highest                       :    0.154    11604.1    11604.(  1 4.1  11604.1+Highest                       :    0.324     4890.2     4890.(  1 2.8   4890.2
  
  
-* FPU/NEON (single fp) multi-thread+* Group 0:  Thread=4  Clock=1.766400 GHz  (mask:f) 
 +* FPU/NEON (HP fp) multi-thread
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-FPU fmul (32bit x1) n8        :    0.245    19559.    4889.(  4 1.7)   19559.4 +FPU fmul (16bit x1) n8        :    0.321    13201.    3300.(  4 1.9)   13201.8 
-FPU fadd (32bit x1) n8        :    0.228    21088.1     5272.(  4 1.9)   21088.1 +FPU fadd (16bit x1) n8        :    0.322    13146.1     3286.(  4 1.9)   13146.1 
-FPU fmadd (32bit x1) n8       :    0.288    33361.3     4170.(  8 1.5)   33361.3 +FPU fmadd (16bit x1) n8       :    0.324    26192.3     3274.(  8 1.9)   26192.3 
-NEON fmul.2s (32bit x2) n8    :    0.228    42187.    5273. 1.9)   42187.4 +NEON fmul.4h (16bit x4) n8    :    0.321    52891.    3305.16 1.9)   52891.3 
-NEON fadd.2s (32bit x2) n8    :    0.228    42183.3     5272. 1.9)   42183.3 +NEON fadd.4h (16bit x4) n8    :    0.320    52954.3     3309.16 1.9)   52954.3 
-NEON fmla.2s (32bit x2) n8    :    0.228    84357.    5272.16 1.9)   84357.8 +NEON fmla.4h (16bit x4) n8    :    0.323   104926.    3279.32 1.9)  104926.5 
-NEON fmul.4s (32bit x4) n8    :    0.455    42182.2     2636.16 0.9)   42182.2 +NEON fmul.8h (16bit x8) n8    :    0.624    54394.2     1699.32 1.0)   54394.2 
-NEON fadd.4s (32bit x4) n8    :    0.455    42184.    2636.16 0.9)   42184.0 +NEON fadd.8h (16bit x8) n8    :    0.626    54212.    1694.32 1.0)   54212.1 
-NEON fmla.4s (32bit x4) n8    :    0.455    84367.    2636.32 0.9)   84367.8 +NEON fmla.8h (16bit x8) n8    :    0.672   100991.    1578.64 0.9)  100991.1 
-FPU fmul (32bit x1) ns4       :    0.348    13801.    3450.4 (  4 1.2  13801.7 +FPU fmul (16bit x1) ns4       :    0.660     6421.    1605.4 (  4 0.9   6421.6 
-FPU fadd (32bit x1) ns4       :    0.345    13929.    3482.(  4 1.2  13929.3 +FPU fadd (16bit x1) ns4       :    0.672     6311.    1577.(  4 0.9   6311.5 
-FPU fmadd (32bit x1) ns4      :    0.365    26334.    3291.(  8 1.2)   26334.8 +FPU fmadd (16bit x1) ns4      :    0.646    13120.    1640.(  8 0.9)   13120.3 
-NEON fmul.2s (32bit x2) ns4   :    0.346    27734.    3466. 8 1.2)   27734.2 +NEON fmul.4h (16bit x4) ns4   :    0.637    26638.    1664.16 0.9)   26638.8 
-NEON fadd.2s (32bit x2) ns4   :    0.348    27565.    3445. 8 1.2)   27565.1 +NEON fadd.4h (16bit x4) ns4   :    0.637    26638.    1664.16 0.9)   26638.3 
-NEON fmla.2s (32bit x2) ns4   :    0.569    33748.7     2109.16 0.8)   33748.7 +NEON fmla.4h (16bit x4) ns4   :    0.625    54230.7     1694.32 1.0)   54230.7 
-NEON fmul.4s (32bit x4) ns4   :    0.455    42182.3     2636.16 0.9)   42182.3 +NEON fmul.8h (16bit x8) ns4   :    0.639    53111.3     1659.32 0.9)   53111.3 
-NEON fadd.4s (32bit x4) ns4   :    0.455    42190.    2636.16 0.9)   42190.2 +NEON fadd.8h (16bit x8) ns4   :    0.655    51800.    1618.32 0.9)   51800.7 
-NEON fmla.4s (32bit x4) ns4   :    0.569    67497.    2109.32 0.8  67497.6 +NEON fmla.8h (16bit x8) ns4   :    0.631   107571.    1680.64 1.0)  107571.5 
-FPU fmul (32bit x1) n1        :    0.228    21087.    5271.(  4 1.9  21087.6 +FPU fmul (16bit x1) n1        :    0.624     6789.    1697.(  4 1.0   6789.1 
-FPU fadd (32bit x1) n1        :    0.228    21092.    5273.(  4 1.9  21092.9 +FPU fadd (16bit x1) n1        :    0.621     6822.    1705.(  4 1.0   6822.1 
-FPU fmadd (32bit x1) n1       :    2.275     4219.     527.(  8 0.2)    4219.3 +FPU fmadd (16bit x1) n1       :    2.477     3423.     427.(  8 0.2)    3423.4 
-NEON fmul.2s (32bit x2) n1    :    0.228    42187.    5273. 1.9)   42187.2 +NEON fmul.4h (16bit x4) n1    :    0.618    27451.    1715.16 1.0)   27451.7 
-NEON fadd.2s (32bit x2) n1    :    0.228    42192.    5274.1 (  1.9)   42192.6 +NEON fadd.4h (16bit x4) n1    :    0.612    27697.    1731.1 ( 16 1.0)   27697.2 
-NEON fmla.2s (32bit x2) n1    :    1.365    14060.     878.16 0.3)   14060.8 +NEON fmla.4h (16bit x4) n1    :    2.459    13789.     430.32 0.2)   13789.6 
-NEON fmul.4s (32bit x4) n1    :    0.455    42182.2     2636.16 0.9)   42182.2 +NEON fmul.8h (16bit x8) n1    :    0.643    52731.2     1647.32 0.9)   52731.2 
-NEON fadd.4s (32bit x4) n1    :    0.455    42180.    2636.16 0.9)   42180.2 +NEON fadd.8h (16bit x8) n1    :    0.644    52629.    1644.32 0.9)   52629.8 
-NEON fmla.4s (32bit x4) n1    :    1.366    28121.     878.32 0.3)   28121.2 +NEON fmla.8h (16bit x8) n1    :    2.471    27454.     429.64 0.2)   27454.3 
-NEON fmul.4s (32bit x4) n12   :    0.683    42182.    2636.4 ( 16 0.9)   42182.0 +NEON fmul.8h (16bit x8) n12   :    0.942    54027.    1688.4 ( 32 1.0)   54027.4 
-NEON fadd.4s (32bit x4) n12   :    0.683    42173.    2635.16 0.9)   42173.9 +NEON fadd.8h (16bit x8) n12   :    0.945    53838.    1682.32 1.0)   53838.2 
-NEON fmla.4s (32bit x4) n12   :    0.683    84389.    2637.32 0.9  84389.9 +NEON fmla.8h (16bit x8) n12   :    0.934   108928.    1702.64 1.0)  108928.2 
-Average                       :    0.516    37750.    3375.13 1.2)   37750.8 +Average                       :    0.788    41811.    1867.25 1.1)   41811.2 
-Highest                       :    0.228    84389.    5274.32 1.9)   84389.9+Highest                       :    0.320   108928.    3309.64 1.9)  108928.2
  
  
-* FPU/NEON (double fp) multi-thread+* Group 0:  Thread=4  Clock=1.766400 GHz  (mask:f) 
 +* FPU/NEON (SP fp) multi-thread
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-FPU fmul (64bit x1) n8        :    0.248    19330.    4832.(  4 1.7)   19330.2 +FPU fmul (32bit x1) n8        :    0.321    13217.    3304.(  4 1.9)   13217.0 
-FPU fadd (64bit x1) n8        :    0.228    21086.    5271.6 (  4 1.9)   21086.2 +FPU fadd (32bit x1) n8        :    0.329    12886.    3221.6 (  4 1.8)   12886.4 
-FPU fmadd (64bit x1) n8       :    0.289    33179.    4147.(  8 1.5)   33179.9 +FPU fmadd (32bit x1) n8       :    0.324    26173.    3271.(  8 1.9)   26173.7 
-NEON fmul.2d (64bit x2) n8    :    0.455    21087.    2636.(  8 0.9)   21087.8 +NEON fmul.2s (32bit x2) n8    :    0.326    26045.    3255.(  8 1.8)   26045.3 
-NEON fadd.2d (64bit x2) n8    :    0.455    21090.8     2636.(  8 0.9)   21090.8 +NEON fadd.2s (32bit x2) n8    :    0.326    25979.8     3247.(  8 1.8)   25979.8 
-NEON fmla.2d (64bit x2) n8    :    0.455    42183.3     2636.5 ( 16 0.9)   42183.3 +NEON fmla.2s (32bit x2) n8    :    0.327    51831.0     3239.4 ( 16 1.8)   51831.0 
-FPU fmul (64bit x1) ns4       :    0.348    13784.    3446.(  4 1.2  13784.2 +NEON fmul.4s (32bit x4) n8    :    0.649    26135.3     1633.5 ( 16 0.9)   26135.3 
-FPU fadd (64bit x1) ns4       :    0.345    13933.1     3483.(  4 1.2  13933.1 +NEON fadd.4s (32bit x4) n8    :    0.641    26468.0     1654.3 ( 16 0.9)   26468.0 
-FPU fmadd (64bit x1) ns4      :    0.350    27445.    3430.(  8 1.2)   27445.9 +NEON fmla.4s (32bit x4) n8    :    0.643    52712.0     1647.2 ( 32 0.9)   52712.0 
-NEON fmul.2d (64bit x2) ns4   :    0.455    21090.    2636.(  8 0.9)   21090.9 +FPU fmul (32bit x1) ns4       :    0.617     6867.    1716.(  4 1.0   6867.6 
-NEON fadd.2d (64bit x2) ns4   :    0.455    21087.    2635.(  8 0.9)   21087.5 +FPU fadd (32bit x1) ns4       :    0.614     6907.1     1726.(  4 1.0   6907.1 
-NEON fmla.2d (64bit x2) ns4   :    0.569    33745.    2109.1 ( 16 0.8)   33745.4 +FPU fmadd (32bit x1) ns4      :    0.614    13814.    1726.(  8 1.0)   13814.8 
-FPU fmul (64bit x1) n1        :    0.228    21091.    5272.(  4 1.9  21091.8 +NEON fmul.2s (32bit x2) ns4   :    0.611    13880.    1735.(  8 1.0)   13880.2 
-FPU fadd (64bit x1) n1        :    0.228    21087.    5271.(  4 1.9  21087.8 +NEON fadd.2s (32bit x2) ns4   :    0.614    13802.    1725.(  8 1.0)   13802.6 
-FPU fmadd (64bit x1) n1       :    2.276     4218.     527.(  8 0.2)    4218.0 +NEON fmla.2s (32bit x2) ns4   :    0.613    27683.    1730.2 ( 16 1.0)   27683.9 
-NEON fmul.2d (64bit x2) n1    :    0.455    21090.    2636.2 (  8 0.9)   21090.0 +NEON fmul.4s (32bit x4) ns4   :    0.629    26949.0     1684.3 ( 16 1.0)   26949.
-NEON fadd.2d (64bit x2) n1    :    0.455    21085.    2635.(  8 0.9)   21085.6 +NEON fadd.4s (32bit x4ns4   :    0.631    26886.4     1680.4 ( 16 1.0)   26886.4 
-NEON fmla.2d (64bit x2) n1    :    1.366    14056.1      878.16 0.3)   14056.1 +NEON fmla.4s (32bit x4) ns4   :    0.628    54045.6     1688.9 ( 32 1.0)   54045.6 
-NEON fmul.2d (64bit x2) n12   :    0.683    21087.    2635. 0.9)   21087.2 +FPU fmul (32bit x1) n1        :    0.615     6888.    1722.(  4 1.0   6888.6 
-NEON fadd.2d (64bit x2) n12   :    0.683    21089.    2636. 0.9)   21089.0 +FPU fadd (32bit x1) n1        :    0.619     6848.    1712.(  4 1.0   6848.6 
-NEON fmla.2d (64bit x2) n12   :    0.683    42196.    2637.16 0.9)   42196.1 +FPU fmadd (32bit x1) n1       :    2.509     3379.     422.(  8 0.2)    3379.9 
-Average                       :    0.558    22668.    3096. 1.1)   22668.9 +NEON fmul.2s (32bit x2) n1    :    0.614    13801.    1725.2 (  8 1.0)   13801.4 
-Highest                       :    0.228    42196.    5272.16 1.9)   42196.1+NEON fadd.2s (32bit x2) n1    :    0.619    13707.    1713.(  8 1.0)   13707.1 
 +NEON fmla.2s (32bit x2) n1    :    2.510     6755.0      422.2 ( 16 0.2)    6755.0 
 +NEON fmul.4s (32bit x4) n1    :    0.647    26189.5     1636.8 ( 16 0.9)   26189.
 +NEON fadd.4s (32bit x4) n1    :    0.660    25699.9     1606.2 ( 16 0.9)   25699.9 
 +NEON fmla.4s (32bit x4) n1    :    2.543    13337.1      416.32 0.2)   13337.1 
 +NEON fmul.4s (32bit x4) n12   :    0.990    25690.    1605.16 0.9)   25690.8 
 +NEON fadd.4s (32bit x4) n12   :    0.965    26354.    1647.16 0.9)   26354.8 
 +NEON fmla.4s (32bit x4) n12   :    0.951    53496.    1671.32 0.9)   53496.5 
 +Average                       :    0.790    22481.    1873.13 1.1)   22481.1 
 +Highest                       :    0.321    54045.    3304.32 1.9)   54045.6
  
  
 +* Group 0:  Thread=4  Clock=1.766400 GHz  (mask:f)
 +* FPU/NEON (DP fp) multi-thread
 +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
 +FPU fmul (64bit x1) n8        :    0.354    11990.3     2997.6 (  4 1.7)   11990.3
 +FPU fadd (64bit x1) n8        :    0.358    11843.1     2960.8 (  4 1.7)   11843.1
 +FPU fmadd (64bit x1) n8       :    0.348    24386.5     3048.3 (  8 1.7)   24386.5
 +NEON fmul.2d (64bit x2) n8    :    0.649    13059.9     1632.5 (  8 0.9)   13059.9
 +NEON fadd.2d (64bit x2) n8    :    0.663    12789.1     1598.6 (  8 0.9)   12789.1
 +NEON fmla.2d (64bit x2) n8    :    0.651    26052.7     1628.3 ( 16 0.9)   26052.7
 +FPU fmul (64bit x1) ns4       :    0.638     6643.4     1660.9 (  4 0.9)    6643.4
 +FPU fadd (64bit x1) ns4       :    0.638     6647.2     1661.8 (  4 0.9)    6647.2
 +FPU fmadd (64bit x1) ns4      :    0.645    13152.3     1644.0 (  8 0.9)   13152.3
 +NEON fmul.2d (64bit x2) ns4   :    0.660    12856.2     1607.0 (  8 0.9)   12856.2
 +NEON fadd.2d (64bit x2) ns4   :    0.663    12778.9     1597.4 (  8 0.9)   12778.9
 +NEON fmla.2d (64bit x2) ns4   :    0.657    25818.1     1613.6 ( 16 0.9)   25818.1
 +FPU fmul (64bit x1) n1        :    0.642     6602.6     1650.6 (  4 0.9)    6602.6
 +FPU fadd (64bit x1) n1        :    0.656     6457.9     1614.5 (  4 0.9)    6457.9
 +FPU fmadd (64bit x1) n1       :    2.570     3298.5      412.3 (  8 0.2)    3298.5
 +NEON fmul.2d (64bit x2) n1    :    0.661    12823.2     1602.9 (  8 0.9)   12823.2
 +NEON fadd.2d (64bit x2) n1    :    0.655    12936.4     1617.0 (  8 0.9)   12936.4
 +NEON fmla.2d (64bit x2) n1    :    2.529     6705.0      419.1 ( 16 0.2)    6705.0
 +NEON fmul.2d (64bit x2) n12   :    0.954    13330.4     1666.3 (  8 0.9)   13330.4
 +NEON fadd.2d (64bit x2) n12   :    0.929    13684.8     1710.6 (  8 1.0)   13684.8
 +NEON fmla.2d (64bit x2) n12   :    0.933    27273.1     1704.6 ( 16 1.0)   27273.1
 +Average                       :    0.831    13387.1     1716.6 (  8 1.0)   13387.1
 +Highest                       :    0.348    27273.1     3048.3 ( 16 1.7)   27273.1
 +
 +
 +* Group 0:  Thread=4  Clock=1.766400 GHz  (mask:f)
 * Matrix 4x4 multi-thread * Matrix 4x4 multi-thread
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-C++ code                      :    0.220    32563.    8140.(  4 2.9)   32563.2 +C++ code                      :    0.385    16451.    4112.(  4 2.3)   16451.8 
-NEON fmla.4s 128bit A         :    0.162    44336.7    11084.(  4 4.0  44336.7 +NEON fmla.4s 128bit A         :    0.682     9279.3     2319.(  4 1.3   9279.3 
-NEON fmla.4s 128bit B         :    0.170    42170.7    10542.(  4 3.8)   42170.7 +NEON fmla.4s 128bit B         :    0.328    19301.6     4825.(  4 2.7)   19301.6 
-Average                       :    0.184    39690.    9922.(  4 3.5)   39690.2 +Average                       :    0.465    15010.    3752.(  4 2.1)   15010.9 
-Highest                       :    0.162    44336.7    11084.(  4 4.0)   44336.7+Highest                       :    0.328    19301.6     4825.(  4 2.7)   19301.6
  
  
-cpu0  1766400 300000 +* Group 1:  Thread=1  Clock=2.803200 GHz  (mask:f0) 
-cpu1  1766400 300000 +* FPU/NEON (HP fp) 
-cpu2  1766400 300000 +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-cpu3  1766400 300000 +FPU fmul (16bit x1) n8        :    0.304     5524.9     5524.9 (  1 2.0)    5524.9 
-cpu4  2803200 825600 +FPU fadd (16bit x1) n8        :    0.307     5476.1     5476.1 (  1 2.0)    5476.1 
-cpu5  2803200 825600 +FPU fmadd (16bit x1) n8       :    0.383     8786.7     4393.4 (  2 1.6)    8786.7 
-cpu6  2803200 825600 +NEON fmul.4h (16bit x4) n8    :    0.304    22113.0     5528.2 (  4 2.0)   22113.0 
-cpu7  2803200 825600+NEON fadd.4h (16bit x4) n8    :    0.307    21906.8     5476.7 (  4 2.0)   21906.8 
 +NEON fmla.4h (16bit x4) n8    :    0.304    44248.4     5531.0 (  8 2.0)   44248.4 
 +NEON fmul.8h (16bit x8) n8    :    0.609    22087.1     2760.9 (  8 1.0)   22087.1 
 +NEON fadd.8h (16bit x8) n8    :    0.611    22008.4     2751.0 (  8 1.0)   22008.4 
 +NEON fmla.8h (16bit x8) n8    :    0.610    44087.5     2755.5 ( 16 1.0)   44087.5 
 +FPU fmul (16bit x1) ns4       :    0.464     3627.7     3627.7 (  1 1.3)    3627.7 
 +FPU fadd (16bit x1) ns4       :    0.461     3648.1     3648.1 (  1 1.3)    3648.1 
 +FPU fmadd (16bit x1) ns4      :    0.491     6845.7     3422.8 (  2 1.2)    6845.7 
 +NEON fmul.4h (16bit x4) ns4   :    0.459    14671.4     3667.8 (  4 1.3)   14671.4 
 +NEON fadd.4h (16bit x4) ns4   :    0.469    14356.4     3589.1 (  4 1.3)   14356.4 
 +NEON fmla.4h (16bit x4) ns4   :    0.763    17644.0     2205.5 (  8 0.8)   17644.0 
 +NEON fmul.8h (16bit x8) ns4   :    0.614    21921.8     2740.2 (  8 1.0)   21921.8 
 +NEON fadd.8h (16bit x8) ns4   :    0.612    21991.1     2748.9 (  8 1.0)   21991.1 
 +NEON fmla.8h (16bit x8) ns4   :    0.760    35429.6     2214.4 ( 16 0.8)   35429.6 
 +FPU fmul (16bit x1) n1        :    0.306     5490.1     5490.1 (  1 2.0)    5490.1 
 +FPU fadd (16bit x1) n1        :    0.309     5449.3     5449.3 (  1 1.9)    5449.3 
 +FPU fmadd (16bit x1) n1       :    3.051     1102.4      551.2 (  2 0.2)    1102.4 
 +NEON fmul.4h (16bit x4) n1    :    0.308    21808.3     5452.1 (  4 1.9)   21808.3 
 +NEON fadd.4h (16bit x4) n1    :    0.308    21847.4     5461.9 (  4 1.9)   21847.4 
 +NEON fmla.4h (16bit x4) n1    :    1.828     7358.8      919.9 (  8 0.3)    7358.8 
 +NEON fmul.8h (16bit x8) n1    :    0.610    22069.8     2758.7 (  8 1.0)   22069.8 
 +NEON fadd.8h (16bit x8) n1    :    0.618    21756.4     2719.5 (  8 1.0)   21756.4 
 +NEON fmla.8h (16bit x8) n1    :    1.825    14748.5      921.8 ( 16 0.3)   14748.5 
 +NEON fmul.8h (16bit x8) n12   :    0.916    22041.2     2755.2 (  8 1.0)   22041.2 
 +NEON fadd.8h (16bit x8) n12   :    0.912    22122.5     2765.3 (  8 1.0)   22122.5 
 +NEON fmla.8h (16bit x8) n12   :    0.916    44076.4     2754.8 ( 16 1.0)   44076.4 
 +Average                       :    0.691    18208.2     3535.4 (  6 1.3)   18208.2 
 +Highest                       :    0.304    44248.4     5531.0 ( 16 2.0)   44248.4
  
-Processor : AArch64 Processor rev 13 (aarch64) 
-processor : 0 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0x7 
-CPU part : 0x803 
-CPU revision : 12 
  
-processor : 1 +* Group 1 Thread= Clock=2.803200 GHz  (mask:f0) 
-BogoMIPS 38.00 +* FPU/NEON (SP fp) 
-Features fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-CPU implementer 0x51 +FPU fmul (32bit x1) n8           0.304     5530.0     5530.0 (  1 2.0)    5530.0 
-CPU architecture: 8 +FPU fadd (32bit x1) n8           0.306     5492.6     5492.6 (  1 2.0)    5492.6 
-CPU variant 0x7 +FPU fmadd (32bit x1) n8          0.385     8730.6     4365.3 (  2 1.6)    8730.6 
-CPU part 0x803 +NEON fmul.2s (32bit x2) n8       0.303    11088.3     5544.2 (  2 2.0)   11088.3 
-CPU revision 12+NEON fadd.2s (32bit x2) n8    :    0.306    10988.1     5494.0 (  2 2.0)   10988.1 
 +NEON fmla.2s (32bit x2) n8    :    0.305    22037.4     5509.3 (  4 2.0)   22037.4 
 +NEON fmul.4s (32bit x4) n8    :    0.609    11055.3     2763.(  4 1.0)   11055.3 
 +NEON fadd.4s (32bit x4) n8       0.611    11009.1     2752.3 (  4 1.0)   11009.1 
 +NEON fmla.4s (32bit x4) n8       0.610    22052.9     2756.6 (  8 1.0)   22052.9 
 +FPU fmul (32bit x1) ns4          0.462     3643.3     3643.3 (  1 1.3)    3643.3 
 +FPU fadd (32bit x1) ns4       :    0.456     3691.7     3691.7 (  1 1.3)    3691.7 
 +FPU fmadd (32bit x1) ns4      :    0.485     6942.4     3471.2 (  2 1.2)    6942.4 
 +NEON fmul.2s (32bit x2) ns4   :    0.460     7312.7     3656.3 (  2 1.3)    7312.7 
 +NEON fadd.2s (32bit x2) ns4   :    0.466     7218.4     3609.2 (  2 1.3)    7218.4 
 +NEON fmla.2s (32bit x2) ns4   :    0.764     8802.8     2200.7 (  4 0.8)    8802.8 
 +NEON fmul.4s (32bit x4) ns4   :    0.609    11052.0     2763.0 (  4 1.0)   11052.0 
 +NEON fadd.4s (32bit x4) ns4   :    0.612    10994.6     2748.7 (  4 1.0)   10994.6 
 +NEON fmla.4s (32bit x4) ns4   :    0.765    17596.2     2199.5 (  8 0.8)   17596.2 
 +FPU fmul (32bit x1) n1        :    0.308     5469.3     5469.3 (  1 2.0)    5469.3 
 +FPU fadd (32bit x1) n1        :    0.303     5550.2     5550.2 (  1 2.0)    5550.2 
 +FPU fmadd (32bit x1) n1       :    3.048     1103.5      551.7 (  2 0.2)    1103.5 
 +NEON fmul.2s (32bit x2) n1    :    0.304    11075.5     5537.8 (  2 2.0)   11075.5 
 +NEON fadd.2s (32bit x2) n1    :    0.306    10996.9     5498.4 (  2 2.0)   10996.9 
 +NEON fmla.2s (32bit x2) n1    :    1.827     3682.0      920.5 (  4 0.3)    3682.0 
 +NEON fmul.4s (32bit x4) n1    :    0.616    10919.4     2729.9 (  4 1.0)   10919.4 
 +NEON fadd.4s (32bit x4) n1    :    0.610    11034.1     2758.5 (  4 1.0)   11034.1 
 +NEON fmla.4s (32bit x4) n1    :    1.823     7379.8      922.5 (  8 0.3)    7379.8 
 +NEON fmul.4s (32bit x4) n12   :    0.908    11109.7     2777.4 (  4 1.0)   11109.7 
 +NEON fadd.4s (32bit x4) n12   :    0.909    11106.1     2776.5 (  4 1.0)   11106.1 
 +NEON fmla.4s (32bit x4) n12   :    0.909    22209.3     2776.2 (  8 1.0)   22209.3 
 +Average                       :    0.690     9895.8     3548.7 (  3 1.3)    9895.8 
 +Highest                       :    0.303    22209.3     5550.2 (  8 2.0)   22209.3
  
-processor : 2 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0x7 
-CPU part : 0x803 
-CPU revision : 12 
  
-processor : 3 +* Group 1 Thread=1  Clock=2.803200 GHz  (mask:f0) 
-BogoMIPS 38.00 +* FPU/NEON (DP fp) 
-Features fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-CPU implementer 0x51 +FPU fmul (64bit x1) n8        :    0.302     5577.2     5577.2 (  1 2.0)    5577.2 
-CPU architecture: 8 +FPU fadd (64bit x1) n8        :    0.305     5521.3     5521.3 (  1 2.0)    5521.
-CPU variant 0x7 +FPU fmadd (64bit x1) n8          0.384     8754.6     4377.3 (  2 1.6)    8754.6 
-CPU part 0x803 +NEON fmul.2d (64bit x2) n8       0.606     5548.7     2774.3 (  2 1.0)    5548.7 
-CPU revision 12+NEON fadd.2d (64bit x2) n8       0.604     5568.3     2784.1 (  2 1.0)    5568.3 
 +NEON fmla.2d (64bit x2) n8       0.607    11089.9     2772.5 (  4 1.0)   11089.9 
 +FPU fmul (64bit x1) ns4       :    0.461     3645.8     3645.8 (  1 1.3)    3645.
 +FPU fadd (64bit x1) ns4          0.464     3626.4     3626.4 (  1 1.3)    3626.4 
 +FPU fmadd (64bit x1) ns4         0.466     7225.6     3612.8 (  2 1.3)    7225.6 
 +NEON fmul.2d (64bit x2) ns4      0.607     5538.2     2769.1 (  2 1.0)    5538.2 
 +NEON fadd.2d (64bit x2) ns4   :    0.610     5513.5     2756.8 (  2 1.0)    5513.5 
 +NEON fmla.2d (64bit x2) ns4   :    0.762     8828.6     2207.2 (  4 0.8)    8828.6 
 +FPU fmul (64bit x1) n1        :    0.303     5543.2     5543.2 (  1 2.0)    5543.2 
 +FPU fadd (64bit x1) n1        :    0.306     5501.7     5501.7 (  1 2.0)    5501.7 
 +FPU fmadd (64bit x1) n1       :    3.028     1111.0      555.5 (  2 0.2)    1111.0 
 +NEON fmul.2d (64bit x2) n1    :    0.611     5504.7     2752.4 (  2 1.0)    5504.7 
 +NEON fadd.2d (64bit x2) n1    :    0.610     5513.7     2756.9 (  2 1.0)    5513.7 
 +NEON fmla.2d (64bit x2) n1    :    1.823     3689.5      922.4 (  4 0.3)    3689.5 
 +NEON fmul.2d (64bit x2) n12   :    0.908     5556.2     2778.1 (  2 1.0)    5556.2 
 +NEON fadd.2d (64bit x2) n12   :    0.919     5489.6     2744.8 (  2 1.0)    5489.6 
 +NEON fmla.2d (64bit x2) n12   :    0.956    10553.0     2638.3 (  4 0.9)   10553.0 
 +Average                       :    0.745     5947.7     3267.5 (  2 1.2)    5947.7 
 +Highest                       :    0.302    11089.9     5577.2 (  4 2.0)   11089.9
  
-processor : 4 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0x6 
-CPU part : 0x802 
-CPU revision : 13 
  
-processor +* Group 1 Thread=1  Clock=2.803200 GHz  (mask:f0) 
-BogoMIPS : 38.00 +* Matrix 4x4 
-Features fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-CPU implementer : 0x51 +C++ code                         0.278     9026.8     9026.8 (  1 3.2)    9026.
-CPU architecture: 8 +NEON fmla.4s 128bit A            0.225    11155.5    11155.5 (  1 4.0)   11155.5 
-CPU variant 0x6 +NEON fmla.4s 128bit B            0.230    10941.9    10941.9 (  1 3.9)   10941.9 
-CPU part 0x802 +Average                          0.244    10374.7    10374.7 (  1 3.7)   10374.7 
-CPU revision 13+Highest                       :    0.225    11155.5    11155.5 (  1 4.0)   11155.5
  
-processor : 6 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0x6 
-CPU part : 0x802 
-CPU revision : 13 
  
-processor : 7 +* Group 1 Thread=4  Clock=2.803200 GHz  (mask:f0) 
-BogoMIPS 38.00 +* FPU/NEON (HP fp) multi-thread 
-Features fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-CPU implementer 0x51 +FPU fmul (16bit x1) n8        :    0.319    21091.6     5272.9 (  4 1.9)   21091.6 
-CPU architecture: 8 +FPU fadd (16bit x1) n8        :    0.319    21093.3     5273.3 (  4 1.9)   21093.3 
-CPU variant 0x6 +FPU fmadd (16bit x1) n8       :    0.402    33482.1     4185.3 (  8 1.5)   33482.1 
-CPU part 0x802 +NEON fmul.4h (16bit x4) n8    :    0.319    84378.9     5273.( 16 1.9)   84378.9 
-CPU revision 13+NEON fadd.4h (16bit x4) n8       0.319    84377.6     5273.6 ( 16 1.9)   84377.6 
 +NEON fmla.4h (16bit x4) n8       0.319   168729.8     5272.8 ( 32 1.9)  168729.8 
 +NEON fmul.8h (16bit x8) n8       0.638    84375.1     2636.7 ( 32 0.9)   84375.1 
 +NEON fadd.8h (16bit x8) n8       0.638    84376.7     2636.( 32 0.9)   84376.7 
 +NEON fmla.8h (16bit x8) n8       0.638   168712.1     2636.1 ( 64 0.9)  168712.1 
 +FPU fmul (16bit x1) ns4          0.488    13795.9     3449.0 (  4 1.2)   13795.9 
 +FPU fadd (16bit x1) ns4          0.484    13905.6     3476.4 (  4 1.2)   13905.6 
 +FPU fmadd (16bit x1) ns4      :    0.513    26236.3     3279.5 (  8 1.2)   26236.3 
 +NEON fmul.4h (16bit x4) ns4   :    0.483    55767.6     3485.5 ( 16 1.2)   55767.6 
 +NEON fadd.4h (16bit x4) ns4   :    0.486    55340.9     3458.8 ( 16 1.2)   55340.9 
 +NEON fmla.4h (16bit x4) ns4   :    0.797    67493.5     2109.2 ( 32 0.8)   67493.5 
 +NEON fmul.8h (16bit x8) ns4   :    0.638    84377.3     2636.8 ( 32 0.9)   84377.3 
 +NEON fadd.8h (16bit x8) ns4   :    0.638    84371.5     2636.6 ( 32 0.9)   84371.5 
 +NEON fmla.8h (16bit x8) ns4   :    0.797   134989.4     2109.2 ( 64 0.8)  134989.4 
 +FPU fmul (16bit x1) n1        :    0.319    21087.0     5271.7 (  4 1.9)   21087.0 
 +FPU fadd (16bit x1) n1        :    0.319    21092.7     5273.2 (  4 1.9)   21092.7 
 +FPU fmadd (16bit x1) n1       :    3.190     4218.3      527.3 (  8 0.2)    4218.3 
 +NEON fmul.4h (16bit x4) n1    :    0.319    84365.2     5272.8 ( 16 1.9)   84365.2 
 +NEON fadd.4h (16bit x4) n1    :    0.319    84375.2     5273.5 ( 16 1.9)   84375.2 
 +NEON fmla.4h (16bit x4) n1    :    1.914    28124.4      878.9 ( 32 0.3)   28124.4 
 +NEON fmul.8h (16bit x8) n1    :    0.638    84368.6     2636.5 ( 32 0.9)   84368.6 
 +NEON fadd.8h (16bit x8) n1    :    0.638    84377.3     2636.8 ( 32 0.9)   84377.3 
 +NEON fmla.8h (16bit x8) n1    :    1.914    56247.7      878.9 ( 64 0.3)   56247.7 
 +NEON fmul.8h (16bit x8) n12   :    0.957    84381.6     2636.9 ( 32 0.9)   84381.6 
 +NEON fadd.8h (16bit x8) n12   :    0.957    84385.7     2637.1 ( 32 0.9)   84385.7 
 +NEON fmla.8h (16bit x8) n12   :    0.957   168782.7     2637.2 ( 64 0.9)  168782.7 
 +Average                       :    0.722    69756.7     3388.8 ( 25 1.2)   69756.7 
 +Highest                       :    0.319   168782.7     5273.7 ( 64 1.9)  168782.7
  
-Hardware : Qualcomm Technologies, Inc SDM845 
  
-Qualcomm Technologies, Inc SDM845+* Group 1:  Thread=4  Clock=2.803200 GHz  (mask:f0) 
 +* FPU/NEON (SP fp) multi-thread 
 +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
 +FPU fmul (32bit x1) n8        :    0.319    21086.7     5271.7 (  4 1.9)   21086.7 
 +FPU fadd (32bit x1) n8        :    0.319    21087.6     5271.9 (  4 1.9)   21087.6 
 +FPU fmadd (32bit x1) n8       :    0.406    33132.2     4141.5 (  8 1.5)   33132.2 
 +NEON fmul.2s (32bit x2) n8    :    0.319    42174.9     5271.9 (  8 1.9)   42174.9 
 +NEON fadd.2s (32bit x2) n8    :    0.319    42174.9     5271.9 (  8 1.9)   42174.9 
 +NEON fmla.2s (32bit x2) n8    :    0.319    84342.4     5271.4 ( 16 1.9)   84342.4 
 +NEON fmul.4s (32bit x4) n8    :    0.638    42179.2     2636.2 ( 16 0.9)   42179.2 
 +NEON fadd.4s (32bit x4) n8    :    0.638    42174.4     2635.9 ( 16 0.9)   42174.4 
 +NEON fmla.4s (32bit x4) n8    :    0.638    84354.6     2636.1 ( 32 0.9)   84354.6 
 +FPU fmul (32bit x1) ns4       :    0.485    13858.1     3464.5 (  4 1.2)   13858.1 
 +FPU fadd (32bit x1) ns4       :    0.482    13947.6     3486.9 (  4 1.2)   13947.6 
 +FPU fmadd (32bit x1) ns4      :    0.506    26601.7     3325.2 (  8 1.2)   26601.7 
 +NEON fmul.2s (32bit x2) ns4   :    0.483    27842.4     3480.3 (  8 1.2)   27842.4 
 +NEON fadd.2s (32bit x2) ns4   :    0.485    27767.4     3470.9 (  8 1.2)   27767.4 
 +NEON fmla.2s (32bit x2) ns4   :    0.798    33741.7     2108.9 ( 16 0.8)   33741.7 
 +NEON fmul.4s (32bit x4) ns4   :    0.638    42177.0     2636.1 ( 16 0.9)   42177.0 
 +NEON fadd.4s (32bit x4) ns4   :    0.638    42179.5     2636.2 ( 16 0.9)   42179.5 
 +NEON fmla.4s (32bit x4) ns4   :    0.798    67483.6     2108.9 ( 32 0.8)   67483.6 
 +FPU fmul (32bit x1) n1        :    0.319    21089.6     5272.4 (  4 1.9)   21089.6 
 +FPU fadd (32bit x1) n1        :    0.319    21087.5     5271.9 (  4 1.9)   21087.5 
 +FPU fmadd (32bit x1) n1       :    3.190     4217.8      527.2 (  8 0.2)    4217.8 
 +NEON fmul.2s (32bit x2) n1    :    0.319    42178.2     5272.3 (  8 1.9)   42178.2 
 +NEON fadd.2s (32bit x2) n1    :    0.319    42181.3     5272.7 (  8 1.9)   42181.3 
 +NEON fmla.2s (32bit x2) n1    :    1.914    14060.8      878.8 ( 16 0.3)   14060.8 
 +NEON fmul.4s (32bit x4) n1    :    0.638    42178.1     2636.1 ( 16 0.9)   42178.1 
 +NEON fadd.4s (32bit x4) n1    :    0.638    42178.8     2636.2 ( 16 0.9)   42178.8 
 +NEON fmla.4s (32bit x4) n1    :    1.914    28124.7      878.9 ( 32 0.3)   28124.7 
 +NEON fmul.4s (32bit x4) n12   :    0.957    42188.5     2636.8 ( 16 0.9)   42188.5 
 +NEON fadd.4s (32bit x4) n12   :    0.957    42180.8     2636.3 ( 16 0.9)   42180.8 
 +NEON fmla.4s (32bit x4) n12   :    0.957    84399.7     2637.5 ( 32 0.9)   84399.7 
 +Average                       :    0.722    37812.4     3389.4 ( 13 1.2)   37812.4 
 +Highest                       :    0.319    84399.7     5272.7 ( 32 1.9)   84399.7 
 + 
 + 
 +* Group 1:  Thread=4  Clock=2.803200 GHz  (mask:f0) 
 +* FPU/NEON (DP fp) multi-thread 
 +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
 +FPU fmul (64bit x1) n8        :    0.319    21091.0     5272.7 (  4 1.9)   21091.0 
 +FPU fadd (64bit x1) n8        :    0.319    21089.9     5272.5 (  4 1.9)   21089.9 
 +FPU fmadd (64bit x1) n8       :    0.414    32502.3     4062.8 (  8 1.4)   32502.3 
 +NEON fmul.2d (64bit x2) n8    :    0.638    21084.7     2635.6 (  8 0.9)   21084.7 
 +NEON fadd.2d (64bit x2) n8    :    0.638    21092.6     2636.6 (  8 0.9)   21092.6 
 +NEON fmla.2d (64bit x2) n8    :    0.649    41472.2     2592.0 ( 16 0.9)   41472.2 
 +FPU fmul (64bit x1) ns4       :    0.485    13871.9     3468.0 (  4 1.2)   13871.9 
 +FPU fadd (64bit x1) ns4       :    0.493    13653.8     3413.5 (  4 1.2)   13653.8 
 +FPU fmadd (64bit x1) ns4      :    0.504    26674.3     3334.3 (  8 1.2)   26674.3 
 +NEON fmul.2d (64bit x2) ns4   :    0.640    21035.6     2629.4 (  8 0.9)   21035.6 
 +NEON fadd.2d (64bit x2) ns4   :    0.641    20989.8     2623.7 (  8 0.9)   20989.8 
 +NEON fmla.2d (64bit x2) ns4   :    0.806    33376.9     2086.1 ( 16 0.7)   33376.9 
 +FPU fmul (64bit x1) n1        :    0.324    20789.9     5197.5 (  4 1.9)   20789.9 
 +FPU fadd (64bit x1) n1        :    0.329    20459.1     5114.8 (  4 1.8)   20459.1 
 +FPU fmadd (64bit x1) n1       :    3.190     4217.4      527.2 (  8 0.2)    4217.4 
 +NEON fmul.2d (64bit x2) n1    :    0.638    21089.3     2636.2 (  8 0.9)   21089.3 
 +NEON fadd.2d (64bit x2) n1    :    0.638    21088.4     2636.1 (  8 0.9)   21088.4 
 +NEON fmla.2d (64bit x2) n1    :    1.914    14062.3      878.9 ( 16 0.3)   14062.3 
 +NEON fmul.2d (64bit x2) n12   :    0.957    21085.9     2635.7 (  8 0.9)   21085.9 
 +NEON fadd.2d (64bit x2) n12   :    0.957    21085.8     2635.7 (  8 0.9)   21085.8 
 +NEON fmla.2d (64bit x2) n12   :    0.979    41232.4     2577.0 ( 16 0.9)   41232.4 
 +Average                       :    0.784    22526.0     3088.9 (  8 1.1)   22526.0 
 +Highest                       :    0.319    41472.2     5272.7 ( 16 1.9)   41472.2 
 + 
 + 
 +* Group 1:  Thread=4  Clock=2.803200 GHz  (mask:f0) 
 +* Matrix 4x4 multi-thread 
 +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
 +C++ code                      :    0.327    30720.8     7680.2 (  4 2.7)   30720.8 
 +NEON fmla.4s 128bit A         :    0.263    38229.5     9557.4 (  4 3.4)   38229.5 
 +NEON fmla.4s 128bit B         :    0.269    37384.5     9346.1 (  4 3.3)   37384.5 
 +Average                       :    0.286    35444.9     8861.2 (  4 3.2)   35444.9 
 +Highest                       :    0.263    38229.5     9557.4 (  4 3.4)   38229.5 
  
-2019/01/05 13:42:09  
 </code> </code>
  
opengl/vfpbenchlog.txt · 最終更新: 2020/12/30 23:46 by oga

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki