ユーザ用ツール

サイト用ツール


opengl:vfpbenchlog

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
次のリビジョン両方とも次のリビジョン
opengl:vfpbenchlog [2019/02/17 01:02] – [結果一覧] ogaopengl:vfpbenchlog [2019/06/16 01:07] – [Qualcomm Kryo 280 (Cortex-A73) (ARMv8A AArch64 arm64) FPU+ASIMD] oga
行 9223: 行 9223:
  
  
-==== Qualcomm Kryo 385 (Cortex-A55) (ARMv8.2A AArch64 arm64) FPU+ASIMD+HALFFP ==== 
  
-++++Pixel 3 Snapdragon 845 little core Kryo 385 1.76GHz x4 ARM64 (AArch64) Android 9.0|+==== Qualcomm Kryo 280 (Cortex-A73 A53) (ARMv8A AArch64 arm64) FPU+ASIMD ==== 
 + 
 + 
 +++++Essential Phone PH-1 Snapdragon 835 Kryo 280 2.45GHz x4 + 1.9GHz x4 ARM64 (AArch64) Android 9.0|
  
 <code> <code>
-ARCH: ARMv8A 3 +ARCH: ARMv8A AArch64 
-FPU: AArch64 NEON +FPU : ASIMD(AArch64 NEON) 
-SingleT SP max: 13.701 GFLOPS +Name: Qualcomm Technologies, Inc MSM8998 
-SingleT DP max: 6.859 GFLOPS + 
-MultiT  SP max: 54.948 GFLOPS +CPU Thread: 
-MultiT  DP max: 27.386 GFLOPS +CPU Core  :  8 
-CPU core: 4 +CPU Group :  2 
-FPHP  : yes +  Group 0: Thread= 4  Clock=1.900800 GHz  (mask:f) 
-SIMDHPyes+  Group 1: Thread= 4  Clock=2.457600 GHz  (mask:f0) 
 +NEON  : yes 
 +FMA   : yes 
 +FPHP  : no 
 +SIMDHP: no 
 + 
 +Total: 
 +SingleThread HP max: - 
 +SingleThread SP max:   34.353 GFLOPS 
 +SingleThread DP max:   17.178 GFLOPS 
 +MultiThread  HP max: - 
 +MultiThread  SP max:  129.511 GFLOPS 
 +MultiThread  DP max:   67.329 GFLOPS 
 + 
 +Group 0 Thread= Clock=1.900800 GHz  (mask:f) 
 +  SingleThread HP max- 
 +  SingleThread SP max  14.806 GFLOPS 
 +  SingleThread DP max:    7.406 GFLOPS 
 +  MultiThread  HP max: - 
 +  MultiThread  SP max:   59.267 GFLOPS 
 +  MultiThread  DP max:   29.639 GFLOPS 
 + 
 +Group 1:  Thread=4  Clock=2.457600 GHz  (mask:f0) 
 +  SingleThread HP max: - 
 +  SingleThread SP max:   19.547 GFLOPS 
 +  SingleThread DP max:    9.772 GFLOPS 
 +  MultiThread  HP max: - 
 +  MultiThread  SP max:   70.244 GFLOPS 
 +  MultiThread  DP max:   37.690 GFLOPS 
  
-* FPU/NEON (single fp)+* Group 0:  Thread=1  Clock=1.900800 GHz  (mask:f) 
 +* FPU/NEON (SP fp)
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-FPU fmul (32bit x1) n8        :    0.396     3031.    3031.(  1 1.7)    3031.5 +FPU fmul (32bit x1) n8        :    0.319     3574.    3574.(  1 1.9)    3574.0 
-FPU fadd (32bit x1) n8        :    0.362     3318.    3318.(  1 1.9)    3318.3 +FPU fadd (32bit x1) n8        :    0.334     3415.    3415.(  1 1.8)    3415.8 
-FPU fmadd (32bit x1) n8       :    0.361     6648.    3324.(  2 1.9)    6648.5 +FPU fmadd (32bit x1) n8       :    0.621     3675.    1837.(  2 1.0)    3675.2 
-NEON fmul.2s (32bit x2) n8    :    0.378     6348.    3174.(  2 1.8)    6348.4 +NEON fmul.2s (32bit x2) n8    :    0.334     6821.    3410.(  2 1.8)    6821.6 
-NEON fadd.2s (32bit x2) n8    :    0.361     6643.    3321.(  2 1.9)    6643.3 +NEON fadd.2s (32bit x2) n8    :    0.335     6807.    3403.(  2 1.8)    6807.5 
-NEON fmla.2s (32bit x2) n8    :    0.378    12691.    3172.(  4 1.8)   12691.6 +NEON fmla.2s (32bit x2) n8    :    0.334    13676.    3419.(  4 1.8)   13676.0 
-NEON fmul.4s (32bit x4) n8    :    0.705     6810.    1702.(  4 1.0)    6810.6 +NEON fmul.4s (32bit x4) n8    :    0.623     7325.    1831.(  4 1.0)    7325.9 
-NEON fadd.4s (32bit x4) n8    :    0.705     6804.    1701.(  4 1.0)    6804.8 +NEON fadd.4s (32bit x4) n8    :    0.628     7258.    1814.(  4 1.0)    7258.5 
-NEON fmla.4s (32bit x4) n8    :    0.705    13619.    1702.(  8 1.0)   13619.2 +NEON fmla.4s (32bit x4) n8    :    0.622    14677.    1834.(  8 1.0)   14677.4 
-FPU fmul (32bit x1) ns4       :    0.688     1745.    1745.(  1 1.0)    1745.1 +FPU fmul (32bit x1) ns4       :    0.607     1879.    1879.(  1 1.0)    1879.9 
-FPU fadd (32bit x1) ns4       :    0.688     1745.    1745.(  1 1.0)    1745.1 +FPU fadd (32bit x1) ns4       :    0.608     1874.    1874.(  1 1.0)    1874.4 
-FPU fmadd (32bit x1) ns4      :    0.688     3488.    1744.(  2 1.0)    3488.5 +FPU fmadd (32bit x1) ns4      :    0.685     3328.    1664.(  2 0.9)    3328.0 
-NEON fmul.2s (32bit x2) ns4   :    0.689     3484.1     1742.(  2 1.0)    3484.1 +NEON fmul.2s (32bit x2) ns4   :    0.606     3761.1     1880.(  2 1.0)    3761.1 
-NEON fadd.2s (32bit x2) ns4   :    0.690     3479.    1739.6 (  2 1.0)    3479.1 +NEON fadd.2s (32bit x2) ns4   :    0.606     3763.    1881.6 (  2 1.0)    3763.2 
-NEON fmla.2s (32bit x2) ns4   :    0.692     6937.5     1734.(  4 1.0)    6937.5 +NEON fmla.2s (32bit x2) ns4   :    1.212     3763.5      940.(  4 0.5)    3763.5 
-NEON fmul.4s (32bit x4) ns4   :    0.711     6753.    1688.(  4 1.0)    6753.1 +NEON fmul.4s (32bit x4) ns4   :    0.621     7346.    1836.(  4 1.0)    7346.7 
-NEON fadd.4s (32bit x4) ns4   :    0.708     6781.7     1695.4 (  4 1.0)    6781.7 +NEON fadd.4s (32bit x4) ns4   :    0.621     7341.7     1835.4 (  4 1.0)    7341.7 
-NEON fmla.4s (32bit x4) ns4   :    0.706    13594.8     1699.(  8 1.0)   13594.8 +NEON fmla.4s (32bit x4) ns4   :    1.215     7511.8      939.(  8 0.5   7511.8 
-FPU fmul (32bit x1) n1        :    0.688     1743.    1743.(  1 1.0)    1743.0 +FPU fmul (32bit x1) n1        :    0.607     1878.    1878.(  1 1.0)    1878.9 
-FPU fadd (32bit x1) n1        :    0.690     1739.    1739.(  1 1.0)    1739.2 +FPU fadd (32bit x1) n1        :    0.606     1881.    1881.(  1 1.0)    1881.4 
-FPU fmadd (32bit x1) n1       :    2.753      871.     435.(  2 0.2)     871.9 +FPU fmadd (32bit x1) n1       :    4.848      470.     235.(  2 0.1)     470.5 
-NEON fmul.2s (32bit x2) n1    :    0.688     3488.    1744.(  2 1.0)    3488.3 +NEON fmul.2s (32bit x2) n1    :    0.606     3763.    1881.(  2 1.0)    3763.0 
-NEON fadd.2s (32bit x2) n1    :    0.688     3487.    1743.(  2 1.0)    3487.0 +NEON fadd.2s (32bit x2) n1    :    0.606     3765.    1882.(  2 1.0)    3765.6 
-NEON fmla.2s (32bit x2) n1    :    2.754     1742.     435.(  4 0.2)    1742.8 +NEON fmla.2s (32bit x2) n1    :    2.424     1882.     470.(  4 0.2)    1882.0 
-NEON fmul.4s (32bit x4) n1    :    0.706     6798.    1699.7 (  4 1.0)    6798.9 +NEON fmul.4s (32bit x4) n1    :    0.621     7342.    1835.7 (  4 1.0)    7342.7 
-NEON fadd.4s (32bit x4) n1    :    0.706     6797.    1699.3 (  4 1.0)    6797.1 +NEON fadd.4s (32bit x4) n1    :    0.623     7321.    1830.3 (  4 1.0)    7321.4 
-NEON fmla.4s (32bit x4) n1    :    2.757     3482.     435.(  8 0.2)    3482.1 +NEON fmla.4s (32bit x4) n1    :    2.428     3757.     469.(  8 0.2)    3757.9 
-NEON fmul.4s (32bit x4) n12   :    1.050     6860.    1715.(  4 1.0)    6860.4 +NEON fmul.4s (32bit x4) n12   :    0.926     7393.    1848.(  4 1.0)    7393.5 
-NEON fadd.4s (32bit x4) n12   :    1.050     6856.    1714.(  4 1.0)    6856.1 +NEON fadd.4s (32bit x4) n12   :    0.925     7398.    1849.(  4 1.0)    7398.8 
-NEON fmla.4s (32bit x4) n12   :    1.051    13700.    1712.(  8 1.0)   13700.7 +NEON fmla.4s (32bit x4) n12   :    0.924    14806.    1850.(  8 1.0)   14806.5 
-Average                       :    0.873     5716.    1893.3 (  3 1.1)    5716.4 +Average                       :    0.903     5648.    1906.3 (  3 1.0)    5648.8 
-Highest                       :    0.361    13700.    3324.(  8 1.9)   13700.7+Highest                       :    0.319    14806.    3574.(  8 1.9)   14806.5
  
  
-* FPU/NEON (double fp)+* Group 0:  Thread=1  Clock=1.900800 GHz  (mask:f) 
 +* FPU/NEON (DP fp)
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-FPU fmul (64bit x1) n8        :    0.377     3179.    3179.(  1 1.8)    3179.8 +FPU fmul (64bit x1) n8        :    0.336     3397.    3397.(  1 1.8)    3397.5 
-FPU fadd (64bit x1) n8        :    0.381     3151.    3151.(  1 1.8)    3151.9 +FPU fadd (64bit x1) n8        :    0.323     3529.    3529.(  1 1.9)    3529.5 
-FPU fmadd (64bit x1) n8       :    0.380     6317.    3158.(  2 1.8)    6317.6 +FPU fmadd (64bit x1) n8       :    0.607     3755.    1877.(  2 1.0)    3755.4 
-NEON fmul.2d (64bit x2) n8    :    0.706     3399.    1699.(  2 1.0)    3399.5 +NEON fmul.2d (64bit x2) n8    :    0.622     3664.    1832.(  2 1.0)    3664.8 
-NEON fadd.2d (64bit x2) n8    :    0.706     3401.    1700.(  2 1.0)    3401.4 +NEON fadd.2d (64bit x2) n8    :    0.626     3646.    1823.(  2 1.0)    3646.5 
-NEON fmla.2d (64bit x2) n8    :    0.706     6800.3     1700.(  4 1.0)    6800.3 +NEON fmla.2d (64bit x2) n8    :    0.622     7331.3     1832.(  4 1.0)    7331.3 
-FPU fmul (64bit x1) ns4       :    0.688     1743.    1743.(  1 1.0)    1743.9 +FPU fmul (64bit x1) ns4       :    0.606     1881.    1881.(  1 1.0)    1881.0 
-FPU fadd (64bit x1) ns4       :    0.689     1741.    1741.(  1 1.0)    1741.5 +FPU fadd (64bit x1) ns4       :    0.607     1879.    1879.(  1 1.0)    1879.0 
-FPU fmadd (64bit x1) ns4      :    0.689     3483.    1741.(  2 1.0)    3483.2 +FPU fmadd (64bit x1) ns4      :    0.608     3750.    1875.(  2 1.0)    3750.0 
-NEON fmul.2d (64bit x2) ns4   :    0.706     3399.    1699.8 (  2 1.0)    3399.6 +NEON fmul.2d (64bit x2) ns4   :    0.623     3661.    1830.8 (  2 1.0)    3661.5 
-NEON fadd.2d (64bit x2) ns4   :    0.707     3395.    1697.(  2 1.0)    3395.2 +NEON fadd.2d (64bit x2) ns4   :    0.621     3671.    1835.(  2 1.0)    3671.3 
-NEON fmla.2d (64bit x2) ns4   :    0.705     6806.5     1701.(  4 1.0)    6806.5 +NEON fmla.2d (64bit x2) ns4   :    1.215     3754.9      938.(  4 0.5)    3754.9 
-FPU fmul (64bit x1) n1        :    0.689     1742.    1742.(  1 1.0)    1742.5 +FPU fmul (64bit x1) n1        :    0.606     1881.    1881.(  1 1.0)    1881.6 
-FPU fadd (64bit x1) n1        :    0.689     1742.    1742.(  1 1.0)    1742.3 +FPU fadd (64bit x1) n1        :    0.606     1881.    1881.(  1 1.0)    1881.2 
-FPU fmadd (64bit x1) n1       :    2.754      871.     435.(  2 0.2)     871.5 +FPU fmadd (64bit x1) n1       :    4.854      469.     234.(  2 0.1)     469.9 
-NEON fmul.2d (64bit x2) n1    :    0.706     3399.8     1699.(  2 1.0)    3399.8 +NEON fmul.2d (64bit x2) n1    :    0.632     3610.8     1805.(  2 0.9)    3610.8 
-NEON fadd.2d (64bit x2) n1    :    0.709     3387.    1693.(  2 1.0)    3387.2 +NEON fadd.2d (64bit x2) n1    :    0.620     3680.    1840.(  2 1.0)    3680.9 
-NEON fmla.2d (64bit x2) n1    :    2.754     1742.     435.(  4 0.2)    1742.8 +NEON fmla.2d (64bit x2) n1    :    2.429     1878.     469.(  4 0.2)    1878.1 
-NEON fmul.2d (64bit x2) n12   :    1.050     3429.    1714.(  2 1.0)    3429.4 +NEON fmul.2d (64bit x2) n12   :    0.925     3698.    1849.(  2 1.0)    3698.7 
-NEON fadd.2d (64bit x2) n12   :    1.051     3426.    1713.(  2 1.0)    3426.6 +NEON fadd.2d (64bit x2) n12   :    0.924     3703.    1851.(  2 1.0)    3703.2 
-NEON fmla.2d (64bit x2) n12   :    1.050     6858.    1714.6 (  4 1.0)    6858.5 +NEON fmla.2d (64bit x2) n12   :    0.924     7406.    1851.6 (  4 1.0)    7406.2 
-Average                       :    0.900     3496.    1800.(  2 1.0)    3496.2 +Average                       :    0.949     3434.    1819.(  2 1.0)    3434.9 
-Highest                       :    0.377     6858.    3179.(  4 1.8)    6858.5+Highest                       :    0.323     7406.    3529.(  4 1.9)    7406.2
  
  
 +* Group 0:  Thread=1  Clock=1.900800 GHz  (mask:f)
 * Matrix 4x4 * Matrix 4x4
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-C++ code                      :    0.412     4345.    4345.(  1 2.5)    4345.1 +C++ code                      :    0.426     3998.    3998.(  1 2.1)    3998.6 
-NEON fmla.4s 128bit A         :    0.771     2323.    2323.(  1 1.3)    2323.2 +NEON fmla.4s 128bit A         :    0.714     2385.    2385.(  1 1.3)    2385.9 
-NEON fmla.4s 128bit B         :    0.374     4790.    4790.(  1 2.7)    4790.6 +NEON fmla.4s 128bit B         :    0.350     4870.    4870.(  1 2.6)    4870.7 
-Average                       :    0.519     3819.    3819.(  1 2.2)    3819.6 +Average                       :    0.496     3751.    3751.(  1 2.0)    3751.7 
-Highest                       :    0.374     4790.    4790.(  1 2.7)    4790.6+Highest                       :    0.350     4870.    4870.(  1 2.6)    4870.7
  
  
-* FPU/NEON (single fp) multi-thread+* Group 0:  Thread=4  Clock=1.900800 GHz  (mask:f) 
 +* FPU/NEON (SP fp) multi-thread
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-FPU fmul (32bit x1) n8        :    0.393    12208.    3052.(  4 1.7)   12208.3 +FPU fmul (32bit x1) n8        :    0.318    14335.    3583.(  4 1.9)   14335.7 
-FPU fadd (32bit x1) n8        :    0.363    13232.    3308.(  4 1.9)   13232.9 +FPU fadd (32bit x1) n8        :    0.333    13704.    3426.(  4 1.8)   13704.3 
-FPU fmadd (32bit x1) n8       :    0.363    26410.    3301.(  8 1.9)   26410.1 +FPU fmadd (32bit x1) n8       :    0.620    14727.    1840.(  8 1.0)   14727.6 
-NEON fmul.2s (32bit x2) n8    :    0.383    25035.    3129.(  8 1.8)   25035.2 +NEON fmul.2s (32bit x2) n8    :    0.333    27405.    3425.(  8 1.8)   27405.8 
-NEON fadd.2s (32bit x2) n8    :    0.362    26526.    3315.(  8 1.9)   26526.6 +NEON fadd.2s (32bit x2) n8    :    0.334    27323.    3415.(  8 1.8)   27323.1 
-NEON fmla.2s (32bit x2) n8    :    0.384    50053.    3128.( 16 1.8)   50053.8 +NEON fmla.2s (32bit x2) n8    :    0.339    53820.    3363.( 16 1.8)   53820.0 
-NEON fmul.4s (32bit x4) n8    :    0.705    27222.    1701.4 ( 16 1.0)   27222.9 +NEON fmul.4s (32bit x4) n8    :    0.622    29351.    1834.4 ( 16 1.0)   29351.1 
-NEON fadd.4s (32bit x4) n8    :    0.720    26648.    1665.( 16 0.9)   26648.3 +NEON fadd.4s (32bit x4) n8    :    0.622    29337.    1833.( 16 1.0)   29337.7 
-NEON fmla.4s (32bit x4) n8    :    0.708    54231.1     1694.( 32 1.0)   54231.1 +NEON fmla.4s (32bit x4) n8    :    0.621    58795.1     1837.( 32 1.0)   58795.1 
-FPU fmul (32bit x1) ns4       :    0.691     6944.    1736.(  4 1.0)    6944.1 +FPU fmul (32bit x1) ns4       :    0.616     7401.    1850.(  4 1.0)    7401.8 
-FPU fadd (32bit x1) ns4       :    0.689     6965.    1741.(  4 1.0)    6965.7 +FPU fadd (32bit x1) ns4       :    0.606     7530.    1882.(  4 1.0)    7530.2 
-FPU fmadd (32bit x1) ns4      :    0.688    13949.    1743.(  8 1.0)   13949.1 +FPU fmadd (32bit x1) ns4      :    0.681    13398.    1674.(  8 0.9)   13398.8 
-NEON fmul.2s (32bit x2) ns4   :    0.687    13980.    1747.(  8 1.0)   13980.1 +NEON fmul.2s (32bit x2) ns4   :    0.606    15060.    1882.(  8 1.0)   15060.4 
-NEON fadd.2s (32bit x2) ns4   :    0.704    13643.    1705.(  8 1.0)   13643.3 +NEON fadd.2s (32bit x2) ns4   :    0.606    15044.    1880.(  8 1.0)   15044.6 
-NEON fmla.2s (32bit x2) ns4   :    0.693    27724.8     1732.( 16 1.0)   27724.8 +NEON fmla.2s (32bit x2) ns4   :    1.213    15046.6      940.( 16 0.5)   15046.6 
-NEON fmul.4s (32bit x4) ns4   :    0.704    27275.    1704.( 16 1.0)   27275.6 +NEON fmul.4s (32bit x4) ns4   :    0.621    29394.    1837.( 16 1.0)   29394.4 
-NEON fadd.4s (32bit x4) ns4   :    0.706    27179.    1698.( 16 1.0)   27179.5 +NEON fadd.4s (32bit x4) ns4   :    0.622    29352.    1834.( 16 1.0)   29352.1 
-NEON fmla.4s (32bit x4) ns4   :    0.704    54563.8     1705.( 32 1.0)   54563.8 +NEON fmla.4s (32bit x4) ns4   :    1.219    29926.9      935.( 32 0.5)   29926.9 
-FPU fmul (32bit x1) n1        :    0.688     6977.    1744.4 (  4 1.0)    6977.6 +FPU fmul (32bit x1) n1        :    0.608     7505.    1876.4 (  4 1.0)    7505.8 
-FPU fadd (32bit x1) n1        :    0.688     6976.    1744.(  4 1.0)    6976.2 +FPU fadd (32bit x1) n1        :    0.606     7528.    1882.(  4 1.0)    7528.7 
-FPU fmadd (32bit x1) n1       :    2.752     3488.     436.(  8 0.2)    3488.4 +FPU fmadd (32bit x1) n1       :    4.859     1877.     234.(  8 0.1)    1877.9 
-NEON fmul.2s (32bit x2) n1    :    0.689    13937.    1742.(  8 1.0)   13937.2 +NEON fmul.2s (32bit x2) n1    :    0.616    14812.    1851.(  8 1.0)   14812.3 
-NEON fadd.2s (32bit x2) n1    :    0.688    13955.    1744.(  8 1.0)   13955.2 +NEON fadd.2s (32bit x2) n1    :    0.605    15074.    1884.(  8 1.0)   15074.0 
-NEON fmla.2s (32bit x2) n1    :    2.750     6982.     436.( 16 0.2)    6982.3 +NEON fmla.2s (32bit x2) n1    :    2.433     7500.     468.( 16 0.2)    7500.4 
-NEON fmul.4s (32bit x4) n1    :    0.704    27255.    1703.( 16 1.0)   27255.8 +NEON fmul.4s (32bit x4) n1    :    0.630    28977.    1811.( 16 1.0)   28977.6 
-NEON fadd.4s (32bit x4) n1    :    0.706    27191.    1699.( 16 1.0)   27191.7 +NEON fadd.4s (32bit x4) n1    :    0.622    29345.    1834.( 16 1.0)   29345.1 
-NEON fmla.4s (32bit x4) n1    :    2.764    13891.     434.( 32 0.2)   13891.8 +NEON fmla.4s (32bit x4) n1    :    2.434    14996.     468.( 32 0.2)   14996.4 
-NEON fmul.4s (32bit x4) n12   :    1.050    27432.7     1714.( 16 1.0)   27432.7 +NEON fmul.4s (32bit x4) n12   :    0.935    29289.7     1830.( 16 1.0)   29289.7 
-NEON fadd.4s (32bit x4) n12   :    1.050    27433.    1714.( 16 1.0)   27433.8 +NEON fadd.4s (32bit x4) n12   :    0.923    29648.    1853.( 16 1.0)   29648.5 
-NEON fmla.4s (32bit x4) n12   :    1.048    54948.    1717.1 ( 32 1.0)   54948.4 +NEON fmla.4s (32bit x4) n12   :    0.924    59267.    1852.1 ( 32 1.0)   59267.3 
-Average                       :    0.874    22808.    1888.( 13 1.1)   22808.9 +Average                       :    0.904    22559.    1904.( 13 1.0)   22559.3 
-Highest                       :    0.362    54948.    3315.( 32 1.9)   54948.4+Highest                       :    0.318    59267.    3583.( 32 1.9)   59267.3
  
  
-* FPU/NEON (double fp) multi-thread+* Group 0:  Thread=4  Clock=1.900800 GHz  (mask:f) 
 +* FPU/NEON (DP fp) multi-thread
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-FPU fmul (64bit x1) n8        :    0.377    12737.    3184.(  4 1.8)   12737.2 +FPU fmul (64bit x1) n8        :    0.336    13593.    3398.(  4 1.8)   13593.7 
-FPU fadd (64bit x1) n8        :    0.379    12652.    3163.(  4 1.8)   12652.6 +FPU fadd (64bit x1) n8        :    0.323    14139.    3534.(  4 1.9)   14139.0 
-FPU fmadd (64bit x1) n8       :    0.386    24901.    3112.(  8 1.8)   24901.6 +FPU fmadd (64bit x1) n8       :    0.606    15065.    1883.(  8 1.0)   15065.8 
-NEON fmul.2d (64bit x2) n8    :    0.707    13571.    1696.(  8 1.0)   13571.8 +NEON fmul.2d (64bit x2) n8    :    0.621    14688.    1836.(  8 1.0)   14688.0 
-NEON fadd.2d (64bit x2) n8    :    0.707    13570.    1696.(  8 1.0)   13570.5 +NEON fadd.2d (64bit x2) n8    :    0.621    14690.    1836.(  8 1.0)   14690.9 
-NEON fmla.2d (64bit x2) n8    :    0.709    27085.    1692.( 16 1.0)   27085.1 +NEON fmla.2d (64bit x2) n8    :    0.621    29407.    1838.( 16 1.0)   29407.3 
-FPU fmul (64bit x1) ns4       :    0.692     6937.    1734.(  4 1.0)    6937.9 +FPU fmul (64bit x1) ns4       :    0.605     7536.    1884.(  4 1.0)    7536.0 
-FPU fadd (64bit x1) ns4       :    0.690     6954.    1738.(  4 1.0)    6954.9 +FPU fadd (64bit x1) ns4       :    0.606     7532.    1883.(  4 1.0)    7532.2 
-FPU fmadd (64bit x1) ns4      :    0.691    13893.    1736.(  8 1.0)   13893.6 +FPU fmadd (64bit x1) ns4      :    0.606    15057.    1882.(  8 1.0)   15057.1 
-NEON fmul.2d (64bit x2) ns4   :    0.706    13598.    1699.(  8 1.0)   13598.6 +NEON fmul.2d (64bit x2) ns4   :    0.622    14660.    1832.(  8 1.0)   14660.2 
-NEON fadd.2d (64bit x2) ns4   :    0.706    13607.    1700.(  8 1.0)   13607.3 +NEON fadd.2d (64bit x2) ns4   :    0.621    14700.    1837.(  8 1.0)   14700.2 
-NEON fmla.2d (64bit x2) ns4   :    0.706    27205.9     1700.4 ( 16 1.0)   27205.9 +NEON fmla.2d (64bit x2) ns4   :    1.212    15061.8      941.4 ( 16 0.5)   15061.8 
-FPU fmul (64bit x1) n1        :    0.695     6906.    1726.(  4 1.0)    6906.3 +FPU fmul (64bit x1) n1        :    0.605     7534.    1883.(  4 1.0)    7534.9 
-FPU fadd (64bit x1) n1        :    0.687     6983.    1746.(  4 1.0)    6983.9 +FPU fadd (64bit x1) n1        :    0.605     7535.    1883.(  4 1.0)    7535.5 
-FPU fmadd (64bit x1) n1       :    2.751     3490.     436.3 (  8 0.2)    3490.2 +FPU fmadd (64bit x1) n1       :    4.867     1874.     234.3 (  8 0.1)    1874.5 
-NEON fmul.2d (64bit x2) n1    :    0.706    13591.    1698.(  8 1.0)   13591.6 +NEON fmul.2d (64bit x2) n1    :    0.621    14702.    1837.(  8 1.0)   14702.7 
-NEON fadd.2d (64bit x2) n1    :    0.710    13522.    1690.3 (  8 1.0)   13522.7 +NEON fadd.2d (64bit x2) n1    :    0.621    14698.    1837.3 (  8 1.0)   14698.1 
-NEON fmla.2d (64bit x2) n1    :    2.752     6976.     436.( 16 0.2)    6976.4 +NEON fmla.2d (64bit x2) n1    :    2.424     7527.     470.( 16 0.2)    7527.5 
-NEON fmul.2d (64bit x2) n12   :    1.048    13743.    1717.(  8 1.0)   13743.6 +NEON fmul.2d (64bit x2) n12   :    0.923    14822.    1852.(  8 1.0)   14822.0 
-NEON fadd.2d (64bit x2) n12   :    1.050    13718.    1714.8 (  8 1.0)   13718.1 +NEON fadd.2d (64bit x2) n12   :    0.934    14646.    1830.8 (  8 1.0)   14646.4 
-NEON fmla.2d (64bit x2) n12   :    1.052    27385.    1711.( 16 1.0)   27385.7 +NEON fmla.2d (64bit x2) n12   :    0.924    29638.    1852.( 16 1.0)   29638.6 
-Average                       :    0.900    13954.    1796.(  8 1.0)   13954.1 +Average                       :    0.949    13767.    1822.(  8 1.0)   13767.3 
-Highest                       :    0.377    27385.    3184.( 16 1.8)   27385.7+Highest                       :    0.323    29638.    3534.( 16 1.9)   29638.6
  
  
 +* Group 0:  Thread=4  Clock=1.900800 GHz  (mask:f)
 * Matrix 4x4 multi-thread * Matrix 4x4 multi-thread
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-C++ code                      :    0.421    17033.    4258.(  4 2.4)   17033.9 +C++ code                      :    0.436    15639.    3909.(  4 2.1)   15639.0 
-NEON fmla.4s 128bit A         :    0.769     9320.    2330.(  4 1.3)    9320.7 +NEON fmla.4s 128bit A         :    0.713     9552.    2388.(  4 1.3)    9552.5 
-NEON fmla.4s 128bit B         :    0.373    19223.    4805.8 (  4 2.7)   19223.3 +NEON fmla.4s 128bit B         :    0.348    19563.    4890.8 (  4 2.6)   19563.4 
-Average                       :    0.521    15192.    3798.(  4 2.2)   15192.6 +Average                       :    0.499    14918.    3729.(  4 2.0)   14918.3 
-Highest                       :    0.373    19223.    4805.8 (  4 2.7)   19223.3+Highest                       :    0.348    19563.    4890.8 (  4 2.6)   19563.4
  
  
-cpu0  1766400 300000 +* Group 1:  Thread=1  Clock=2.457600 GHz  (mask:f0) 
-cpu1  1766400 300000 +* FPU/NEON (SP fp) 
-cpu2  1766400 300000 +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-cpu3  1766400 300000 +FPU fmul (32bit x1) n8        :    0.317     4653.5     4653.5 (  1 1.9)    4653.5 
-cpu4  2803200 825600 +FPU fadd (32bit x1) n8        :    0.317     4654.9     4654.9 (  1 1.9)    4654.9 
-cpu5  2803200 825600 +FPU fmadd (32bit x1) n8       :    0.604     4884.5     2442.3 (  2 1.0)    4884.5 
-cpu6  2803200 825600 +NEON fmul.2s (32bit x2) n8    :    0.317     9309.0     4654.5 (  2 1.9)    9309.0 
-cpu7  2803200 825600+NEON fadd.2s (32bit x2) n8    :    0.317     9309.8     4654.9 (  2 1.9)    9309.8 
 +NEON fmla.2s (32bit x2) n8    :    0.329    17927.5     4481.9 (  4 1.8)   17927.5 
 +NEON fmul.4s (32bit x4) n8    :    0.603     9774.3     2443.6 (  4 1.0)    9774.3 
 +NEON fadd.4s (32bit x4) n8    :    0.603     9774.1     2443.5 (  4 1.0)    9774.1 
 +NEON fmla.4s (32bit x4) n8    :    0.603    19546.8     2443.4 (  8 1.0)   19546.8 
 +FPU fmul (32bit x1) ns4       :    0.603     2443.4     2443.4 (  1 1.0)    2443.4 
 +FPU fadd (32bit x1) ns4       :    0.604     2442.5     2442.5 (  1 1.0)    2442.5 
 +FPU fmadd (32bit x1) ns4      :    0.755     3908.4     1954.2 (  2 0.8)    3908.4 
 +NEON fmul.2s (32bit x2) ns4   :    0.603     4886.8     2443.4 (  2 1.0)    4886.8 
 +NEON fadd.2s (32bit x2) ns4   :    0.604     4886.1     2443.0 (  2 1.0)    4886.1 
 +NEON fmla.2s (32bit x2) ns4   :    1.057     5581.7     1395.4 (  4 0.6)    5581.7 
 +NEON fmul.4s (32bit x4) ns4   :    0.604     9768.5     2442.1 (  4 1.0)    9768.5 
 +NEON fadd.4s (32bit x4) ns4   :    0.604     9766.9     2441.7 (  4 1.0)    9766.9 
 +NEON fmla.4s (32bit x4) ns4   :    1.057    11163.0     1395.4 (  8 0.6)   11163.0 
 +FPU fmul (32bit x1) n1        :    0.317     4648.8     4648.8 (  1 1.9)    4648.8 
 +FPU fadd (32bit x1) n1        :    0.317     4652.1     4652.1 (  1 1.9)    4652.1 
 +FPU fmadd (32bit x1) n1       :    4.225      698.0      349.0 (  2 0.1)     698.0 
 +NEON fmul.2s (32bit x2) n1    :    0.317     9305.3     4652.6 (  2 1.9)    9305.3 
 +NEON fadd.2s (32bit x2) n1    :    0.317     9307.2     4653.6 (  2 1.9)    9307.2 
 +NEON fmla.2s (32bit x2) n1    :    1.810     3258.0      814.5 (  4 0.3)    3258.0 
 +NEON fmul.4s (32bit x4) n1    :    0.604     9771.8     2442.9 (  4 1.0)    9771.8 
 +NEON fadd.4s (32bit x4) n1    :    0.603     9775.4     2443.8 (  4 1.0)    9775.4 
 +NEON fmla.4s (32bit x4) n1    :    1.811     6513.9      814.2 (  8 0.3)    6513.9 
 +NEON fmul.4s (32bit x4) n12   :    0.905     9771.8     2442.9 (  4 1.0)    9771.8 
 +NEON fadd.4s (32bit x4) n12   :    0.905     9773.9     2443.5 (  4 1.0)    9773.9 
 +NEON fmla.4s (32bit x4) n12   :    0.905    19545.9     2443.2 (  8 1.0)   19545.9 
 +Average                       :    0.785     8056.8     2835.8 (  3 1.2)    8056.8 
 +Highest                       :    0.317    19546.8     4654.9 (  8 1.9)   19546.8
  
-Processor : AArch64 Processor rev 13 (aarch64) 
-processor : 0 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0x7 
-CPU part : 0x803 
-CPU revision : 12 
  
-processor : 1 +* Group 1 Thread= Clock=2.457600 GHz  (mask:f0) 
-BogoMIPS 38.00 +* FPU/NEON (DP fp) 
-Features fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-CPU implementer 0x51 +FPU fmul (64bit x1) n8           0.317     4652.4     4652.4 (  1 1.9)    4652.4 
-CPU architecture: 8 +FPU fadd (64bit x1) n8           0.317     4652.7     4652.7 (  1 1.9)    4652.7 
-CPU variant 0x7 +FPU fmadd (64bit x1) n8          0.604     4884.0     2442.0 (  2 1.0)    4884.0 
-CPU part 0x803 +NEON fmul.2d (64bit x2) n8       0.604     4885.3     2442.7 (  2 1.0)    4885.3 
-CPU revision 12+NEON fadd.2d (64bit x2) n8    :    0.604     4885.3     2442.7 (  2 1.0)    4885.3 
 +NEON fmla.2d (64bit x2) n8    :    0.604     9771.4     2442.(  4 1.0)    9771.4 
 +FPU fmul (64bit x1) ns4          0.603     2443.4     2443.4 (  1 1.0)    2443.4 
 +FPU fadd (64bit x1) ns4          0.603     2443.9     2443.9 (  1 1.0)    2443.9 
 +FPU fmadd (64bit x1) ns4         0.528     5586.0     2793.0 (  2 1.1)    5586.0 
 +NEON fmul.2d (64bit x2) ns4   :    0.603     4887.4     2443.7 (  2 1.0)    4887.4 
 +NEON fadd.2d (64bit x2) ns4   :    0.604     4886.0     2443.0 (  2 1.0)    4886.0 
 +NEON fmla.2d (64bit x2) ns4   :    1.056     5584.3     1396.1 (  4 0.6)    5584.3 
 +FPU fmul (64bit x1) n1        :    0.317     4653.7     4653.7 (  1 1.9)    4653.7 
 +FPU fadd (64bit x1) n1        :    0.317     4653.6     4653.6 (  1 1.9)    4653.6 
 +FPU fmadd (64bit x1) n1       :    4.225      698.1      349.0 (  2 0.1)     698.1 
 +NEON fmul.2d (64bit x2) n1    :    0.604     4884.5     2442.2 (  2 1.0)    4884.5 
 +NEON fadd.2d (64bit x2) n1    :    0.604     4885.6     2442.8 (  2 1.0)    4885.6 
 +NEON fmla.2d (64bit x2) n1    :    1.811     3257.1      814.3 (  4 0.3)    3257.1 
 +NEON fmul.2d (64bit x2) n12   :    0.906     4885.2     2442.6 (  2 1.0)    4885.2 
 +NEON fadd.2d (64bit x2) n12   :    0.905     4886.1     2443.1 (  2 1.0)    4886.1 
 +NEON fmla.2d (64bit x2) n12   :    0.905     9772.0     2443.0 (  4 1.0)    9772.0 
 +Average                       :    0.840     4863.7     2653.5 (  2 1.1)    4863.7 
 +Highest                       :    0.317     9772.0     4653.7 (  4 1.9)    9772.0
  
-processor : 2 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0x7 
-CPU part : 0x803 
-CPU revision : 12 
  
-processor +* Group 1 Thread=1  Clock=2.457600 GHz  (mask:f0) 
-BogoMIPS : 38.00 +* Matrix 4x4 
-Features fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-CPU implementer : 0x51 +C++ code                         0.360     6110.8     6110.8 (  1 2.5)    6110.
-CPU architecture: 8 +NEON fmla.4s 128bit A            0.266     8285.3     8285.3 (  1 3.4)    8285.3 
-CPU variant 0x7 +NEON fmla.4s 128bit B            0.257     8569.7     8569.7 (  1 3.5)    8569.7 
-CPU part 0x803 +Average                          0.294     7655.3     7655.3 (  1 3.1)    7655.3 
-CPU revision 12+Highest                       :    0.257     8569.7     8569.7 (  1 3.5)    8569.7
  
-processor : 4 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0x6 
-CPU part : 0x802 
-CPU revision : 13 
  
-processor : 5 +* Group 1 Thread=4  Clock=2.457600 GHz  (mask:f0) 
-BogoMIPS 38.00 +* FPU/NEON (SP fp) multi-thread 
-Features fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-CPU implementer 0x51 +FPU fmul (32bit x1) n8        :    0.455    12977.3     3244.3 (  4 1.3)   12977.3 
-CPU architecture: 8 +FPU fadd (32bit x1) n8        :    0.494    11946.6     2986.6 (  4 1.2)   11946.6 
-CPU variant 0x6 +FPU fmadd (32bit x1) n8       :    0.823    14333.1     1791.6 (  8 0.7)   14333.1 
-CPU part 0x802 +NEON fmul.2s (32bit x2) n8    :    0.479    24612.2     3076.(  8 1.3)   24612.2 
-CPU revision : 13+NEON fadd.2s (32bit x2) n8       0.476    24783.8     3098.0 (  8 1.3)   24783.8 
 +NEON fmla.2s (32bit x2) n8       0.479    49204.8     3075.3 ( 16 1.3)   49204.8 
 +NEON fmul.4s (32bit x4) n8       0.942    25056.7     1566.0 ( 16 0.6)   25056.7 
 +NEON fadd.4s (32bit x4) n8       0.941    25058.9     1566.2 ( 16 0.6)   25058.9 
 +NEON fmla.4s (32bit x4) n8    :    0.925    51022.2     1594.4 ( 32 0.6)   51022.2 
 +FPU fmul (32bit x1) ns4       :    0.785     7517.1     1879.3 (  4 0.8)    7517.1 
 +FPU fadd (32bit x1) ns4          0.721     8177.4     2044.3 (  4 0.8)    8177.4 
 +FPU fmadd (32bit x1) ns4         1.134    10401.5     1300.2 (  8 0.5)   10401.5 
 +NEON fmul.2s (32bit x2) ns4      0.901    13086.1     1635.8 (  8 0.7)   13086.1 
 +NEON fadd.2s (32bit x2) ns4   :    0.709    16646.2     2080.8 (  8 0.8)   16646.2 
 +NEON fmla.2s (32bit x2) ns4   :    1.552    15203.5      950.2 ( 16 0.4)   15203.5 
 +NEON fmul.4s (32bit x4) ns4   :    0.785    30068.4     1879.3 ( 16 0.8)   30068.4 
 +NEON fadd.4s (32bit x4) ns4   :    0.887    26589.4     1661.8 ( 16 0.7)   26589.4 
 +NEON fmla.4s (32bit x4) ns4   :    1.446    32632.2     1019.8 ( 32 0.4)   32632.2 
 +FPU fmul (32bit x1) n1        :    0.403    14651.9     3663.0 (  4 1.5)   14651.9 
 +FPU fadd (32bit x1) n1        :    0.434    13582.6     3395.6 (  4 1.4)   13582.6 
 +FPU fmadd (32bit x1) n1       :    6.024     1958.2      244.8 (  8 0.1)    1958.2 
 +NEON fmul.2s (32bit x2) n1    :    0.412    28620.6     3577.6 (  8 1.5)   28620.6 
 +NEON fadd.2s (32bit x2) n1    :    0.384    30747.3     3843.4 (  8 1.6)   30747.3 
 +NEON fmla.2s (32bit x2) n1    :    2.123    11112.1      694.5 ( 16 0.3)   11112.1 
 +NEON fmul.4s (32bit x4) n1    :    0.684    34490.5     2155.7 ( 16 0.9)   34490.5 
 +NEON fadd.4s (32bit x4) n1    :    0.636    37116.4     2319.8 ( 16 0.9)   37116.4 
 +NEON fmla.4s (32bit x4) n1    :    1.902    24810.3      775.3 ( 32 0.3)   24810.3 
 +NEON fmul.4s (32bit x4) n12   :    0.941    37611.8     2350.7 ( 16 1.0)   37611.8 
 +NEON fadd.4s (32bit x4) n12   :    0.997    35498.0     2218.6 ( 16 0.9)   35498.0 
 +NEON fmla.4s (32bit x4) n12   :    1.008    70243.7     2195.1 ( 32 0.9)   70243.7 
 +Average                       :    1.029    24658.7     2129.5 ( 13 0.9)   24658.7 
 +Highest                       :    0.384    70243.7     3843.4 ( 32 1.6)   70243.7
  
-processor : 6 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0x6 
-CPU part : 0x802 
-CPU revision : 13 
  
-processor : 7 +* Group 1 Thread=4  Clock=2.457600 GHz  (mask:f0) 
-BogoMIPS 38.00 +* FPU/NEON (DP fp) multi-thread 
-Features fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-CPU implementer 0x51 +FPU fmul (64bit x1) n8        :    1.267     4656.8     1164.2 (  4 0.5)    4656.8 
-CPU architecture: 8 +FPU fadd (64bit x1) n8        :    1.271     4641.6     1160.4 (  4 0.5)    4641.6 
-CPU variant 0x6 +FPU fmadd (64bit x1) n8       :    2.422     4870.5      608.8 (  8 0.2)    4870.5 
-CPU part 0x802 +NEON fmul.2d (64bit x2) n8    :    2.414     4885.7      610.7 (  8 0.2)    4885.
-CPU revision 13+NEON fadd.2d (64bit x2) n8       2.417     4880.5      610.1 (  8 0.2)    4880.5 
 +NEON fmla.2d (64bit x2) n8       2.422     9740.1      608.8 ( 16 0.2)    9740.1 
 +FPU fmul (64bit x1) ns4          2.415     2442.0      610.5 (  4 0.2)    2442.0 
 +FPU fadd (64bit x1) ns4          2.419     2437.9      609.5 (  4 0.2)    2437.9 
 +FPU fmadd (64bit x1) ns4      :    2.116     5575.9      697.0 (  0.3)    5575.9 
 +NEON fmul.2d (64bit x2) ns4      2.420     4873.8      609.2 (  8 0.2)    4873.8 
 +NEON fadd.2d (64bit x2) ns4      2.417     4880.3      610.0 (  8 0.2)    4880.3 
 +NEON fmla.2d (64bit x2) ns4      4.230     5578.0      348.6 ( 16 0.1)    5578.0 
 +FPU fmul (64bit x1) n1        :    1.274     4629.5     1157.4 (  4 0.5)    4629.5 
 +FPU fadd (64bit x1) n1        :    1.268     4650.9     1162.7 (  4 0.5)    4650.9 
 +FPU fmadd (64bit x1) n1       :    9.906     1190.9      148.9 (  8 0.1)    1190.9 
 +NEON fmul.2d (64bit x2) n1    :    0.821    14364.5     1795.6 (  8 0.7)   14364.5 
 +NEON fadd.2d (64bit x2) n1    :    0.937    12586.2     1573.3 (  8 0.6)   12586.2 
 +NEON fmla.2d (64bit x2) n1    :    2.334    10110.2      631.9 ( 16 0.3)   10110.2 
 +NEON fmul.2d (64bit x2) n12   :    0.941    18803.3     2350.4 (  8 1.0)   18803.3 
 +NEON fadd.2d (64bit x2) n12   :    1.053    16807.8     2101.0 (  8 0.9)   16807.8 
 +NEON fmla.2d (64bit x2) n12   :    0.939    37690.3     2355.6 ( 16 1.0)   37690.3 
 +Average                       :    2.272     8585.6     1025.0 (  8 0.4)    8585.6 
 +Highest                       :    0.821    37690.3     2355.6 ( 16 1.0)   37690.3 
 + 
 + 
 +* Group 1:  Thread=4  Clock=2.457600 GHz  (mask:f0) 
 +* Matrix 4x4 multi-thread 
 +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
 +C++ code                      :    0.540    16309.5     4077.4 (  4 1.7)   16309.5 
 +NEON fmla.4s 128bit A         :    0.312    28256.8     7064.2 (  4 2.9)   28256.8 
 +NEON fmla.4s 128bit B         :    0.282    31246.1     7811.5 (  4 3.2)   31246.1 
 +Average                       :    0.378    25270.8     6317.7 (  4 2.6)   25270.8 
 +Highest                       :    0.282    31246.1     7811.5 (  4 3.2)   31246.1
  
-Hardware : Qualcomm Technologies, Inc SDM845 
  
-Qualcomm Technologies, Inc SDM845 
  
-2019/01/05 13:41:12  
 </code> </code>
  
行 9475: 行 9576:
  
  
-==== Qualcomm Kryo 280 (Cortex-A73) (ARMv8A AArch64 arm64) FPU+ASIMD ====+==== Qualcomm Kryo 385 (Cortex-A75 + A55) (ARMv8.2A AArch64 arm64) FPU+ASIMD+HALFFP ====
  
  
-++++Essential Phone PH-1 Snapdragon 835 big core Kryo 280 2.32GHz x4 ARM64 (AArch64) Android 9.0|+++++Pixel 3 Snapdragon 845 Kryo 385 2.8GHz x4 + 1.77GHz x4 ARM64 (AArch64) Android 9.0|
  
 <code> <code>
-ARCH: ARMv8A 3 +ARCH: ARMv8.2A 
-FPU: AArch64 NEON +FPU : ASIMD(AArch64 NEONFPHP ASIMDHP 
-SingleT SP max: 19.546 GFLOPS +NameQualcomm Technologies, Inc SDM845
-SingleT DP max: 9.769 GFLOPS +
-MultiT  SP max: 75.284 GFLOPS +
-MultiT  DP max: 37.888 GFLOPS +
-CPU core: 4 +
-FPHP  : no +
-SIMDHPno+
  
-* FPU/NEON (single fp) +CPU Thread:  8 
-                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS +CPU Core  : 
-FPU fmul (32bit x1) n8           0.288     4163.3     4163.3 (  1 1.7)    4163.3 +CPU Group :  2 
-FPU fadd (32bit x1) n8        :    0.258     4652.6     4652.6 (  1 1.9)    4652.6 +  Group 0: Thread= 4  Clock=1.766400 GHz  (mask:f
-FPU fmadd (32bit x1) n8       :    0.491     4885.3     2442.7 (  2 1.0)    4885.3 +  Group 1: Thread= 4  Clock=2.803200 GHz  (mask:f0
-NEON fmul.2s (32bit x2) n8    :    0.258     9300.2     4650.1 (  2 1.9)    9300.2 +NEON  : yes 
-NEON fadd.2s (32bit x2) n8    :    0.258     9307.7     4653.(  2 1.9)    9307.7 +FMA   : yes 
-NEON fmla.2s (32bit x2) n8    :    0.269    17816.9     4454.2 (  4 1.8)   17816.9 +FPHP  : yes 
-NEON fmul.4s (32bit x4) n8       0.491     9772.8     2443.2 (  4 1.0)    9772.+SIMDHPyes
-NEON fadd.4s (32bit x4) n8       0.491     9773.2     2443.3 (  4 1.0)    9773.+
-NEON fmla.4s (32bit x4) n8    :    0.491    19546.0     2443.2 (  8 1.0)   19546.0 +
-FPU fmul (32bit x1) ns4          0.491     2442.8     2442.8 (  1 1.0)    2442.8 +
-FPU fadd (32bit x1) ns4       :    0.491     2442.2     2442.2 (  1 1.0)    2442.2 +
-FPU fmadd (32bit x1) ns4      :    0.614     3907.8     1953.9 (  2 0.8)    3907.8 +
-NEON fmul.2s (32bit x2) ns4   :    0.491     4884.8     2442. 1.0)    4884.8 +
-NEON fadd.2s (32bit x2) ns4   :    0.491     4884.3     2442.2 (  2 1.0)    4884.3 +
-NEON fmla.2s (32bit x2) ns4      0.860     5582.6     1395.6 (  4 0.6   5582.6 +
-NEON fmul.4s (32bit x4) ns4   :    0.491     9768.4     2442.1 (  1.0)    9768.4 +
-NEON fadd.4s (32bit x4) ns4      0.491     9768.    2442.1 (  4 1.0)    9768.4 +
-NEON fmla.4s (32bit x4) ns4   :    0.860    11165.6     1395.7 (  8 0.6)   11165.6 +
-FPU fmul (32bit x1) n1        :    0.258     4653.4     4653.4 (  1 1.9)    4653.4 +
-FPU fadd (32bit x1) n1        :    0.258     4650.8     4650.8 (  1 1.9)    4650.8 +
-FPU fmadd (32bit x1) n1       :    3.438      698.1      349.1 (  0.1)     698.1 +
-NEON fmul.2s (32bit x2) n1    :    0.258     9308.7     4654.3 (  2 1.9)    9308.7 +
-NEON fadd.2s (32bit x2) n1       0.258     9302.8     4651.4 (  2 1.9   9302.8 +
-NEON fmla.2s (32bit x2) n1    :    1.474     3256.6      814.1 (  4 0.3)    3256.6 +
-NEON fmul.4s (32bit x4) n1       0.491     9770.5     2442.6 (  4 1.0)    9770.5 +
-NEON fadd.4s (32bit x4) n1    :    0.491     9770.4     2442.6 (  4 1.0)    9770.4 +
-NEON fmla.4s (32bit x4) n1    :    1.474     6513.1      814.1 (  8 0.3)    6513.1 +
-NEON fmul.4s (32bit x4) n12   :    0.737     9773.4     2443.3 (  4 1.0)    9773.4 +
-NEON fadd.4s (32bit x4) n12   :    0.737     9774.0     2443.5 (  4 1.0)    9774.0 +
-NEON fmla.4s (32bit x4) n12      0.737    19544.1     2443.0 (  8 1.0)   19544.1 +
-Average                          0.640     8036.0     2818.3 (  3 1.1)    8036.0 +
-Highest                       :    0.258    19546.0     4654.3 (  8 1.9)   19546.0+
  
 +Total:
 +SingleThread HP max:   71.675 GFLOPS
 +SingleThread SP max:   35.892 GFLOPS
 +SingleThread DP max:   17.940 GFLOPS
 +MultiThread  HP max:  277.711 GFLOPS
 +MultiThread  SP max:  138.445 GFLOPS
 +MultiThread  DP max:   68.745 GFLOPS
  
-* FPU/NEON (double fp) +Group 0:  Thread=4  Clock=1.766400 GHz  (mask:f
-                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS +  SingleThread HP max  27.426 GFLOPS 
-FPU fmul (64bit x1) n8        :    0.280     4288.2     4288.2 (  1 1.7)    4288.2 +  SingleThread SP max:   13.683 GFLOPS 
-FPU fadd (64bit x1) n8           0.258     4650.7     4650.7 (  1 1.9)    4650.7 +  SingleThread DP max:    6.851 GFLOPS 
-FPU fmadd (64bit x1) n8       :    0.491     4886.6     2443.3 (  1.0)    4886.6 +  MultiThread  HP max:  108.928 GFLOPS 
-NEON fmul.2d (64bit x2) n8    :    0.491     4886.5     2443.3 (  2 1.0)    4886.5 +  MultiThread  SP max:   54.046 GFLOPS 
-NEON fadd.2d (64bit x2) n8       0.491     4885.3     2442.7 (  2 1.0   4885.3 +  MultiThread  DP max  27.273 GFLOPS
-NEON fmla.2d (64bit x2) n8    :    0.492     9760.0     2440.0 (  4 1.0)    9760.0 +
-FPU fmul (64bit x1) ns4          0.491     2443.4     2443.4 (  1 1.0)    2443.4 +
-FPU fadd (64bit x1) ns4       :    0.491     2443.2     2443.2 (  1 1.0)    2443.2 +
-FPU fmadd (64bit x1) ns4         0.431     5569.0     2784.5 (  2 1.1)    5569.0 +
-NEON fmul.2d (64bit x2) ns4   :    0.492     4877.7     2438.8 (  2 1.0)    4877.7 +
-NEON fadd.2d (64bit x2) ns4   :    0.492     4878.2     2439.1 (  2 1.0)    4878.2 +
-NEON fmla.2d (64bit x2) ns4   :    0.859     5585.1     1396.3 (  4 0.6)    5585.1 +
-FPU fmul (64bit x1) n1        :    0.258     4650.7     4650.7 (  1 1.9)    4650.7 +
-FPU fadd (64bit x1) n1        :    0.258     4652.0     4652.0 (  1 1.9)    4652.0 +
-FPU fmadd (64bit x1) n1          3.439      697.8      348.9 (  2 0.1)     697.8 +
-NEON fmul.2d (64bit x2) n1    :    0.492     4882.8     2441.4 (  2 1.0)    4882.8 +
-NEON fadd.2d (64bit x2) n1    :    0.491     4883.3     2441.6 (  2 1.0)    4883.3 +
-NEON fmla.2d (64bit x2) n1       1.475     3255.1      813.8 (  4 0.3)    3255.1 +
-NEON fmul.2d (64bit x2) n12   :    0.738     4877.9     2439.0 (  2 1.0)    4877.9 +
-NEON fadd.2d (64bit x2) n12   :    0.737     4883.0     2441.5 (  2 1.0)    4883.0 +
-NEON fmla.2d (64bit x2) n12   :    0.737     9769.1     2442.3 (  4 1.0)    9769.1 +
-Average                          0.685     4843.1     2634.5 (  2 1.1)    4843.1 +
-Highest                       :    0.258     9769.1     4652.0 (  4 1.9)    9769.1+
  
 +Group 1:  Thread=4  Clock=2.803200 GHz  (mask:f0)
 +  SingleThread HP max:   44.248 GFLOPS
 +  SingleThread SP max:   22.209 GFLOPS
 +  SingleThread DP max:   11.090 GFLOPS
 +  MultiThread  HP max:  168.783 GFLOPS
 +  MultiThread  SP max:   84.400 GFLOPS
 +  MultiThread  DP max:   41.472 GFLOPS
  
-Matrix 4x4+ 
 +Group 0:  Thread=1  Clock=1.766400 GHz  (mask:f) 
 +* FPU/NEON (HP fp)
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-C++ code                      :    0.267     6712.    6712.0 (  1 2.7)    6712.0 +FPU fmul (16bit x1) n8        :    0.320     3308.    3308.5 (  1 1.9)    3308.5 
-NEON fmla.4s 128bit A         :    0.215     8320.    8320.(  1 3.4)    8320.7 +FPU fadd (16bit x1) n8        :    0.320     3315.6     3315.6 (  1 1.9)    3315.6 
-NEON fmla.4s 128bit B         :    0.213     8395.    8395.3 (  1 3.4)    8395.3 +FPU fmadd (16bit x1) n8       :    0.320     6633.8     3316.9 (  1.9)    6633.8 
-Average                       :    0.232     7809.3     7809.3 (  1 3.2)    7809.3 +NEON fmul.4h (16bit x4) n8    :    0.319    13282.9     3320.7 (  4 1.9  13282.9 
-Highest                       :    0.213     8395.3     8395.3 (  1 3.4)    8395.3+NEON fadd.4h (16bit x4) n8    :    0.319    13288.2     3322.0 (  4 1.9)   13288.2 
 +NEON fmla.4h (16bit x4) n8    :    0.321    26420.5     3302.6 (  8 1.9)   26420.5 
 +NEON fmul.8h (16bit x8) n8    :    0.624    13586.0     1698.(  1.0)   13586.0 
 +NEON fadd.8h (16bit x8) n8    :    0.625    13575.5     1696.9 (  8 1.0)   13575.5 
 +NEON fmla.8h (16bit x8) n8    :    0.624    27177.6     1698.6 ( 16 1.0)   27177.6 
 +FPU fmul (16bit x1) ns4       :    0.609     1739.8     1739.8 (  1 1.0)    1739.8 
 +FPU fadd (16bit x1) ns4       :    0.608     1742.0     1742.0 (  1 1.0)    1742.0 
 +FPU fmadd (16bit x1) ns4      :    0.609     3480.4     1740.2 (  2 1.0)    3480.
 +NEON fmul.4h (16bit x4) ns4   :    0.608     6968.8     1742.2 (  4 1.0)    6968.8 
 +NEON fadd.4h (16bit x4) ns4   :    0.608     6972.5     1743.1 (  4 1.0)    6972.5 
 +NEON fmla.4h (16bit x4) ns4   :    0.608    13942.5     1742.8 (  8 1.0)   13942.5 
 +NEON fmul.8h (16bit x8) ns4   :    0.623    13604.7     1700.6 (  8 1.0)   13604.7 
 +NEON fadd.8h (16bit x8) ns4   :    0.623    13611.3     1701.4 (  1.0)   13611.3 
 +NEON fmla.8h (16bit x8) ns4   :    0.623    27206.0     1700.4 ( 16 1.0  27206.0 
 +FPU fmul (16bit x1) n1        :    0.608     1743.3     1743.3 (  1 1.0)    1743.3 
 +FPU fadd (16bit x1) n1        :    0.608     1743.3     1743.3 (  1 1.0)    1743.3 
 +FPU fmadd (16bit x1) n1       :    2.434      870.9      435.4 (  2 0.2)     870.9 
 +NEON fmul.4h (16bit x4) n1    :    0.608     6974.8     1743.7 (  4 1.0)    6974.8 
 +NEON fadd.4h (16bit x4) n1    :    0.609     6963.0     1740.8 (  4 1.0)    6963.0 
 +NEON fmla.4h (16bit x4) n1    :    2.436     3480.6      435.1 (  8 0.2)    3480.6 
 +NEON fmul.8h (16bit x8) n1    :    0.623    13606.3     1700.8 (  8 1.0)   13606.3 
 +NEON fadd.8h (16bit x8) n1    :    0.623    13609.6     1701.2 (  1.0)   13609.6 
 +NEON fmla.8h (16bit x8) n1    :    2.435     6964.1      435.( 16 0.2)    6964.1 
 +NEON fmul.8h (16bit x8) n12   :    0.929    13696.8     1712.1 (  8 1.0)   13696.8 
 +NEON fadd.8h (16bit x8) n12   :    0.928    13698.7     1712.3 (  8 1.0)   13698.7 
 +NEON fmla.8h (16bit x8) n12   :    0.927    27426.4     1714.2 ( 16 1.0)   27426.4 
 +Average                       :    0.769    10687.8     1911.7 (  6 1.1)   10687.8 
 +Highest                       :    0.319    27426.4     3322.0 ( 16 1.9)   27426.4
  
  
-* FPU/NEON (single fp) multi-thread+* Group 0:  Thread=1  Clock=1.766400 GHz  (mask:f) 
 +* FPU/NEON (SP fp)
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-FPU fmul (32bit x1) n8        :    0.560     8571.    2142.9 (  4 0.9)    8571.6 +FPU fmul (32bit x1) n8        :    0.322     3288.    3288.9 (  1 1.9)    3288.9 
-FPU fadd (32bit x1) n8        :    0.538     8917.    2229.(  4 0.9)    8917.4 +FPU fadd (32bit x1) n8        :    0.320     3313.    3313.(  1 1.9)    3313.9 
-FPU fmadd (32bit x1) n8       :    1.020     9410.    1176.(  8 0.5)    9410.2 +FPU fmadd (32bit x1) n8       :    0.320     6626.    3313.(  2 1.9)    6626.9 
-NEON fmul.2s (32bit x2) n8    :    0.536    17918.    2239.(  8 0.9)   17918.8 +NEON fmul.2s (32bit x2) n8    :    0.320     6621.    3310.(  2 1.9)    6621.5 
-NEON fadd.2s (32bit x2) n8    :    0.538    17834.8     2229.4 (  8 0.9)   17834.8 +NEON fadd.2s (32bit x2) n8    :    0.319     6646.4     3323.2 (  2 1.9)    6646.4 
-NEON fmla.2s (32bit x2) n8    :    0.564    34051.    2128.16 0.9)   34051.0 +NEON fmla.2s (32bit x2) n8    :    0.319    13292.    3323. 4 1.9)   13292.4 
-NEON fmul.4s (32bit x4) n8    :    1.021    18805.    1175.16 0.5  18805.3 +NEON fmul.4s (32bit x4) n8    :    0.623     6806.    1701. 4 1.0   6806.8 
-NEON fadd.4s (32bit x4) n8    :    1.023    18774.    1173.4 ( 16 0.5  18774.0 +NEON fadd.4s (32bit x4) n8    :    0.623     6807.    1702.0 (  4 1.0   6807.9 
-NEON fmla.4s (32bit x4) n8    :    1.023    37544.7     1173.32 0.5)   37544.7 +NEON fmla.4s (32bit x4) n8    :    0.623    13611.7     1701. 8 1.0)   13611.7 
-FPU fmul (32bit x1) ns4       :    1.021     4701.    1175.(  4 0.5)    4701.3 +FPU fmul (32bit x1) ns4       :    0.608     1741.    1741.(  1 1.0)    1741.8 
-FPU fadd (32bit x1) ns4       :    1.023     4693.    1173.4 (  4 0.5)    4693.7 +FPU fadd (32bit x1) ns4       :    0.609     1741.    1741.4 (  1 1.0)    1741.4 
-FPU fmadd (32bit x1) ns4      :    1.277     7517.0      939.6 (  8 0.4)    7517.0 +FPU fmadd (32bit x1) ns4      :    0.609     3483.1     1741.6 (  2 1.0)    3483.1 
-NEON fmul.2s (32bit x2) ns4   :    1.023     9387.    1173.(  8 0.5)    9387.1 +NEON fmul.2s (32bit x2) ns4   :    0.609     3481.    1740.(  2 1.0)    3481.9 
-NEON fadd.2s (32bit x2) ns4   :    1.021     9402.    1175.(  8 0.5)    9402.6 +NEON fadd.2s (32bit x2) ns4   :    0.608     3486.    1743.(  2 1.0)    3486.4 
-NEON fmla.2s (32bit x2) ns4   :    1.788    10740.6      671.16 0.3  10740.6 +NEON fmla.2s (32bit x2) ns4   :    0.608     6970.1     1742. 4 1.0   6970.1 
-NEON fmul.4s (32bit x4) ns4   :    1.025    18740.    1171.3 ( 16 0.5  18740.8 +NEON fmul.4s (32bit x4) ns4   :    0.623     6805.    1701.3 (  4 1.0   6805.1 
-NEON fadd.4s (32bit x4) ns4   :    1.021    18802.    1175.1 ( 16 0.5  18802.4 +NEON fadd.4s (32bit x4) ns4   :    0.623     6808.    1702.1 (  4 1.0   6808.5 
-NEON fmla.4s (32bit x4) ns4   :    1.104    34796.    1087.32 0.4)   34796.9 +NEON fmla.4s (32bit x4) ns4   :    0.623    13605.    1700. 8 1.0)   13605.8 
-FPU fmul (32bit x1) n1        :    0.268    17912.    4478.0 (  1.8  17912.2 +FPU fmul (32bit x1) n1        :    0.608     1743.    1743.0 (  1.0   1743.0 
-FPU fadd (32bit x1) n1        :    0.268    17911.    4477.(  1.8  17911.6 +FPU fadd (32bit x1) n1        :    0.618     1714.    1714.(  1.0   1714.5 
-FPU fmadd (32bit x1) n1       :    3.572     2687.     335.(  0.1   2687.6 +FPU fmadd (32bit x1) n1       :    2.444      867.     433.(  0.2    867.3 
-NEON fmul.2s (32bit x2) n1    :    0.268    35833.    4479.2 (  1.8  35833.5 +NEON fmul.2s (32bit x2) n1    :    0.608     3484.    1742.2 (  1.0   3484.3 
-NEON fadd.2s (32bit x2) n1    :    0.268    35834.    4479.(  1.8  35834.0 +NEON fadd.2s (32bit x2) n1    :    0.610     3475.    1737.(  1.0   3475.9 
-NEON fmla.2s (32bit x2) n1    :    1.531    12542.     783.16 0.3  12542.3 +NEON fmla.2s (32bit x2) n1    :    2.435     1740.     435. 0.2   1740.9 
-NEON fmul.4s (32bit x4) n1    :    0.510    37624.7     2351.16 1.0)   37624.7 +NEON fmul.4s (32bit x4) n1    :    0.625     6785.7     1696. 1.0)    6785.7 
-NEON fadd.4s (32bit x4) n1    :    0.510    37627.    2351.16 1.0)   37627.6 +NEON fadd.4s (32bit x4) n1    :    0.624     6792.    1698. 1.0)    6792.8 
-NEON fmla.4s (32bit x4) n1    :    1.531    25083.     783.32 0.3  25083.1 +NEON fmla.4s (32bit x4) n1    :    2.435     3482.     435. 0.2   3482.4 
-NEON fmul.4s (32bit x4) n12   :    0.766    37619.    2351.16 1.0)   37619.1 +NEON fmul.4s (32bit x4) n12   :    0.932     6824.    1706. 1.0)    6824.5 
-NEON fadd.4s (32bit x4) n12   :    0.766    37619.    2351.2 ( 16 1.0)   37619.5 +NEON fadd.4s (32bit x4) n12   :    0.930     6836.    1709.2 (  1.0)    6836.9 
-NEON fmla.4s (32bit x4) n12   :    0.765    75284.    2352.32 1.0)   75284.4 +NEON fmla.4s (32bit x4) n12   :    0.930    13682.    1710. 1.0)   13682.7 
-Average                       :    0.938    22139.    1899.13 0.8  22139.7 +Average                       :    0.770     5752.    1909. 3 1.1   5752.4 
-Highest                       :    0.268    75284.    4479.2 ( 32 1.8)   75284.4+Highest                       :    0.319    13682.    3323.2 (  1.9)   13682.7
  
  
-* FPU/NEON (double fp) multi-thread+* Group 0:  Thread=1  Clock=1.766400 GHz  (mask:f) 
 +* FPU/NEON (DP fp)
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-FPU fmul (64bit x1) n8        :    0.417    11502.    2875.7 (  1.2  11502.8 +FPU fmul (64bit x1) n8        :    0.335     3167.    3167.7 (  1.8   3167.7 
-FPU fadd (64bit x1) n8        :    0.365    13164.    3291.(  1.3  13164.7 +FPU fadd (64bit x1) n8        :    0.338     3131.    3131.(  1.8   3131.1 
-FPU fmadd (64bit x1) n8       :    0.707    13577.9     1697.(  8 0.7  13577.9 +FPU fmadd (64bit x1) n8       :    0.335     6330.9     3165.(  2 1.8   6330.9 
-NEON fmul.2d (64bit x2) n8    :    0.692    13877.    1734.(  8 0.7  13877.0 +NEON fmul.2d (64bit x2) n8    :    0.623     3399.    1699.(  2 1.0   3399.7 
-NEON fadd.2d (64bit x2) n8    :    0.617    15560.    1945.(  8 0.8  15560.5 +NEON fadd.2d (64bit x2) n8    :    0.624     3399.    1699.(  2 1.0   3399.0 
-NEON fmla.2d (64bit x2) n8    :    0.540    35539.    2221.16 0.9  35539.9 +NEON fmla.2d (64bit x2) n8    :    0.623     6802.    1700. 4 1.0   6802.3 
-FPU fmul (64bit x1) ns4       :    0.510     9407.    2351.8 (  1.0)    9407.3 +FPU fmul (64bit x1) ns4       :    0.608     1742.    1742.8 (  1.0)    1742.8 
-FPU fadd (64bit x1) ns4       :    0.510     9407.    2351.(  1.0)    9407.5 +FPU fadd (64bit x1) ns4       :    0.608     1742.    1742.(  1.0)    1742.2 
-FPU fmadd (64bit x1) ns4      :    0.448    21419.    2677.4 (  1.1  21419.5 +FPU fmadd (64bit x1) ns4      :    0.609     3478.    1739.4 (  1.0   3478.8 
-NEON fmul.2d (64bit x2) ns4   :    0.510    18813.    2351.(  1.0)   18813.0 +NEON fmul.2d (64bit x2) ns4   :    0.626     3385.    1692.(  1.0)    3385.4 
-NEON fadd.2d (64bit x2) ns4   :    0.510    18815.    2352.(  1.0)   18815.8 +NEON fadd.2d (64bit x2) ns4   :    0.625     3389.    1694.(  1.0)    3389.2 
-NEON fmla.2d (64bit x2) ns4   :    0.893    21505.    1344.1 ( 16 0.5  21505.0 +NEON fmla.2d (64bit x2) ns4   :    0.632     6708.    1677.1 (  0.9   6708.4 
-FPU fmul (64bit x1) n1        :    0.268    17919.    4480.(  1.8  17919.8 +FPU fmul (64bit x1) n1        :    0.616     1721.    1721.(  1.0   1721.3 
-FPU fadd (64bit x1) n1        :    0.268    17920.    4480.(  1.8  17920.0 +FPU fadd (64bit x1) n1        :    0.609     1740.    1740.(  1.0   1740.1 
-FPU fmadd (64bit x1) n1       :    3.571     2688.     336.(  0.1   2688.1 +FPU fmadd (64bit x1) n1       :    2.437      869.     434.(  0.2    869.7 
-NEON fmul.2d (64bit x2) n1    :    0.510    18812.5     2351.6 (  1.0)   18812.5 +NEON fmul.2d (64bit x2) n1    :    0.626     3387.6     1693.8 (  1.0)    3387.6 
-NEON fadd.2d (64bit x2) n1    :    0.510    18812.    2351.(  1.0)   18812.1 +NEON fadd.2d (64bit x2) n1    :    0.626     3386.    1693.(  1.0)    3386.0 
-NEON fmla.2d (64bit x2) n1    :    1.531    12541.     783.16 0.3  12541.7 +NEON fmla.2d (64bit x2) n1    :    2.441     1737.     434. 0.2   1737.0 
-NEON fmul.2d (64bit x2) n12   :    0.766    18794.    2349.(  1.0)   18794.6 +NEON fmul.2d (64bit x2) n12   :    0.930     3419.    1709.(  1.0)    3419.8 
-NEON fadd.2d (64bit x2) n12   :    0.766    18810.3     2351.(  1.0)   18810.3 +NEON fadd.2d (64bit x2) n12   :    0.928     3425.3     1712.(  1.0)    3425.3 
-NEON fmla.2d (64bit x2) n12   :    0.760    37888.    2368.16 1.0)   37888.3 +NEON fmla.2d (64bit x2) n12   :    0.928     6850.    1712. 1.0)    6850.5 
-Average                       :    0.746    17465.    2335.5 (  1.0)   17465.6 +Average                       :    0.797     3486.    1795.5 (  1.0)    3486.4 
-Highest                       :    0.268    37888.    4480.16 1.8)   37888.3+Highest                       :    0.335     6850.    3167. 1.8)    6850.5
  
  
-* Matrix 4x4 multi-thread+* Group 0:  Thread=1  Clock=1.766400 GHz  (mask:f) 
 +* Matrix 4x4
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-C++ code                      :    0.569    12591.    3147.(  1.3  12591.7 +C++ code                      :    0.371     4269.    4269.(  1 2.4   4269.4 
-NEON fmla.4s 128bit A         :    0.441    16264.    4066.(  1.7  16264.1 +NEON fmla.4s 128bit A         :    0.673     2351.    2351.(  1.3   2351.3 
-NEON fmla.4s 128bit B         :    0.444    16160.    4040.(  1.6  16160.5 +NEON fmla.4s 128bit B         :    0.324     4890.    4890.(  1 2.8   4890.2 
-Average                       :    0.485    15005.    3751.(  1.5  15005.4 +Average                       :    0.456     3837.    3837.(  1 2.2   3837.0 
-Highest                       :    0.441    16264.    4066.(  1.7  16264.1+Highest                       :    0.324     4890.    4890.(  1 2.8   4890.2
  
  
-cpu0  1900800 300000 +* Group 0:  Thread=4  Clock=1.766400 GHz  (mask:f) 
-cpu1  1900800 300000 +* FPU/NEON (HP fp) multi-thread 
-cpu2  1900800 300000 +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-cpu3  1900800 300000 +FPU fmul (16bit x1) n8        :    0.321    13201.8     3300.5 (  4 1.9)   13201.8 
-cpu4  2457600 300000 +FPU fadd (16bit x1) n8        :    0.322    13146.1     3286.5 (  4 1.9)   13146.1 
-cpu5  2457600 300000 +FPU fmadd (16bit x1) n8       :    0.324    26192.3     3274.0 (  8 1.9)   26192.3 
-cpu6  2457600 300000 +NEON fmul.4h (16bit x4) n8    :    0.321    52891.3     3305.7 ( 16 1.9)   52891.3 
-cpu7  2457600 300000+NEON fadd.4h (16bit x4) n8    :    0.320    52954.3     3309.6 ( 16 1.9)   52954.3 
 +NEON fmla.4h (16bit x4) n8    :    0.323   104926.5     3279.0 ( 32 1.9)  104926.5 
 +NEON fmul.8h (16bit x8) n8    :    0.624    54394.2     1699.8 ( 32 1.0)   54394.2 
 +NEON fadd.8h (16bit x8) n8    :    0.626    54212.1     1694.1 ( 32 1.0)   54212.1 
 +NEON fmla.8h (16bit x8) n8    :    0.672   100991.1     1578.0 ( 64 0.9)  100991.1 
 +FPU fmul (16bit x1) ns4       :    0.660     6421.6     1605.4 (  4 0.9)    6421.6 
 +FPU fadd (16bit x1) ns4       :    0.672     6311.5     1577.9 (  4 0.9)    6311.5 
 +FPU fmadd (16bit x1) ns4      :    0.646    13120.3     1640.0 (  8 0.9)   13120.3 
 +NEON fmul.4h (16bit x4) ns4   :    0.637    26638.8     1664.9 ( 16 0.9)   26638.8 
 +NEON fadd.4h (16bit x4) ns4   :    0.637    26638.3     1664.9 ( 16 0.9)   26638.3 
 +NEON fmla.4h (16bit x4) ns4   :    0.625    54230.7     1694.7 ( 32 1.0)   54230.7 
 +NEON fmul.8h (16bit x8) ns4   :    0.639    53111.3     1659.7 ( 32 0.9)   53111.3 
 +NEON fadd.8h (16bit x8) ns4   :    0.655    51800.7     1618.8 ( 32 0.9)   51800.7 
 +NEON fmla.8h (16bit x8) ns4   :    0.631   107571.5     1680.8 ( 64 1.0)  107571.5 
 +FPU fmul (16bit x1) n1        :    0.624     6789.1     1697.3 (  4 1.0)    6789.1 
 +FPU fadd (16bit x1) n1        :    0.621     6822.1     1705.5 (  4 1.0)    6822.1 
 +FPU fmadd (16bit x1) n1       :    2.477     3423.4      427.9 (  8 0.2)    3423.4 
 +NEON fmul.4h (16bit x4) n1    :    0.618    27451.7     1715.7 ( 16 1.0)   27451.7 
 +NEON fadd.4h (16bit x4) n1    :    0.612    27697.2     1731.1 ( 16 1.0)   27697.2 
 +NEON fmla.4h (16bit x4) n1    :    2.459    13789.6      430.9 ( 32 0.2)   13789.6 
 +NEON fmul.8h (16bit x8) n1    :    0.643    52731.2     1647.9 ( 32 0.9)   52731.2 
 +NEON fadd.8h (16bit x8) n1    :    0.644    52629.8     1644.7 ( 32 0.9)   52629.8 
 +NEON fmla.8h (16bit x8) n1    :    2.471    27454.3      429.0 ( 64 0.2)   27454.3 
 +NEON fmul.8h (16bit x8) n12   :    0.942    54027.4     1688.4 ( 32 1.0)   54027.4 
 +NEON fadd.8h (16bit x8) n12   :    0.945    53838.2     1682.4 ( 32 1.0)   53838.2 
 +NEON fmla.8h (16bit x8) n12   :    0.934   108928.2     1702.0 ( 64 1.0)  108928.2 
 +Average                       :    0.788    41811.2     1867.9 ( 25 1.1)   41811.2 
 +Highest                       :    0.320   108928.2     3309.6 ( 64 1.9)  108928.2
  
-Processor : AArch64 Processor rev 1 (aarch64) 
-processor : 0 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0xa 
-CPU part : 0x801 
-CPU revision : 4 
  
-processor : 1 +* Group 0 Thread=4  Clock=1.766400 GHz  (mask:f) 
-BogoMIPS 38.00 +* FPU/NEON (SP fp) multi-thread 
-Features fp asimd evtstrm aes pmull sha1 sha2 crc32 +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-CPU implementer 0x51 +FPU fmul (32bit x1) n8           0.321    13217.0     3304.3 (  4 1.9)   13217.0 
-CPU architecture: 8 +FPU fadd (32bit x1) n8           0.329    12886.4     3221.6 (  4 1.8)   12886.4 
-CPU variant 0xa +FPU fmadd (32bit x1) n8          0.324    26173.7     3271.7 (  8 1.9)   26173.7 
-CPU part 0x801 +NEON fmul.2s (32bit x2) n8       0.326    26045.3     3255.7 (  1.8)   26045.3 
-CPU revision : 4+NEON fadd.2s (32bit x2) n8       0.326    25979.8     3247.5 (  8 1.8)   25979.8 
 +NEON fmla.2s (32bit x2) n8       0.327    51831.0     3239.4 ( 16 1.8)   51831.0 
 +NEON fmul.4s (32bit x4) n8       0.649    26135.3     1633.5 ( 16 0.9)   26135.3 
 +NEON fadd.4s (32bit x4) n8    :    0.641    26468.0     1654.3 ( 16 0.9)   26468.0 
 +NEON fmla.4s (32bit x4) n8    :    0.643    52712.0     1647.2 ( 32 0.9)   52712.0 
 +FPU fmul (32bit x1) ns4       :    0.617     6867.6     1716.9 (  1.0)    6867.6 
 +FPU fadd (32bit x1) ns4       :    0.614     6907.1     1726.8 (  4 1.0)    6907.1 
 +FPU fmadd (32bit x1) ns4      :    0.614    13814.8     1726.9 (  8 1.0)   13814.8 
 +NEON fmul.2s (32bit x2) ns4   :    0.611    13880.2     1735.0 (  8 1.0)   13880.2 
 +NEON fadd.2s (32bit x2) ns4   :    0.614    13802.6     1725.3 (  8 1.0)   13802.6 
 +NEON fmla.2s (32bit x2) ns4   :    0.613    27683.9     1730.2 ( 16 1.0)   27683.9 
 +NEON fmul.4s (32bit x4) ns4   :    0.629    26949.0     1684.3 ( 16 1.0)   26949.0 
 +NEON fadd.4s (32bit x4) ns4   :    0.631    26886.4     1680.4 ( 16 1.0)   26886.4 
 +NEON fmla.4s (32bit x4) ns4   :    0.628    54045.6     1688.9 ( 32 1.0)   54045.6 
 +FPU fmul (32bit x1) n1        :    0.615     6888.6     1722.1 (  4 1.0)    6888.6 
 +FPU fadd (32bit x1) n1        :    0.619     6848.6     1712.1 (  4 1.0)    6848.6 
 +FPU fmadd (32bit x1) n1       :    2.509     3379.9      422.5 (  8 0.2)    3379.9 
 +NEON fmul.2s (32bit x2) n1    :    0.614    13801.4     1725.2 (  8 1.0)   13801.4 
 +NEON fadd.2s (32bit x2) n1    :    0.619    13707.1     1713.4 (  8 1.0)   13707.1 
 +NEON fmla.2s (32bit x2) n1    :    2.510     6755.0      422.2 ( 16 0.2)    6755.0 
 +NEON fmul.4s (32bit x4) n1    :    0.647    26189.5     1636.8 ( 16 0.9)   26189.5 
 +NEON fadd.4s (32bit x4) n1    :    0.660    25699.9     1606.2 ( 16 0.9)   25699.9 
 +NEON fmla.4s (32bit x4) n1    :    2.543    13337.1      416.8 ( 32 0.2)   13337.1 
 +NEON fmul.4s (32bit x4) n12   :    0.990    25690.8     1605.7 ( 16 0.9)   25690.8 
 +NEON fadd.4s (32bit x4) n12   :    0.965    26354.8     1647.2 ( 16 0.9)   26354.8 
 +NEON fmla.4s (32bit x4) n12   :    0.951    53496.5     1671.8 ( 32 0.9)   53496.5 
 +Average                       :    0.790    22481.1     1873.1 ( 13 1.1)   22481.1 
 +Highest                       :    0.321    54045.6     3304.3 ( 32 1.9)   54045.6
  
-processor : 2 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0xa 
-CPU part : 0x801 
-CPU revision : 4 
  
-processor : 3 +* Group 0 Thread=4  Clock=1.766400 GHz  (mask:f) 
-BogoMIPS 38.00 +* FPU/NEON (DP fp) multi-thread 
-Features fp asimd evtstrm aes pmull sha1 sha2 crc32 +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-CPU implementer 0x51 +FPU fmul (64bit x1) n8        :    0.354    11990.3     2997.6 (  4 1.7)   11990.
-CPU architecture: 8 +FPU fadd (64bit x1) n8           0.358    11843.1     2960.8 (  4 1.7)   11843.1 
-CPU variant 0xa +FPU fmadd (64bit x1) n8          0.348    24386.5     3048.3 (  8 1.7)   24386.5 
-CPU part 0x801 +NEON fmul.2d (64bit x2) n8       0.649    13059.9     1632.5 (  8 0.9)   13059.9 
-CPU revision : 4+NEON fadd.2d (64bit x2) n8       0.663    12789.1     1598.6 (  0.9)   12789.1 
 +NEON fmla.2d (64bit x2) n8       0.651    26052.7     1628.3 ( 16 0.9)   26052.7 
 +FPU fmul (64bit x1) ns4          0.638     6643.4     1660.9 (  4 0.9)    6643.4 
 +FPU fadd (64bit x1) ns4          0.638     6647.2     1661.8 (  0.9)    6647.2 
 +FPU fmadd (64bit x1) ns4      :    0.645    13152.3     1644.0 (  8 0.9)   13152.3 
 +NEON fmul.2d (64bit x2) ns4   :    0.660    12856.2     1607.0 (  8 0.9)   12856.2 
 +NEON fadd.2d (64bit x2) ns4   :    0.663    12778.9     1597.4 (  8 0.9)   12778.9 
 +NEON fmla.2d (64bit x2) ns4   :    0.657    25818.1     1613.6 ( 16 0.9)   25818.1 
 +FPU fmul (64bit x1) n1        :    0.642     6602.6     1650.6 (  4 0.9)    6602.6 
 +FPU fadd (64bit x1) n1        :    0.656     6457.9     1614.5 (  4 0.9)    6457.9 
 +FPU fmadd (64bit x1) n1       :    2.570     3298.5      412.3 (  8 0.2)    3298.5 
 +NEON fmul.2d (64bit x2) n1    :    0.661    12823.2     1602.9 (  8 0.9)   12823.2 
 +NEON fadd.2d (64bit x2) n1    :    0.655    12936.4     1617.0 (  8 0.9)   12936.4 
 +NEON fmla.2d (64bit x2) n1    :    2.529     6705.0      419.1 ( 16 0.2)    6705.0 
 +NEON fmul.2d (64bit x2) n12   :    0.954    13330.4     1666.3 (  8 0.9)   13330.4 
 +NEON fadd.2d (64bit x2) n12   :    0.929    13684.8     1710.6 (  8 1.0)   13684.8 
 +NEON fmla.2d (64bit x2) n12   :    0.933    27273.1     1704.6 ( 16 1.0)   27273.1 
 +Average                       :    0.831    13387.1     1716.6 (  8 1.0)   13387.1 
 +Highest                       :    0.348    27273.1     3048.3 ( 16 1.7)   27273.1
  
-processor : 4 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0xa 
-CPU part : 0x800 
-CPU revision : 1 
  
-processor +* Group 0 Thread=4  Clock=1.766400 GHz  (mask:f) 
-BogoMIPS : 38.00 +* Matrix 4x4 multi-thread 
-Features fp asimd evtstrm aes pmull sha1 sha2 crc32 +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-CPU implementer : 0x51 +C++ code                         0.385    16451.8     4112.9 (  4 2.3)   16451.
-CPU architecture: 8 +NEON fmla.4s 128bit A            0.682     9279.3     2319.8 (  4 1.3)    9279.3 
-CPU variant 0xa +NEON fmla.4s 128bit B            0.328    19301.6     4825.4 (  4 2.7)   19301.6 
-CPU part 0x800 +Average                          0.465    15010.9     3752.7 (  4 2.1)   15010.9 
-CPU revision : 1+Highest                       :    0.328    19301.6     4825.4 (  4 2.7)   19301.6
  
-processor : 6 
-BogoMIPS : 38.00 
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 
-CPU implementer : 0x51 
-CPU architecture: 8 
-CPU variant : 0xa 
-CPU part : 0x800 
-CPU revision : 1 
  
-processor : 7 +* Group 1 Thread=1  Clock=2.803200 GHz  (mask:f0) 
-BogoMIPS 38.00 +* FPU/NEON (HP fp) 
-Features fp asimd evtstrm aes pmull sha1 sha2 crc32 +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
-CPU implementer 0x51 +FPU fmul (16bit x1) n8        :    0.304     5524.9     5524.9 (  1 2.0)    5524.9 
-CPU architecture: 8 +FPU fadd (16bit x1) n8        :    0.307     5476.1     5476.1 (  1 2.0)    5476.1 
-CPU variant 0xa +FPU fmadd (16bit x1) n8       :    0.383     8786.7     4393.4 (  2 1.6)    8786.
-CPU part 0x800 +NEON fmul.4h (16bit x4) n8       0.304    22113.0     5528.2 (  4 2.0)   22113.0 
-CPU revision : 1+NEON fadd.4h (16bit x4) n8       0.307    21906.8     5476.7 (  4 2.0)   21906.8 
 +NEON fmla.4h (16bit x4) n8       0.304    44248.4     5531.0 (  8 2.0)   44248.4 
 +NEON fmul.8h (16bit x8) n8       0.609    22087.1     2760.9 (  1.0)   22087.1 
 +NEON fadd.8h (16bit x8) n8       0.611    22008.4     2751.0 (  8 1.0)   22008.4 
 +NEON fmla.8h (16bit x8) n8       0.610    44087.5     2755.5 ( 16 1.0)   44087.5 
 +FPU fmul (16bit x1) ns4          0.464     3627.7     3627.7 (  1.3)    3627.7 
 +FPU fadd (16bit x1) ns4       :    0.461     3648.1     3648.1 (  1 1.3)    3648.1 
 +FPU fmadd (16bit x1) ns4      :    0.491     6845.7     3422.8 (  2 1.2)    6845.7 
 +NEON fmul.4h (16bit x4) ns4   :    0.459    14671.4     3667.8 (  4 1.3)   14671.4 
 +NEON fadd.4h (16bit x4) ns4   :    0.469    14356.4     3589.1 (  4 1.3)   14356.4 
 +NEON fmla.4h (16bit x4) ns4   :    0.763    17644.0     2205.5 (  8 0.8)   17644.0 
 +NEON fmul.8h (16bit x8) ns4   :    0.614    21921.8     2740.2 (  8 1.0)   21921.8 
 +NEON fadd.8h (16bit x8) ns4   :    0.612    21991.1     2748.9 (  8 1.0)   21991.1 
 +NEON fmla.8h (16bit x8) ns4   :    0.760    35429.6     2214.4 ( 16 0.8)   35429.6 
 +FPU fmul (16bit x1) n1        :    0.306     5490.1     5490.1 (  1 2.0)    5490.1 
 +FPU fadd (16bit x1) n1        :    0.309     5449.3     5449.3 (  1 1.9)    5449.3 
 +FPU fmadd (16bit x1) n1       :    3.051     1102.4      551.2 (  2 0.2)    1102.4 
 +NEON fmul.4h (16bit x4) n1    :    0.308    21808.3     5452.1 (  4 1.9)   21808.3 
 +NEON fadd.4h (16bit x4) n1    :    0.308    21847.4     5461.9 (  4 1.9)   21847.4 
 +NEON fmla.4h (16bit x4) n1    :    1.828     7358.8      919.9 (  8 0.3)    7358.8 
 +NEON fmul.8h (16bit x8) n1    :    0.610    22069.8     2758.7 (  8 1.0)   22069.8 
 +NEON fadd.8h (16bit x8) n1    :    0.618    21756.4     2719.5 (  8 1.0)   21756.4 
 +NEON fmla.8h (16bit x8) n1    :    1.825    14748.5      921.8 ( 16 0.3)   14748.5 
 +NEON fmul.8h (16bit x8) n12   :    0.916    22041.2     2755.2 (  8 1.0)   22041.2 
 +NEON fadd.8h (16bit x8) n12   :    0.912    22122.5     2765.3 (  8 1.0)   22122.5 
 +NEON fmla.8h (16bit x8) n12   :    0.916    44076.4     2754.8 ( 16 1.0)   44076.4 
 +Average                       :    0.691    18208.2     3535.4 (  6 1.3)   18208.2 
 +Highest                       :    0.304    44248.4     5531.0 ( 16 2.0)   44248.4
  
-Hardware : Qualcomm Technologies, Inc MSM8998 
  
-Qualcomm Technologies, Inc MSM8998+* Group 1:  Thread=1  Clock=2.803200 GHz  (mask:f0) 
 +* FPU/NEON (SP fp) 
 +                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS 
 +FPU fmul (32bit x1) n8        :    0.304     5530.0     5530.0 (  1 2.0)    5530.0 
 +FPU fadd (32bit x1) n8        :    0.306     5492.6     5492.6 (  1 2.0)    5492.6 
 +FPU fmadd (32bit x1) n8       :    0.385     8730.6     4365.3 (  2 1.6)    8730.6 
 +NEON fmul.2s (32bit x2) n8    :    0.303    11088.3     5544.2 (  2 2.0)   11088.3 
 +NEON fadd.2s (32bit x2) n8    :    0.306    10988.1     5494.0 (  2 2.0)   10988.1 
 +NEON fmla.2s (32bit x2) n8    :    0.305    22037.4     5509.3 (  4 2.0)   22037.4 
 +NEON fmul.4s (32bit x4) n8    :    0.609    11055.3     2763.8 (  4 1.0)   11055.3 
 +NEON fadd.4s (32bit x4) n8    :    0.611    11009.1     2752.3 (  4 1.0)   11009.1 
 +NEON fmla.4s (32bit x4) n8    :    0.610    22052.9     2756.6 (  8 1.0)   22052.9 
 +FPU fmul (32bit x1) ns4       :    0.462     3643.3     3643.3 (  1 1.3)    3643.3 
 +FPU fadd (32bit x1) ns4       :    0.456     3691.7     3691.7 (  1 1.3)    3691.7 
 +FPU fmadd (32bit x1) ns4      :    0.485     6942.4     3471.2 (  2 1.2)    6942.4 
 +NEON fmul.2s (32bit x2) ns4   :    0.460     7312.7     3656.3 (  2 1.3)    7312.7 
 +NEON fadd.2s (32bit x2) ns4   :    0.466     7218.4     3609.2 (  2 1.3)    7218.4 
 +NEON fmla.2s (32bit x2) ns4   :    0.764     8802.8     2200.7 (  4 0.8)    8802.8 
 +NEON fmul.4s (32bit x4) ns4   :    0.609    11052.0     2763.0 (  4 1.0)   11052.0 
 +NEON fadd.4s (32bit x4) ns4   :    0.612    10994.6     2748.7 (  4 1.0)   10994.6 
 +NEON fmla.4s (32bit x4) ns4   :    0.765    17596.2     2199.5 (  8 0.8)   17596.2 
 +FPU fmul (32bit x1) n1        :    0.308     5469.3     5469.3 (  1 2.0)    5469.3 
 +FPU fadd (32bit x1) n1        :    0.303     5550.2     5550.2 (  1 2.0)    5550.2 
 +FPU fmadd (32bit x1) n1       :    3.048     1103.5      551.7 (  2 0.2)    1103.5 
 +NEON fmul.2s (32bit x2) n1    :    0.304    11075.5     5537.8 (  2 2.0)   11075.5 
 +NEON fadd.2s (32bit x2) n1    :    0.306    10996.9     5498.4 (  2 2.0)   10996.9 
 +NEON fmla.2s (32bit x2) n1    :    1.827     3682.0      920.5 (  4 0.3)    3682.0 
 +NEON fmul.4s (32bit x4) n1    :    0.616    10919.4     2729.9 (  4 1.0)   10919.4 
 +NEON fadd.4s (32bit x4) n1    :    0.610    11034.1     2758.5 (  4 1.0)   11034.1 
 +NEON fmla.4s (32bit x4) n1    :    1.823     7379.8      922.5 (  8 0.3)    7379.8 
 +NEON fmul.4s (32bit x4) n12   :    0.908    11109.7     2777.4 (  4 1.0)   11109.7 
 +NEON fadd.4s (32bit x4) n12   :    0.909    11106.1     2776.5 (  4 1.0)   11106.1 
 +NEON fmla.4s (32bit x4) n12   :    0.909    22209.3     2776.2 (  8 1.0)   22209.3 
 +Average                       :    0.690     9895.8     3548.7 (  3 1.3)    9895.8 
 +Highest                       :    0.303    22209.3     5550.2 (  8 2.0)   22209.3
  
-2019/01/19 16:23:31  
- 
-</code> 
- 
-++++ 
- 
- 
- 
-==== Qualcomm Kryo 385 (Cortex-A75) (ARMv8.2A AArch64 arm64) FPU+ASIMD+HALFFP ==== 
- 
- 
-++++Pixel 3 Snapdragon 845 big core Kryo 385 2.8GHz x4 ARM64 (AArch64) Android 9.0| 
- 
-<code> 
-ARCH: ARMv8A 3 
-FPU: AArch64 NEON 
-SingleT SP max: 22.293 GFLOPS 
-SingleT DP max: 11.137 GFLOPS 
-MultiT  SP max: 84.390 GFLOPS 
-MultiT  DP max: 42.196 GFLOPS 
-CPU core: 4 
-FPHP  : yes 
-SIMDHP: yes 
  
-* FPU/NEON (single fp)+* Group 1:  Thread=1  Clock=2.803200 GHz  (mask:f0) 
 +* FPU/NEON (DP fp)
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-FPU fmul (32bit x1) n8        :    0.238     5039.    5039.(  1 1.8)    5039.7 +FPU fmul (64bit x1) n8        :    0.302     5577.    5577.(  1 2.0)    5577.2 
-FPU fadd (32bit x1) n8        :    0.215     5577.    5577.(  1 2.0)    5577.2 +FPU fadd (64bit x1) n8        :    0.305     5521.    5521.(  1 2.0)    5521.3 
-FPU fmadd (32bit x1) n8       :    0.271     8852.    4426.(  2 1.6)    8852.5 +FPU fmadd (64bit x1) n8       :    0.384     8754.    4377.(  2 1.6)    8754.6 
-NEON fmul.2s (32bit x2) n8    :    0.215    11156.    5578.(  2 2.0)   11156.0 +NEON fmul.2d (64bit x2) n8    :    0.606     5548.    2774.(  2 1.0)    5548.7 
-NEON fadd.2s (32bit x2) n8    :    0.216    11132.    5566.1 (  2 2.0)   11132.2 +NEON fadd.2d (64bit x2) n8    :    0.604     5568.    2784.1 (  2 1.0)    5568.3 
-NEON fmla.2s (32bit x2) n8    :    0.215    22293.    5573.3 (  4 2.0)   22293.3 +NEON fmla.2d (64bit x2) n8    :    0.607    11089.    2772.5 (  4 1.0)   11089.9 
-NEON fmul.4s (32bit x4) n8    :    0.431    11142.5     2785.6 (  4 1.0)   11142.+FPU fmul (64bit x1) ns4       :    0.461     3645.    3645.(  1 1.3)    3645.8 
-NEON fadd.4s (32bit x4) n8    :    0.432    11111.8     2778.0 (  4 1.0)   11111.8 +FPU fadd (64bit x1) ns4       :    0.464     3626.    3626.(  1 1.3)    3626.4 
-NEON fmla.4s (32bit x4) n8    :    0.431    22273.6     2784.2 (  8 1.0)   22273.6 +FPU fmadd (64bit x1) ns4      :    0.466     7225.    3612.(  2 1.3)    7225.6 
-FPU fmul (32bit x1) ns4       :    0.330     3640.    3640.(  1 1.3)    3640.4 +NEON fmul.2d (64bit x2) ns4   :    0.607     5538.    2769.(  2 1.0)    5538.2 
-FPU fadd (32bit x1) ns4       :    0.325     3692.    3692.(  1 1.3)    3692.3 +NEON fadd.2d (64bit x2) ns4   :    0.610     5513.    2756.8 (  2 1.0)    5513.5 
-FPU fmadd (32bit x1) ns4      :    0.342     7012.    3506.(  2 1.3)    7012.3 +NEON fmla.2d (64bit x2) ns4   :    0.762     8828.    2207.(  4 0.8)    8828.6 
-NEON fmul.2s (32bit x2) ns4   :    0.330     7262.    3631.(  2 1.3)    7262.7 +FPU fmul (64bit x1) n1        :    0.303     5543.    5543.(  1 2.0)    5543.2 
-NEON fadd.2s (32bit x2) ns4   :    0.333     7211.    3605.8 (  2 1.3)    7211.6 +FPU fadd (64bit x1) n1        :    0.306     5501.    5501.(  1 2.0)    5501.7 
-NEON fmla.2s (32bit x2) ns4   :    0.541     8865.    2216.(  4 0.8)    8865.1 +FPU fmadd (64bit x1) n1       :    3.028     1111.     555.(  2 0.2)    1111.0 
-NEON fmul.4s (32bit x4) ns4   :    0.434    11047.6     2761.9 (  4 1.0)   11047.6 +NEON fmul.2d (64bit x2) n1    :    0.611     5504.    2752.(  2 1.0)    5504.7 
-NEON fadd.4s (32bit x4) ns4   :    0.434    11061.1     2765.3 (  4 1.0)   11061.1 +NEON fadd.2d (64bit x2) n1    :    0.610     5513.    2756.(  2 1.0)    5513.7 
-NEON fmla.4s (32bit x4) ns4   :    0.541    17730.9     2216.4 (  8 0.8)   17730.9 +NEON fmla.2d (64bit x2) n1    :    1.823     3689.     922.(  4 0.3)    3689.5 
-FPU fmul (32bit x1) n1        :    0.217     5537.    5537.(  1 2.0)    5537.5 +NEON fmul.2d (64bit x2n12   :    0.908     5556.    2778.1 (  1.0)    5556.2 
-FPU fadd (32bit x1) n1        :    0.217     5537.    5537.(  1 2.0)    5537.6 +NEON fadd.2d (64bit x2) n12   :    0.919     5489.6     2744.(  1.0)    5489.6 
-FPU fmadd (32bit x1) n1       :    2.157     1112.     556.(  2 0.2)    1112.9 +NEON fmla.2d (64bit x2) n12   :    0.956    10553.    2638.(  4 0.9)   10553.0 
-NEON fmul.2s (32bit x2) n1    :    0.215    11153.    5576.(  2 2.0)   11153.8 +Average                       :    0.745     5947.7     3267.(  1.2)    5947.7 
-NEON fadd.2s (32bit x2) n1    :    0.215    11149.    5574.(  2 2.0)   11149.0 +Highest                       :    0.302    11089.    5577.(  2.0)   11089.9
-NEON fmla.2s (32bit x2) n1    :    1.300     3692.     923.(  4 0.3)    3692.2 +
-NEON fmul.4s (32bit x4n1    :    0.433    11081.    2770.4 (  4 1.0)   11081.5 +
-NEON fadd.4s (32bit x4) n1    :    0.434    11050.7     2762.7 (  1.0)   11050.7 +
-NEON fmla.4s (32bit x4) n1    :    1.301     7377.7      922.2 (  8 0.3)    7377.7 +
-NEON fmul.4s (32bit x4) n12   :    0.652    11049.6     2762.(  1.0)   11049.6 +
-NEON fadd.4s (32bit x4) n12   :    0.651    11065.    2766.(  4 1.0)   11065.+
-NEON fmla.4s (32bit x4n12   :    0.652    22101.1     2762.6 (  8 1.0)   22101.1 +
-Average                       :    0.491     9933.7     3553.(  1.3)    9933.7 +
-Highest                       :    0.215    22293.    5578.(  2.0)   22293.3+
  
  
-FPU/NEON (double fp)+Group 1:  Thread=1  Clock=2.803200 GHz  (mask:f0) 
 +* Matrix 4x4
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-FPU fmul (64bit x1) n8        :    0.232     5168.    5168.4 (  1 1.8)    5168.4 +C++ code                      :    0.278     9026.    9026.8 (  1 3.2)    9026.8 
-FPU fadd (64bit x1) n8        :    0.216     5568.1     5568.1 (  1 2.0)    5568.1 +NEON fmla.4s 128bit A         :    0.225    11155.5    11155.5 (  1 4.0)   11155.5 
-FPU fmadd (64bit x1) n8       :    0.273     8794.    4397.2 (  2 1.6)    8794.3 +NEON fmla.4s 128bit B         :    0.230    10941.   10941.(  1 3.9)   10941.9 
-NEON fmul.2d (64bit x2) n8    :    0.431     5570.4     2785.2 (  2 1.0)    5570.4 +Average                       :    0.244    10374.7    10374.(  1 3.7)   10374.7 
-NEON fadd.2d (64bit x2) n8    :    0.431     5569.6     2784.8 (  2 1.0)    5569.6 +Highest                       :    0.225    11155.   11155.(  1 4.0)   11155.5
-NEON fmla.2d (64bit x2) n8    :    0.431    11136.7     2784.2 (  4 1.0)   11136.7 +
-FPU fmul (64bit x1) ns4       :    0.329     3649.2     3649.2 (  1 1.3)    3649.2 +
-FPU fadd (64bit x1) ns4       :    0.326     3680.4     3680.4 (  1 1.3)    3680.4 +
-FPU fmadd (64bit x1) ns4      :    0.332     7227.5     3613.8 (  2 1.3)    7227.5 +
-NEON fmul.2d (64bit x2) ns4   :    0.431     5570.1     2785.1 (  1.0)    5570.1 +
-NEON fadd.2d (64bit x2) ns4   :    0.431     5573.0     2786.5 (  2 1.0)    5573.0 +
-NEON fmla.2d (64bit x2) ns4   :    0.539     8908.7     2227.2 (  4 0.8)    8908.+
-FPU fmul (64bit x1) n1        :    0.216     5553.8     5553.8 (  1 2.0)    5553.8 +
-FPU fadd (64bit x1) n1        :    0.218     5516.9     5516.9 (  1 2.0   5516.9 +
-FPU fmadd (64bit x1) n1       :    2.177     1102.7      551.3 (  2 0.2)    1102.7 +
-NEON fmul.2d (64bit x2) n1    :    0.431     5570.2     2785.1 (  1.0)    5570.2 +
-NEON fadd.2d (64bit x2) n1    :    0.431     5573.0     2786.5 (  2 1.0)    5573.0 +
-NEON fmla.2d (64bit x2) n1    :    1.293     3711.0      927.7 (  4 0.3   3711.0 +
-NEON fmul.2d (64bit x2) n12   :    0.654     5508.0     2754.0 (  2 1.0)    5508.0 +
-NEON fadd.2d (64bit x2) n12   :    0.653     5513.7     2756.9 (  2 1.0)    5513.7 +
-NEON fmla.2d (64bit x2) n12   :    0.653    11027.4     2756.9 (  4 1.0)   11027.4 +
-Average                       :    0.530     5975.9     3267.6 (  1.2)    5975.9 +
-Highest                       :    0.216    11136.7     5568.1 (  2.0)   11136.7+
  
  
-Matrix 4x4+Group 1:  Thread=4  Clock=2.803200 GHz  (mask:f0) 
 +* FPU/NEON (HP fp) multi-thread
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-C++ code                      :    0.207     8655.6     8655.6 (  1 3.1)    8655.6 +FPU fmul (16bit x1) n8        :    0.319    21091.6     5272.9 (  4 1.9)   21091.6 
-NEON fmla.4s 128bit A         :    0.154    11604.1    11604.1 (  1 4.1)   11604.1 +FPU fadd (16bit x1) n8        :    0.319    21093.3     5273.3 (  1.9)   21093.3 
-NEON fmla.4s 128bit B         :    0.162    11093.5    11093.5 (  4.0)   11093.5 +FPU fmadd (16bit x1) n8       :    0.402    33482.1     4185.3 (  8 1.5  33482.1 
-Average                       :    0.174    10451.1    10451.(  3.7)   10451.1 +NEON fmul.4h (16bit x4) n8    :    0.319    84378.9     5273.7 ( 16 1.9)   84378.9 
-Highest                       :    0.154    11604.1    11604.1 (  1 4.1)   11604.1+NEON fadd.4h (16bit x4) n8    :    0.319    84377.6     5273.6 ( 16 1.9)   84377.6 
 +NEON fmla.4h (16bit x4) n8    :    0.319   168729.8     5272.8 ( 32 1.9)  168729.8 
 +NEON fmul.8h (16bit x8) n8    :    0.638    84375.1     2636.7 ( 32 0.9)   84375.1 
 +NEON fadd.8h (16bit x8) n8    :    0.638    84376.7     2636.8 ( 32 0.9)   84376.7 
 +NEON fmla.8h (16bit x8) n8    :    0.638   168712.1     2636.1 ( 64 0.9)  168712.1 
 +FPU fmul (16bit x1) ns4       :    0.488    13795.9     3449.0 (  1.2)   13795.9 
 +FPU fadd (16bit x1) ns4       :    0.484    13905.6     3476.4 (  4 1.2)   13905.
 +FPU fmadd (16bit x1) ns4      :    0.513    26236.3     3279.5 (  8 1.2)   26236.3 
 +NEON fmul.4h (16bit x4) ns4   :    0.483    55767.6     3485.5 ( 16 1.2)   55767.6 
 +NEON fadd.4h (16bit x4) ns4   :    0.486    55340.9     3458.8 ( 16 1.2)   55340.9 
 +NEON fmla.4h (16bit x4) ns4   :    0.797    67493.5     2109.2 ( 32 0.8)   67493.5 
 +NEON fmul.8h (16bit x8) ns4   :    0.638    84377.3     2636.8 ( 32 0.9)   84377.3 
 +NEON fadd.8h (16bit x8) ns4   :    0.638    84371.5     2636.6 32 0.9)   84371.5 
 +NEON fmla.8h (16bit x8) ns4   :    0.797   134989.4     2109.2 ( 64 0.8)  134989.4 
 +FPU fmul (16bit x1) n1        :    0.319    21087.0     5271.7 (  4 1.9)   21087.0 
 +FPU fadd (16bit x1) n1        :    0.319    21092.7     5273.2 (  4 1.9)   21092.7 
 +FPU fmadd (16bit x1) n1       :    3.190     4218.3      527.3 (  8 0.2)    4218.3 
 +NEON fmul.4h (16bit x4) n1    :    0.319    84365.2     5272.8 ( 16 1.9)   84365.
 +NEON fadd.4h (16bit x4) n1    :    0.319    84375.2     5273.5 ( 16 1.9)   84375.2 
 +NEON fmla.4h (16bit x4) n1    :    1.914    28124.4      878.9 ( 32 0.3)   28124.4 
 +NEON fmul.8h (16bit x8) n1    :    0.638    84368.6     2636.5 ( 32 0.9)   84368.6 
 +NEON fadd.8h (16bit x8) n1    :    0.638    84377.3     2636.8 ( 32 0.9)   84377.3 
 +NEON fmla.8h (16bit x8) n1    :    1.914    56247.7      878.9 ( 64 0.3)   56247.7 
 +NEON fmul.8h (16bit x8) n12   :    0.957    84381.6     2636.9 ( 32 0.9)   84381.6 
 +NEON fadd.8h (16bit x8) n12   :    0.957    84385.7     2637.1 ( 32 0.9)   84385.7 
 +NEON fmla.8h (16bit x8) n12   :    0.957   168782.7     2637.2 ( 64 0.9)  168782.
 +Average                       :    0.722    69756.7     3388.8 ( 25 1.2)   69756.
 +Highest                       :    0.319   168782.7     5273.7 ( 64 1.9)  168782.7
  
  
-* FPU/NEON (single fp) multi-thread+* Group 1:  Thread=4  Clock=2.803200 GHz  (mask:f0) 
 +* FPU/NEON (SP fp) multi-thread
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-FPU fmul (32bit x1) n8        :    0.245    19559.    4889.(  4 1.7)   19559.4 +FPU fmul (32bit x1) n8        :    0.319    21086.    5271.(  4 1.9)   21086.7 
-FPU fadd (32bit x1) n8        :    0.228    21088.    5272.(  4 1.9)   21088.1 +FPU fadd (32bit x1) n8        :    0.319    21087.    5271.(  4 1.9)   21087.6 
-FPU fmadd (32bit x1) n8       :    0.288    33361.    4170.(  8 1.5)   33361.3 +FPU fmadd (32bit x1) n8       :    0.406    33132.    4141.(  8 1.5)   33132.2 
-NEON fmul.2s (32bit x2) n8    :    0.228    42187.    5273.(  8 1.9)   42187.4 +NEON fmul.2s (32bit x2) n8    :    0.319    42174.    5271.(  8 1.9)   42174.9 
-NEON fadd.2s (32bit x2) n8    :    0.228    42183.    5272.9 (  8 1.9)   42183.3 +NEON fadd.2s (32bit x2) n8    :    0.319    42174.    5271.9 (  8 1.9)   42174.9 
-NEON fmla.2s (32bit x2) n8    :    0.228    84357.    5272.4 ( 16 1.9)   84357.8 +NEON fmla.2s (32bit x2) n8    :    0.319    84342.    5271.4 ( 16 1.9)   84342.4 
-NEON fmul.4s (32bit x4) n8    :    0.455    42182.2     2636.( 16 0.9)   42182.2 +NEON fmul.4s (32bit x4) n8    :    0.638    42179.2     2636.( 16 0.9)   42179.2 
-NEON fadd.4s (32bit x4) n8    :    0.455    42184.    2636.( 16 0.9)   42184.0 +NEON fadd.4s (32bit x4) n8    :    0.638    42174.    2635.( 16 0.9)   42174.4 
-NEON fmla.4s (32bit x4) n8    :    0.455    84367.    2636.( 32 0.9)   84367.8 +NEON fmla.4s (32bit x4) n8    :    0.638    84354.    2636.( 32 0.9)   84354.6 
-FPU fmul (32bit x1) ns4       :    0.348    13801.    3450.(  4 1.2)   13801.7 +FPU fmul (32bit x1) ns4       :    0.485    13858.    3464.(  4 1.2)   13858.1 
-FPU fadd (32bit x1) ns4       :    0.345    13929.    3482.(  4 1.2)   13929.3 +FPU fadd (32bit x1) ns4       :    0.482    13947.    3486.(  4 1.2)   13947.6 
-FPU fmadd (32bit x1) ns4      :    0.365    26334.    3291.(  8 1.2)   26334.8 +FPU fmadd (32bit x1) ns4      :    0.506    26601.    3325.(  8 1.2)   26601.7 
-NEON fmul.2s (32bit x2) ns4   :    0.346    27734.    3466.(  8 1.2)   27734.2 +NEON fmul.2s (32bit x2) ns4   :    0.483    27842.    3480.(  8 1.2)   27842.4 
-NEON fadd.2s (32bit x2) ns4   :    0.348    27565.    3445.(  8 1.2)   27565.1 +NEON fadd.2s (32bit x2) ns4   :    0.485    27767.    3470.(  8 1.2)   27767.4 
-NEON fmla.2s (32bit x2) ns4   :    0.569    33748.7     2109.( 16 0.8)   33748.7 +NEON fmla.2s (32bit x2) ns4   :    0.798    33741.7     2108.( 16 0.8)   33741.7 
-NEON fmul.4s (32bit x4) ns4   :    0.455    42182.    2636.( 16 0.9)   42182.3 +NEON fmul.4s (32bit x4) ns4   :    0.638    42177.    2636.( 16 0.9)   42177.0 
-NEON fadd.4s (32bit x4) ns4   :    0.455    42190.    2636.( 16 0.9)   42190.2 +NEON fadd.4s (32bit x4) ns4   :    0.638    42179.    2636.( 16 0.9)   42179.5 
-NEON fmla.4s (32bit x4) ns4   :    0.569    67497.6     2109.( 32 0.8)   67497.6 +NEON fmla.4s (32bit x4) ns4   :    0.798    67483.6     2108.( 32 0.8)   67483.6 
-FPU fmul (32bit x1) n1        :    0.228    21087.6     5271.(  4 1.9)   21087.6 +FPU fmul (32bit x1) n1        :    0.319    21089.6     5272.(  4 1.9)   21089.6 
-FPU fadd (32bit x1) n1        :    0.228    21092.    5273.(  4 1.9)   21092.9 +FPU fadd (32bit x1) n1        :    0.319    21087.    5271.(  4 1.9)   21087.5 
-FPU fmadd (32bit x1) n1       :    2.275     4219.     527.(  8 0.2)    4219.3 +FPU fmadd (32bit x1) n1       :    3.190     4217.     527.(  8 0.2)    4217.8 
-NEON fmul.2s (32bit x2) n1    :    0.228    42187.2     5273.(  8 1.9)   42187.2 +NEON fmul.2s (32bit x2) n1    :    0.319    42178.2     5272.(  8 1.9)   42178.2 
-NEON fadd.2s (32bit x2) n1    :    0.228    42192.    5274.(  8 1.9)   42192.6 +NEON fadd.2s (32bit x2) n1    :    0.319    42181.    5272.(  8 1.9)   42181.3 
-NEON fmla.2s (32bit x2) n1    :    1.365    14060.8      878.8 ( 16 0.3)   14060.8 +NEON fmla.2s (32bit x2) n1    :    1.914    14060.8      878.8 ( 16 0.3)   14060.8 
-NEON fmul.4s (32bit x4) n1    :    0.455    42182.    2636.( 16 0.9)   42182.2 +NEON fmul.4s (32bit x4) n1    :    0.638    42178.    2636.( 16 0.9)   42178.1 
-NEON fadd.4s (32bit x4) n1    :    0.455    42180.    2636.( 16 0.9)   42180.2 +NEON fadd.4s (32bit x4) n1    :    0.638    42178.    2636.( 16 0.9)   42178.8 
-NEON fmla.4s (32bit x4) n1    :    1.366    28121.     878.( 32 0.3)   28121.2 +NEON fmla.4s (32bit x4) n1    :    1.914    28124.     878.( 32 0.3)   28124.7 
-NEON fmul.4s (32bit x4) n12   :    0.683    42182.    2636.( 16 0.9)   42182.0 +NEON fmul.4s (32bit x4) n12   :    0.957    42188.    2636.( 16 0.9)   42188.5 
-NEON fadd.4s (32bit x4) n12   :    0.683    42173.    2635.( 16 0.9)   42173.9 +NEON fadd.4s (32bit x4) n12   :    0.957    42180.    2636.( 16 0.9)   42180.8 
-NEON fmla.4s (32bit x4) n12   :    0.683    84389.    2637.( 32 0.9)   84389.9 +NEON fmla.4s (32bit x4) n12   :    0.957    84399.    2637.( 32 0.9)   84399.7 
-Average                       :    0.516    37750.    3375.( 13 1.2)   37750.8 +Average                       :    0.722    37812.    3389.( 13 1.2)   37812.4 
-Highest                       :    0.228    84389.    5274.( 32 1.9)   84389.9+Highest                       :    0.319    84399.    5272.( 32 1.9)   84399.7
  
  
-* FPU/NEON (double fp) multi-thread+* Group 1:  Thread=4  Clock=2.803200 GHz  (mask:f0) 
 +* FPU/NEON (DP fp) multi-thread
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-FPU fmul (64bit x1) n8        :    0.248    19330.    4832.(  4 1.7)   19330.2 +FPU fmul (64bit x1) n8        :    0.319    21091.    5272.(  4 1.9)   21091.0 
-FPU fadd (64bit x1) n8        :    0.228    21086.    5271.(  4 1.9)   21086.2 +FPU fadd (64bit x1) n8        :    0.319    21089.    5272.(  4 1.9)   21089.9 
-FPU fmadd (64bit x1) n8       :    0.289    33179.    4147.(  8 1.5)   33179.9 +FPU fmadd (64bit x1) n8       :    0.414    32502.    4062.(  8 1.4)   32502.3 
-NEON fmul.2d (64bit x2) n8    :    0.455    21087.    2636.(  8 0.9)   21087.8 +NEON fmul.2d (64bit x2) n8    :    0.638    21084.    2635.(  8 0.9)   21084.7 
-NEON fadd.2d (64bit x2) n8    :    0.455    21090.    2636.(  8 0.9)   21090.8 +NEON fadd.2d (64bit x2) n8    :    0.638    21092.    2636.(  8 0.9)   21092.6 
-NEON fmla.2d (64bit x2) n8    :    0.455    42183.    2636.( 16 0.9)   42183.3 +NEON fmla.2d (64bit x2) n8    :    0.649    41472.    2592.( 16 0.9)   41472.2 
-FPU fmul (64bit x1) ns4       :    0.348    13784.    3446.0 (  4 1.2)   13784.2 +FPU fmul (64bit x1) ns4       :    0.485    13871.    3468.0 (  4 1.2)   13871.9 
-FPU fadd (64bit x1) ns4       :    0.345    13933.    3483.(  4 1.2)   13933.1 +FPU fadd (64bit x1) ns4       :    0.493    13653.    3413.(  4 1.2)   13653.8 
-FPU fmadd (64bit x1) ns4      :    0.350    27445.    3430.(  8 1.2)   27445.9 +FPU fmadd (64bit x1) ns4      :    0.504    26674.    3334.(  8 1.2)   26674.3 
-NEON fmul.2d (64bit x2) ns4   :    0.455    21090.    2636.4 (  8 0.9)   21090.9 +NEON fmul.2d (64bit x2) ns4   :    0.640    21035.    2629.4 (  8 0.9)   21035.6 
-NEON fadd.2d (64bit x2) ns4   :    0.455    21087.    2635.(  8 0.9)   21087.5 +NEON fadd.2d (64bit x2) ns4   :    0.641    20989.    2623.(  8 0.9)   20989.8 
-NEON fmla.2d (64bit x2) ns4   :    0.569    33745.    2109.1 ( 16 0.8)   33745.4 +NEON fmla.2d (64bit x2) ns4   :    0.806    33376.    2086.1 ( 16 0.7)   33376.9 
-FPU fmul (64bit x1) n1        :    0.228    21091.    5272.(  4 1.9)   21091.8 +FPU fmul (64bit x1) n1        :    0.324    20789.    5197.(  4 1.9)   20789.9 
-FPU fadd (64bit x1) n1        :    0.228    21087.    5271.(  4 1.9)   21087.8 +FPU fadd (64bit x1) n1        :    0.329    20459.    5114.(  4 1.8)   20459.1 
-FPU fmadd (64bit x1) n1       :    2.276     4218.     527.(  8 0.2)    4218.0 +FPU fmadd (64bit x1) n1       :    3.190     4217.     527.(  8 0.2)    4217.4 
-NEON fmul.2d (64bit x2) n1    :    0.455    21090.    2636.2 (  8 0.9)   21090.0 +NEON fmul.2d (64bit x2) n1    :    0.638    21089.    2636.2 (  8 0.9)   21089.3 
-NEON fadd.2d (64bit x2) n1    :    0.455    21085.    2635.(  8 0.9)   21085.6 +NEON fadd.2d (64bit x2) n1    :    0.638    21088.    2636.(  8 0.9)   21088.4 
-NEON fmla.2d (64bit x2) n1    :    1.366    14056.     878.( 16 0.3)   14056.1 +NEON fmla.2d (64bit x2) n1    :    1.914    14062.     878.( 16 0.3)   14062.3 
-NEON fmul.2d (64bit x2) n12   :    0.683    21087.    2635.(  8 0.9)   21087.2 +NEON fmul.2d (64bit x2) n12   :    0.957    21085.    2635.(  8 0.9)   21085.9 
-NEON fadd.2d (64bit x2) n12   :    0.683    21089.    2636.(  8 0.9)   21089.0 +NEON fadd.2d (64bit x2) n12   :    0.957    21085.    2635.(  8 0.9)   21085.8 
-NEON fmla.2d (64bit x2) n12   :    0.683    42196.    2637.( 16 0.9)   42196.1 +NEON fmla.2d (64bit x2) n12   :    0.979    41232.    2577.( 16 0.9)   41232.4 
-Average                       :    0.558    22668.    3096.(  8 1.1)   22668.9 +Average                       :    0.784    22526.    3088.(  8 1.1)   22526.0 
-Highest                       :    0.228    42196.    5272.( 16 1.9)   42196.1+Highest                       :    0.319    41472.    5272.( 16 1.9)   41472.2
  
  
 +* Group 1:  Thread=4  Clock=2.803200 GHz  (mask:f0)
 * Matrix 4x4 multi-thread * Matrix 4x4 multi-thread
                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS                                   TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS
-C++ code                      :    0.220    32563.    8140.(  4 2.9)   32563.2 +C++ code                      :    0.327    30720.    7680.(  4 2.7)   30720.8 
-NEON fmla.4s 128bit A         :    0.162    44336.7    11084.(  4 4.0)   44336.7 +NEON fmla.4s 128bit A         :    0.263    38229.5     9557.(  4 3.4)   38229.5 
-NEON fmla.4s 128bit B         :    0.170    42170.7    10542.(  4 3.8)   42170.7 +NEON fmla.4s 128bit B         :    0.269    37384.5     9346.(  4 3.3)   37384.5 
-Average                       :    0.184    39690.    9922.(  4 3.5)   39690.2 +Average                       :    0.286    35444.    8861.(  4 3.2)   35444.9 
-Highest                       :    0.162    44336.7    11084.(  4 4.0)   44336.+Highest                       :    0.263    38229.5     9557.(  4 3.4)   38229.5
- +
- +
-cpu0  1766400 300000 +
-cpu1  1766400 300000 +
-cpu2  1766400 300000 +
-cpu3  1766400 300000 +
-cpu4  2803200 825600 +
-cpu5  2803200 825600 +
-cpu6  2803200 825600 +
-cpu7  2803200 825600 +
- +
-Processor : AArch64 Processor rev 13 (aarch64) +
-processor : 0 +
-BogoMIPS : 38.00 +
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp +
-CPU implementer : 0x51 +
-CPU architecture:+
-CPU variant : 0x7 +
-CPU part : 0x803 +
-CPU revision : 12 +
- +
-processor : 1 +
-BogoMIPS : 38.00 +
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp +
-CPU implementer : 0x51 +
-CPU architecture:+
-CPU variant : 0x7 +
-CPU part : 0x803 +
-CPU revision : 12 +
- +
-processor : 2 +
-BogoMIPS : 38.00 +
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp +
-CPU implementer : 0x51 +
-CPU architecture:+
-CPU variant : 0x7 +
-CPU part : 0x803 +
-CPU revision : 12 +
- +
-processor : 3 +
-BogoMIPS : 38.00 +
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp +
-CPU implementer : 0x51 +
-CPU architecture:+
-CPU variant : 0x7 +
-CPU part : 0x803 +
-CPU revision : 12 +
- +
-processor : 4 +
-BogoMIPS : 38.00 +
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp +
-CPU implementer : 0x51 +
-CPU architecture:+
-CPU variant : 0x6 +
-CPU part : 0x802 +
-CPU revision : 13 +
- +
-processor : 5 +
-BogoMIPS : 38.00 +
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp +
-CPU implementer : 0x51 +
-CPU architecture:+
-CPU variant : 0x6 +
-CPU part : 0x802 +
-CPU revision : 13 +
- +
-processor : 6 +
-BogoMIPS : 38.00 +
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp +
-CPU implementer : 0x51 +
-CPU architecture:+
-CPU variant : 0x6 +
-CPU part : 0x802 +
-CPU revision : 13 +
- +
-processor : 7 +
-BogoMIPS : 38.00 +
-Features : fp asimd evtstrm aes pmull sha1 sha2 crc32 atomics fphp asimdhp +
-CPU implementer : 0x51 +
-CPU architecture:+
-CPU variant : 0x6 +
-CPU part : 0x802 +
-CPU revision : 13 +
- +
-Hardware : Qualcomm Technologies, Inc SDM845+
  
-Qualcomm Technologies, Inc SDM845 
  
-2019/01/05 13:42:09  
 </code> </code>
  
opengl/vfpbenchlog.txt · 最終更新: 2020/12/30 23:46 by oga

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki