ユーザ用ツール

サイト用ツール


opengl:vfpbenchlog

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
opengl:vfpbenchlog [2020/08/13 23:01] – [Qualcomm Kryo 280 (Cortex-A73 + A53) (ARMv8A AArch64 arm64) FPU+ASIMD] ogaopengl:vfpbenchlog [2020/12/30 23:46] (現在) – [結果一覧] oga
行 7: 行 7:
  
 ~~NOTOC~~ ~~NOTOC~~
 +
  
 ===== 結果一覧 ===== ===== 結果一覧 =====
  
 +^ Device  ^ Clock ^ Thread ^  Single Thread                      ^^^  Multi Thread                     ^^^
 +^ :::     ^ :::   ^ :::    ^  Half-p    ^   Single-p  ^  Double-p  ^  Half-p    Single-p  ^  Double-p  ^
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/AMD%20Ryzen%209%203950X%2016-Core%20Processor.txt|AMD Ryzen 9 3950X 16-Core Processor                                   ]]  |  3.493 GHz |  16/32 |     -- |   128.305 |    63.384 |     -- |  1888.789 |   938.944 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/AMD%20Ryzen%207%20PRO%204750G%20with%20Radeon%20Graphics.txt|AMD Ryzen 7 PRO 4750G with Radeon Graphics                            ]]  |  3.593 GHz |  8/16 |     -- |   141.717 |    70.860 |     -- |  1119.103 |   558.094 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Intel%28R%29%20Core%28TM%29%20i7-4790K%20CPU%20%40%204.00GHz.txt|Intel(R) Core(TM) i7-4790K CPU @ 4.00GHz                              ]]  |  4.400 GHz |  4/8 |     -- |   140.704 |    70.256 |     -- |   539.429 |   268.944 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Intel%28R%29%20Core%28TM%29%20i7-6700K%20CPU%20%40%204.00GHz.txt|Intel(R) Core(TM) i7-6700K CPU @ 4.00GHz                              ]]  |  4.200 GHz |  4/8 |     -- |   135.532 |    67.709 |     -- |   537.822 |   271.106 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/AMD%20Ryzen%207%201800X%20Eight-Core%20Processor.txt|AMD Ryzen 7 1800X Eight-Core Processor                                ]]  |  3.600 GHz |  8/16 |     -- |    62.298 |    30.845 |     -- |   465.706 |   228.360 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Apple%20M1%20arm64%20MacBook%20Air%20Late%202020_macOS.txt|Apple M1 arm64 MacBook Air Late 2020_macOS                            ]]  |  3.200 GHz |  8/8 |   153.108 |    76.576 |    38.314 |   838.481 |   418.500 |   209.847 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Intel%28R%29%20Core%28TM%29%20i5-1030NG7%20CPU%20%40%201.10GHz_macOS.txt|Intel(R) Core(TM) i5-1030NG7 CPU @ 1.10GHz_macOS                      ]]  |  1.100 GHz |  4/8 |     -- |   111.310 |    55.593 |     -- |   413.685 |   204.351 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/AMD%20Ryzen%205%203400G%20with%20Radeon%20Vega%20Graphics_cTDP35W.txt|AMD Ryzen 5 3400G with Radeon Vega Graphics_cTDP35W                   ]]  |  3.700 GHz |  4/8 |     -- |    64.323 |    32.149 |     -- |   239.429 |   119.606 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Apple%20A11%20iPhone%20X.txt|Apple A11 iPhone X                                                    ]]  |  2.390 GHz |  6/6 |     -- |    50.968 |    25.414 |     -- |   236.143 |   116.185 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Intel%28R%29%20Core%28TM%29%20i7-3615QM%20CPU%20%40%202.30GHz.txt|Intel(R) Core(TM) i7-3615QM CPU @ 2.30GHz                             ]]  |  2.301 GHz |  4/8 |     -- |    51.748 |    26.067 |     -- |   193.427 |    96.951 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Apple%20M1%20Rosetta%20x86_64%20MacBook%20Air%20Late%202020_macOS.txt|Apple M1 Rosetta x86_64 MacBook Air Late 2020_macOS                   ]]  |  2.400 GHz |  8/8 |     -- |    34.142 |    17.064 |     -- |   192.912 |    96.515 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Qualcomm%20Technologies%2C%20Inc%20SDM845%20Pixel3.txt|Qualcomm Technologies, Inc SDM845 Pixel3                              ]]  |  2.803 GHz |  8/8 |    44.356 |    22.274 |    11.150 |   278.633 |   139.238 |    69.642 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Qualcomm%20Technologies%2C%20Inc%20MSM8998%20835%20EssentialPhone.txt|Qualcomm Technologies, Inc MSM8998 835 EssentialPhone                 ]]  |  2.458 GHz |  8/8 |     -- |    19.547 |     9.776 |     -- |   134.506 |    67.276 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/MT8183%20FireHD10%282019%29.txt|MT8183 FireHD10(2019)                                                 ]]  |  1.989 GHz |  8/8 |     -- |    15.868 |     7.305 |     -- |   125.541 |    57.218 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/AMD%20A10-7870K%20Radeon%20R7%2C%2012%20Compute%20Cores%204C%2B8G.txt|AMD A10-7870K Radeon R7, 12 Compute Cores 4C+8G                       ]]  |  3.900 GHz |  2/4 |     -- |    62.240 |    31.120 |     -- |   124.508 |    62.259 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Hisilicon%20Kirin710%20P30Lite.txt|Hisilicon Kirin710 P30Lite                                            ]]  |  2.189 GHz |  8/8 |     -- |    17.423 |     8.709 |     -- |   117.542 |    58.569 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Apple%20A10%20iPad%207.txt|Apple A10 iPad 7                                                      ]]  |  2.340 GHz |  2/2 |     -- |    54.102 |    26.972 |     -- |   103.423 |    50.847 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Intel%28R%29%20Core%28TM%29%20i5-3210M%20CPU%20%40%202.50GHz.txt|Intel(R) Core(TM) i5-3210M CPU @ 2.50GHz                              ]]  |  2.501 GHz |  2/4 |     -- |    48.911 |    24.474 |     -- |    89.003 |    42.626 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Apple%20A9%20iPad%205.txt|Apple A9 iPad 5                                                       ]]  |  1.850 GHz |  2/2 |     -- |    42.569 |    14.718 |     -- |    85.180 |    29.387 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/RK3399%20ChromebookFlipC101PA.txt|RK3399 ChromebookFlipC101PA                                           ]]  |  2.016 GHz |  6/6 |     -- |    16.062 |     8.030 |     -- |    79.036 |    37.760 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Qualcomm%20Technologies%2C%20Inc%20MSM8937_430_ZenFone3MaxZC553KL.txt|Qualcomm Technologies, Inc MSM8937_430_ZenFone3MaxZC553KL             ]]  |  1.401 GHz |  8/8 |     -- |    10.959 |     5.497 |     -- |    78.350 |    39.069 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Qualcomm%20Technologies%2C%20Inc%20MSM8992%20808%20Nexus5X.txt|Qualcomm Technologies, Inc MSM8992 808 Nexus5X                        ]]  |  1.824 GHz |  6/6 |     -- |    14.524 |     7.261 |     -- |    73.978 |    37.008 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Apple%20A9%20iPhone%20SE.txt|Apple A9 iPhone SE                                                    ]]  |  1.850 GHz |  2/2 |     -- |    42.370 |    14.597 |     -- |    73.316 |    27.426 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Apple%20A8X%20iPad%20Air2.txt|Apple A8X iPad Air2                                                   ]]  |  1.500 GHz |  3/3 |     -- |    23.997 |    11.971 |     -- |    71.878 |    35.941 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Qualcomm%20MSM%208974%20HAMMERHEAD%20%28Flattened%20Device%20Tree%29%20800%20Nexus5.txt|Qualcomm MSM 8974 HAMMERHEAD (Flattened Device Tree) 800 Nexus5       ]]  |  2.266 GHz |  4/4 |     -- |    16.454 |     3.385 |     -- |    65.470 |    13.868 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Intel%28R%29%20Celeron%28R%29%20CPU%20%20J1900%20%20%40%201.99GHz.txt|Intel(R) Celeron(R) CPU  J1900  @ 1.99GHz                             ]]  |  2.416 GHz |  4/4 |     -- |    14.477 |     3.619 |     -- |    57.778 |    14.438 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Intel%28R%29%20Atom%28TM%29%20x7-Z8700%20%20CPU%20%40%201.60GHz_GPDWIN.txt|Intel(R) Atom(TM) x7-Z8700  CPU @ 1.60GHz_GPDWIN                      ]]  |  1.601 GHz |  4/4 |     -- |    14.259 |     3.585 |     -- |    57.101 |    14.184 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/NVIDIA%20Tegra4%20tegratab%20TegraNote7.txt|NVIDIA Tegra4 tegratab TegraNote7                                     ]]  |  1.810 GHz |  4/4 |     -- |    14.090 |     2.610 |     -- |    50.955 |     9.795 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/BCM2711%20Raspberry%20Pi%204%20Model%20B%20Rev%201.11.txt|BCM2711 Raspberry Pi 4 Model B Rev 1.11                               ]]  |  1.500 GHz |  4/4 |     -- |    11.972 |     5.984 |     -- |    47.921 |    23.960 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/NVIDIA_TegraX1_JetsonNano.txt|NVIDIA_TegraX1_JetsonNano                                             ]]  |  1.428 GHz |  4/4 |     -- |    11.401 |     5.702 |     -- |    45.510 |    22.763 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Apple%20A8%20Apple%20TV%20HD.txt|Apple A8 Apple TV HD                                                  ]]  |  1.500 GHz |  2/2 |     -- |    22.204 |    11.107 |     -- |    44.145 |    21.667 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/QCT%20APQ8064%20FLO%20Snapdragon%20S4%20Pro%20Nexus7%282013%29.txt|QCT APQ8064 FLO Snapdragon S4 Pro Nexus7(2013)                        ]]  |  1.512 GHz |  4/4 |     -- |    10.950 |     2.297 |     -- |    43.660 |     9.229 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Apple%20A7%20iPad%20mini%202.txt|Apple A7 iPad mini 2                                                  ]]  |  1.300 GHz |  2/2 |     -- |    20.415 |    10.231 |     -- |    40.904 |    20.443 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Apple%20A7%20iPhone%205S.txt|Apple A7 iPhone 5S                                                    ]]  |  1.300 GHz |  2/2 |     -- |    20.086 |     9.990 |     -- |    40.146 |    20.237 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/BCM2837%20Raspberry%20Pi%203%20Model%20B%20Rev%201.2.txt|BCM2837 Raspberry Pi 3 Model B Rev 1.2                                ]]  |  1.200 GHz |  4/4 |     -- |     9.400 |     4.299 |     -- |    37.230 |    17.211 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/NVIDIA%20TegraK1%20Nexus9.txt|NVIDIA TegraK1 Nexus9                                                 ]]  |  2.499 GHz |  2/2 |     -- |    18.122 |     9.089 |     -- |    36.290 |    18.101 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Apple%20A8%20iPod%20touch%206.txt|Apple A8 iPod touch 6                                                 ]]  |  1.100 GHz |  2/2 |     -- |    17.958 |     8.973 |     -- |    35.796 |    17.899 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Intel%28R%29%20Atom%28TM%29%20CPU%20%20Z3745%20%20%40%201.33GHz_MeMOPad7ME176C.txt|Intel(R) Atom(TM) CPU  Z3745  @ 1.33GHz_MeMOPad7ME176C                ]]  |  1.862 GHz |  4/4 |     -- |     8.927 |     2.783 |     -- |    35.631 |    11.140 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/MT8135%20FireHD6%282014%29.txt|MT8135 FireHD6(2014)                                                  ]]  |  1.508 GHz |  4/4 |     -- |    12.001 |     2.400 |     -- |    28.816 |     7.135 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Apple%20S6%20Watch%20Series%206.txt|Apple S6 Watch Series 6                                               ]]  |  1.500 GHz |  2/2 |    25.256 |    12.629 |     6.314 |    50.421 |    25.223 |    12.600 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Intel%28R%29%20Atom%28TM%29%20CPU%20Z2560%20%20%40%201.60GHz_Fonepad7ME372CL.txt|Intel(R) Atom(TM) CPU Z2560  @ 1.60GHz_Fonepad7ME372CL                ]]  |  1.600 GHz |  2/4 |     -- |     7.588 |     1.544 |     -- |    18.566 |     3.241 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Intel%28R%29%20Celeron%28R%29%202957U%20%40%201.40GHz.txt|Intel(R) Celeron(R) 2957U @ 1.40GHz                                   ]]  |  1.400 GHz |  2/2 |     -- |     8.927 |     4.464 |     -- |    17.850 |     8.928 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Apple%20A6%20iPhone%205.txt|Apple A6 iPhone 5                                                     ]]  |  1.300 GHz |  2/2 |     -- |     9.873 |     1.379 |     -- |    17.146 |     3.142 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/BCM2836%20Raspberry%20Pi%202%20Model%20B%20Rev%201.1.txt|BCM2836 Raspberry Pi 2 Model B Rev 1.1                                ]]  |  0.900 GHz |  4/4 |     -- |     1.777 |     0.871 |     -- |     7.023 |     3.444 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/Apple%20S2%20Watch%20Series%202.txt|Apple S2 Watch Series 2                                               ]]  |  0.520 GHz |  2/2 |     -- |     1.023 |     0.502 |     -- |     1.841 |     0.899 |
 +| [[https://github.com/hiroog/vfpbench/blob/flatlib/log/BCM2835%20Raspberry%20Pi%20Model%20B.txt|BCM2835 Raspberry Pi Model B                                          ]]  |  0.700 GHz |  1/1 |     -- |     0.637 |     0.637 |     -- |     0.637 |     0.629 |
 +
 +
 +
 +
 +  * Half-p, Single-p, Dobule-p の単位は GFLOPS
 +  * Multi Thread Single-p が大きい順に並んでいます。
 +  * Apple M1/A10~ など Apple OS 上の big.LITTLE CPU では LITTLE core の正しい計測ができていません。Multi Thread のスコアは不正確で実際より大きな値が出ています。Single Thread の値だけ見るようにしてください。
 +
 +
 +
 +
 +----
 +
 +==== 旧リスト ====
  
 ^ Device                      ^ OS      ^ SoC                    ^ CPU                  ^ FPU              ^    ^ clock    ^Single-SP^Single-DP^ Multi-SP ^ Multi-DP ^ ^ Device                      ^ OS      ^ SoC                    ^ CPU                  ^ FPU              ^    ^ clock    ^Single-SP^Single-DP^ Multi-SP ^ Multi-DP ^
行 18: 行 81:
 | Apple Mac mini Late 2012    | OSX.10  | Intel Core i7-3615QM   | Ivy Birdge    | x64    | SSE4.2/AVX        4 |   2.3GHz |  51.427 |  25.693 |  194.698 |   96.913 | | Apple Mac mini Late 2012    | OSX.10  | Intel Core i7-3615QM   | Ivy Birdge    | x64    | SSE4.2/AVX        4 |   2.3GHz |  51.427 |  25.693 |  194.698 |   96.913 |
 | Apple MacBook Pro Late 2011 | OSX.10  | Intel Core i7-2720QM   | Sandy Bridge  | x64    | SSE4.2/AVX        4 |   2.2GHz |  52.260 |  26.137 |  162.316 |   74.049 | | Apple MacBook Pro Late 2011 | OSX.10  | Intel Core i7-2720QM   | Sandy Bridge  | x64    | SSE4.2/AVX        4 |   2.2GHz |  52.260 |  26.137 |  162.316 |   74.049 |
-| Pixel 3                     A9.0    | Snapdragon 845         | Kryo 385(A75/55) | ARMv8A | AArch64       |  8 |   2.8GHz |  22.274 |  11.150 |  139.238 |   69.642 | +Google Pixel 3              A10     | Snapdragon 845         | Kryo 385(A75/55) | ARMv8.2A | AArch64     |  8 |   2.8GHz |  22.274 |  11.150 |  139.238 |   69.642 | 
-| Essential Phone PH-1        | A9.0    | Snapdragon 835         | Kryo (A73/53) | ARMv8A | AArch64          |  8 |  2.45GHz |  19.547 |   9.776 |  134.506 |   67.276 | +| Essential Phone PH-1        | A10     | Snapdragon 835         | Kryo (A73/53) | ARMv8A | AArch64          |  8 |  2.45GHz |  19.547 |   9.776 |  134.506 |   67.276 | 
-| Amazon Fire HD 10 2019      | A9.0    | Mediatek MT8183        | A73/A53       | ARMv8A | AArch64          |  8 |   2.0GHz |  31.038  11.671 |  125.468 |   46.937 |+| Amazon Fire HD 10 2019      | A9.0    | Mediatek MT8183        | A73/A53       | ARMv8A | AArch64          |  8 |   2.0GHz |  15.868   7.305 |  125.541 |   57.218 |
 | PC AMD A10-7870K            | Win10   | AMD A10-7870K          | Steamroller   | x64    | SSE4.2/AVX/FMA3  |  2 |   3.9GHz |  64.743 |  32.400 |  124.500 |   62.247 | | PC AMD A10-7870K            | Win10   | AMD A10-7870K          | Steamroller   | x64    | SSE4.2/AVX/FMA3  |  2 |   3.9GHz |  64.743 |  32.400 |  124.500 |   62.247 |
 | Apple MacBook Pro Late 2013 | OSX.10  | Intel Core i5-3210M    | Ivy Birdge    | x64    | SSE4.2/AVX        2 |   2.5GHz |  48.604 |  24.317 |   90.247 |   45.223 | | Apple MacBook Pro Late 2013 | OSX.10  | Intel Core i5-3210M    | Ivy Birdge    | x64    | SSE4.2/AVX        2 |   2.5GHz |  48.604 |  24.317 |   90.247 |   45.223 |
 | iPhone SE                   | iOS9.3  | Apple A9               | Twister       | ARMv8A | AArch64          |  2 |  1.85GHz |  41.857 |  14.545 |   81.071 |   28.333 | | iPhone SE                   | iOS9.3  | Apple A9               | Twister       | ARMv8A | AArch64          |  2 |  1.85GHz |  41.857 |  14.545 |   81.071 |   28.333 |
 +| Chromebook Flip C101PA      | Chrome  | RockChip RK3399        | A72 + A53     | ARMv8A | AArch64          |  6 |   2.0GHz |  16.062 |   8.030 |   79.036 |   37.760 |
 | NVIDIA SHIELD Tablet        | A4.4    | NVIDIA Tegra K1        | Cortex-A15    | ARMv7A | VFPv4 NEON        4 |   2.2GHz |  17.136 |   3.431 |   70.174 |   14.036 | | NVIDIA SHIELD Tablet        | A4.4    | NVIDIA Tegra K1        | Cortex-A15    | ARMv7A | VFPv4 NEON        4 |   2.2GHz |  17.136 |   3.431 |   70.174 |   14.036 |
 | Apple iPad A8X              | i8.0    | Apple A8X              | Typhoon       | ARMv8A | AArch64          |  3 |   1.5GHz |  23.568 |  11.751 |   68.591 |   33.968 | | Apple iPad A8X              | i8.0    | Apple A8X              | Typhoon       | ARMv8A | AArch64          |  3 |   1.5GHz |  23.568 |  11.751 |   68.591 |   33.968 |
行 11747: 行 11811:
  
 <code> <code>
-ARCH: ARMv7A 2 +Date: 20200808 172338 
-FPU: VFPv3-D32 NEON +ARCH: ARMv7A 
-SingleT SP max16.066 GFLOPS +FPU : VFPv4-D32 NEON 
-SingleT DP max8.027 GFLOPS +NameRK3399 ChromebookFlipC101PA 
-MultiT  SP max32.054 GFLOPS +CPU Thread 6 
-MultiT  DP max16.036 GFLOPS +CPU Core  :  6 
-CPU core: 2 +CPU Group :  
-NEON: yes +  Group 0Thread= 4  Clock=1.512000 GHz  (mask:f) 
-FMA : no+  Group 1Thread=  Clock=2.016000 GHz  (mask:30) 
 +NEON   : yes 
 +FMA    : yes 
 +FPHP   : no 
 +SIMDHP : no 
 +DotProd: no
  
-* VFP/NEON (single fp) +Total: 
-                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS +SingleThread HP max: - 
-VFP fmuls (32bit x1) n8          0.342     3503.9     3503.9 (  1 1.7)    3503.9 +SingleThread SP max:   16.062 GFLOPS 
-VFP fadds (32bit x1) n8       :    0.299     4012.7     4012.7 (  1 2.0)    4012.7 +SingleThread DP max:    8.030 GFLOPS 
-VFP fmacs (32bit x1) n8       :    0.299     8027.0     4013.5 (  2 2.0)    8027.0 +MultiThread  HP max: - 
-VFP vfma.f32 (32bit x1) n8    :        -          -          -    -          +MultiThread  SP max:   79.036 GFLOPS 
-NEON vmul.f32 (32bit x2) n8      0.299     8023.6     4011.8 (  2 2.0)    8023.6 +MultiThread  DP max:   37.760 GFLOPS
-NEON vadd.f32 (32bit x2) n8   :    0.299     8027.8     4013.9 (  2 2.0)    8027.8 +
-NEON vmla.f32 (32bit x2) n8   :    0.299    16056.4     4014.1 (  4 2.0)   16056.4 +
-NEON vfma.f32 (32bit x2) n8   :        -          -          -    -          - +
-NEON vmul.f32 (32bit x4) n8   :    0.598     8028.4     2007.1 (  4 1.0)    8028.4 +
-NEON vadd.f32 (32bit x4) n8   :    0.598     8028.6     2007.2 (  4 1.0)    8028.6 +
-NEON vmla.f32 (32bit x4) n8   :    0.598    16057.    2007.2 (  8 1.0)   16057.8 +
-NEON vfma.f32 (32bit x4) n8   :        -          -          -    -          - +
-VFP fmuls (32bit x1) ns4      :    0.598     2006.3     2006.3 (  1 1.0)    2006.3 +
-VFP fadds (32bit x1) ns4         0.599     2002.3     2002.3 (  1 1.0)    2002.3 +
-VFP fmacs (32bit x1) ns4      :    1.046     2294.9     1147.5 (  2 0.6)    2294.9 +
-VFP vfma.f32 (32bit x1) ns4   :        -          -          -    -          +
-NEON vmul.f32 (32bit x2) ns4  :    0.597     4016.8     2008.4 (  2 1.0)    4016.8 +
-NEON vadd.f32 (32bit x2) ns4  :    0.597     4016.8     2008.4 (  2 1.0)    4016.8 +
-NEON vmla.f32 (32bit x2) ns4  :    1.046     4590.9     1147.7 (  4 0.6)    4590.9 +
-NEON vfma.f32 (32bit x2) ns4  :        -          -          -    -          - +
-NEON vmul.f32 (32bit x4) ns4  :    0.597     8033.6     2008.4 (  4 1.0)    8033.6 +
-NEON vadd.f32 (32bit x4) ns4  :    0.597     8033.5     2008.4 (  4 1.0)    8033.5 +
-NEON vmla.f32 (32bit x4) ns4  :    1.046     9181.9     1147.7 (  8 0.6)    9181.9 +
-NEON vfma.f32 (32bit x4) ns4  :        -          -          -    -          - +
-VFP fmuls (32bit x1) n1       :    0.299     4015.6     4015.6 (  1 2.0)    4015.6 +
-VFP fadds (32bit x1) n1       :    0.299     4016.2     4016.2 (  1 2.0)    4016.2 +
-VFP fmacs (32bit x1) n1       :    1.793     1338.7      669.4 (  2 0.3)    1338.7 +
-VFP vfma.f32 (32bit x1) n1    :        -          -          -    -          - +
-NEON vmul.f32 (32bit x2) n1   :    0.299     8033.1     4016.5 (  2 2.0)    8033.1 +
-NEON vadd.f32 (32bit x2) n1   :    0.299     8033.8     4016.9 (  2 2.0)    8033.8 +
-NEON vmla.f32 (32bit x2) n1      1.797     2671.8      667.9 (  4 0.3)    2671.8 +
-NEON vfma.f32 (32bit x2) n1   :        -          -          -    -          - +
-NEON vmul.f32 (32bit x4) n1   :    0.598     8031.8     2008.0 (  4 1.0)    8031.8 +
-NEON vadd.f32 (32bit x4) n1   :    0.597     8033.5     2008.4 (  4 1.0)    8033.5 +
-NEON vmla.f32 (32bit x4) n1   :    1.793     5355.4      669.4 (  8 0.3)    5355.4 +
-NEON vfma.f32 (32bit x4) n1   :        -          -          -    -          - +
-NEON vmul.f32 (32bit x4) n12  :    0.896     8032.5     2008.1 (  4 1.0)    8032.5 +
-NEON vadd.f32 (32bit x4) n12  :    0.896     8032.8     2008.2 (  4 1.0)    8032.8 +
-NEON vmla.f32 (32bit x4) n12  :    0.896    16066.1     2008.3 (  8 1.0)   16066.1 +
-NEON vfma.f32 (32bit x4) n12  :        -          -          -    -          - +
-Average                       :    0.694     6853.5     2439.7 (  3 1.2)    6853.5 +
-Highest                       :    0.299    16066.1     4016.9 (  8 2.0)   16066.1+
  
 +Group 0:  Thread=4  Clock=1.512000 GHz  (mask:f)
 +  SingleThread HP max: -
 +  SingleThread SP max:   11.801 GFLOPS
 +  SingleThread DP max:    5.459 GFLOPS
 +  MultiThread  HP max: -
 +  MultiThread  SP max:   46.919 GFLOPS
 +  MultiThread  DP max:   21.746 GFLOPS
  
-* VFP/NEON (double fp) +Group 1:  Thread=2  Clock=2.016000 GHz  (mask:30
-                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS +  SingleThread HP max: - 
-VFP fmuld (64bit x1) n8       :    0.338     3547.8     3547.8 (  1.8)    3547.8 +  SingleThread SP max  16.062 GFLOPS 
-VFP faddd (64bit x1) n8          0.299     4014.9     4014.9 (  2.0)    4014.9 +  SingleThread DP max:    8.030 GFLOPS 
-VFP fmacd (64bit x1) n8       :    0.299     8026.9     4013.4 (  2.0)    8026.9 +  MultiThread  HP max: - 
-VFP vfma.f64 (64bit x1) n8    :        -          -          -    -          - +  MultiThread  SP max  32.117 GFLOPS 
-VFP fmuld (64bit x1) ns4      :    0.598     2008.3     2008.3 (  1 1.0)    2008.3 +  MultiThread  DP max  16.013 GFLOPS
-VFP faddd (64bit x1) ns4         0.597     2008.4     2008.4 (  1 1.0   2008.4 +
-VFP fmacd (64bit x1) ns4      :    1.046     2295.2     1147.6 (  2 0.6)    2295.2 +
-VFP vfma.f64 (64bit x1) ns4                   -          -    -          +
-VFP fmuld (64bit x1) n1          0.301     3985.4     3985.4 (  1 2.0)    3985.4 +
-VFP faddd (64bit x1) n1       :    0.299     4015.9     4015.9 (  1 2.0)    4015.9 +
-VFP fmacd (64bit x1) n1       :    1.793     1338.9      669.4 (  2 0.3)    1338.9 +
-VFP vfma.f64 (64bit x1) n1                    -          -    -          +
-Average                          0.619     3471.3     2823.5 (  1 1.4)    3471.3 +
-Highest                          0.299     8026.9     4015.9 (  2 2.0)    8026.9+
  
  
-Matrix 4x4 +Group 0:  Thread=1  Clock=1.512000 GHz  (mask:f) 
-                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS +* VFP/NEON (SP fp) 
-C++ code                      :    0.431     4159.    4159.1 (  1 2.1)    4159.1 +                                  TIME(s)   MFLOPS      MOPS     FOP   IPC 
-NEON vmla 128bit A            :    0.208     8625.    8625.(  1 4.3)    8625.8 +VFP fmuls (32bit x1) n8       :    0.364     2490.    2490.4  (  1.0 1.6) 
-NEON vmla  64bit A            :    0.208     8626.    8626.(  1 4.3)    8626.9 +VFP fadds (32bit x1) n8       :    0.327     2771.8     2771.8  (  1.1.8) 
-NEON vfma 128bit A            :        -          -          -    -          - +VFP fmacs (32bit x1) n8       :    0.522     3475.3     1737.6  (  2.0 1.1) 
-NEON vmla 128bit B            :    0.216     8307.9     8307.9 (  1 4.1)    8307.9 +VFP vfma.f32 (32bit x1) n8    :        -          -          -         - 
-NEON vmla  64bit B            :    0.217     8255.4     8255.4 (  4.1)    8255.4 +NEON vmul.f32 (32bit x2) n8   :    0.318     5712.    2856.2  (  2.0 1.9) 
-NEON vfma 128bit B            :        -          -          -    -          - +NEON vadd.f32 (32bit x2) n8   :    0.326     5558.3     2779.2  (  2.0 1.8) 
-NEON vfma 128bit C            :        -          -          -             +NEON vmla.f32 (32bit x2) n8   :    0.580     6254.    1563.6  (  4.0 1.0) 
-Average                       :    0.256     7595.0     7595.0 (  1 3.8)    7595.0 +NEON vfma.f32 (32bit x2) n8   :        -          -          -         - 
-Highest                       :    0.208     8626.    8626.(  1 4.3)    8626.9+NEON vmul.f32 (32bit x4) n8   :    0.621     5841.3     1460.3  (  4.0 1.0) 
 +NEON vadd.f32 (32bit x4) n8   :    0.621     5846.3     1461.6  (  4.0 1.0) 
 +NEON vmla.f32 (32bit x4) n8   :    0.621    11687.8     1461.0  (  8.0 1.0) 
 +NEON vfma.f32 (32bit x4) n8   :        -          -          -       -   - 
 +VFP fmuls (32bit x1) ns4      :    0.606     1496.2     1496.2  (  1.0 1.0) 
 +VFP fadds (32bit x1) ns4      :    0.607     1495.3     1495.3  (  1.0 1.0) 
 +VFP fmacs (32bit x1) ns4      :    1.210     1499.1      749.5  (  2.0 0.5) 
 +VFP vfma.f32 (32bit x1) ns4   :        -          -          -         
 +NEON vmul.f32 (32bit x2) ns4  :    0.604     3001.9     1500.9  (  2.1.0) 
 +NEON vadd.f32 (32bit x2) ns4  :    0.605     3001.0     1500.5  (  2.0 1.0) 
 +NEON vmla.f32 (32bit x2) ns4  :    1.221     2972.8      743.2  (  4.0 0.5) 
 +NEON vfma.f32 (32bit x2) ns4  :        -          -          -         - 
 +NEON vmul.f32 (32bit x4) ns4  :    0.620     5852.9     1463.2  (  4.0 1.0) 
 +NEON vadd.f32 (32bit x4) ns4  :    0.619     5857.8     1464.4  (  4.1.0) 
 +NEON vmla.f32 (32bit x4) ns4  :    1.209     6004.6      750.6  (  8.0 0.5) 
 +NEON vfma.f32 (32bit x4) ns4  :        -          -          -       -   - 
 +VFP fmuls (32bit x1) n1       :    0.604     1501.2     1501.2  (  1.0 1.0) 
 +VFP fadds (32bit x1) n1       :    0.604     1501.3     1501.3  (  1.0 1.0) 
 +VFP fmacs (32bit x1) n1       :    2.417      750.6      375.3  (  2.0 0.2) 
 +VFP vfma.f32 (32bit x1) n1    :        -          -          -         - 
 +NEON vmul.f32 (32bit x2) n1   :    0.604     3002.7     1501.4  (  2.0 1.0) 
 +NEON vadd.f32 (32bit x2) n1   :    0.604     3002.7     1501.4  (  2.0 1.0) 
 +NEON vmla.f32 (32bit x2) n1   :    2.417     1501.4      375.3  (  4.0 0.2) 
 +NEON vfma.f32 (32bit x2) n1   :        -          -          -         
 +NEON vmul.f32 (32bit x4) n1   :    0.619     5858.7     1464.7  (  4.0 1.0) 
 +NEON vadd.f32 (32bit x4) n1   :    0.619     5858.7     1464.7  (  4.0 1.0) 
 +NEON vmla.f32 (32bit x4) n1   :    2.417     3002.2      375.3  (  8.0 0.2) 
 +NEON vfma.f32 (32bit x4) n1   :        -          -          -         - 
 +NEON vmul.f32 (32bit x4) n12  :    0.922     5901.4     1475.3  (  4.0 1.0) 
 +NEON vadd.f32 (32bit x4) n12  :    0.922     5903.    1475.8   4.0 1.0) 
 +NEON vmla.f32 (32bit x4) n12  :    0.923    11800.8     1475.1  (  8.0 1.0) 
 +NEON vfma.f32 (32bit x4) n12  :        -          -          -         - 
 +Average                       :    0.843     4346.    1474.4  (  3.3 1.0) 
 +Highest                       :    0.318    11800.8     2856.2  (  8.0 1.9)
  
  
-* VFP/NEON (single fp) multi-thread +* Group 0:  Thread=1  Clock=1.512000 GHz  (mask:f) 
-                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS +* VFP/NEON (DP fp) 
-VFP fmuls (32bit x1) n8       :    0.336     7148.    3574.(  1.8)    7148.2 +                                  TIME(s)   MFLOPS      MOPS     FOP   IPC 
-VFP fadds (32bit x1) n8       :    0.301     7984.    3992.(  2 2.0)    7984.0 +VFP fmuld (64bit x1) n8       :    0.345     2629.    2629.7  (  1.0 1.7) 
-VFP fmacs (32bit x1) n8       :    0.301    15935.4     3983.9 (  4 2.0  15935.4 +VFP faddd (64bit x1) n8       :    0.317     2859.    2859.4  (  1.0 1.9) 
-VFP vfma.f32 (32bit x1) n8    :        -          -          -    -          - +VFP fmacd (64bit x1) n8       :    0.332     5459.    2729.  2.0 1.8) 
-NEON vmul.f32 (32bit x2) n8   :    0.300    15996.9     3999.2 (  4 2.0)   15996.9 +VFP vfma.f64 (64bit x1) n8    :        -          -          -         
-NEON vadd.f32 (32bit x2) n8   :    0.302    15904.8     3976.2 (  4 2.0)   15904.8 +VFP fmuld (64bit x1) ns4      :    0.604     1501.    1501.0  (  1.0 1.0) 
-NEON vmla.f32 (32bit x2) n8   :    0.301    31924.0     3990.5 (  2.0)   31924.0 +VFP faddd (64bit x1) ns4      :    0.604     1501.    1501.2  (  1.0 1.0) 
-NEON vfma.f32 (32bit x2) n8   :        -          -          -    -          - +VFP fmacd (64bit x1) ns4      :    1.218     1489.6      744.8  (  2.0 0.5
-NEON vmul.f32 (32bit x4) n8   :    0.599    16019.5     2002.4 (  8 1.0)   16019.5 +VFP vfma.f64 (64bit x1) ns4   :        -          -          -         
-NEON vadd.f32 (32bit x4) n8   :    0.600    15987.2     1998.4 (  1.0  15987.2 +VFP fmuld (64bit x1) n1       :    0.605     1500.    1500.4  (  1.0 1.0) 
-NEON vmla.f32 (32bit x4) n8   :    0.601    31941.5     1996.3 ( 16 1.0)   31941.5 +VFP faddd (64bit x1) n1       :    0.604     1501.    1501.1  (  1.0 1.0) 
-NEON vfma.f32 (32bit x4) n8   :        -          -          -             +VFP fmacd (64bit x1) n1       :    2.419      750.1      375.1  (  2.0 0.2
-VFP fmuls (32bit x1) ns4      :    0.599     4004.    2002.0 (  1.0)    4004.1 +VFP vfma.f64 (64bit x1) n1    :        -          -          -         
-VFP fadds (32bit x1) ns4      :    0.606     3961.9     1981.0 (  2 1.0)    3961.9 +Average                       :    0.783     2132.4     1704.7  (  1.1.1) 
-VFP fmacs (32bit x1) ns4      :    1.053     4558.1     1139.5 (  4 0.6)    4558.1 +Highest                       :    0.317     5459.3     2859.4  (  2.0 1.9)
-VFP vfma.f32 (32bit x1) ns4   :        -          -          -    -          - +
-NEON vmul.f32 (32bit x2) ns4  :    0.599     8009.    2002.2 (  1.0)    8009.0 +
-NEON vadd.f32 (32bit x2) ns4  :    0.601     7981.9     1995.5 (  4 1.0)    7981.9 +
-NEON vmla.f32 (32bit x2) ns4  :    1.050     9146.3     1143.3 (  8 0.6)    9146.3 +
-NEON vfma.f32 (32bit x2) ns4  :        -          -          -    -          - +
-NEON vmul.f32 (32bit x4) ns4  :    0.599    16014.8     2001.9 (  8 1.0)   16014.8 +
-NEON vadd.f32 (32bit x4) ns4  :    0.604    15897.6     1987.(  8 1.0)   15897.6 +
-NEON vmla.f32 (32bit x4) ns4  :    1.049    18307.6     1144.2 ( 16 0.6  18307.6 +
-NEON vfma.f32 (32bit x4) ns4  :        -          -          -             +
-VFP fmuls (32bit x1) n1       :    0.300     8006.    4003.4 (  2 2.0)    8006.7 +
-VFP fadds (32bit x1) n1       :    0.300     7998.    3999.(  2 2.0)    7998.8 +
-VFP fmacs (32bit x1) n1       :    1.812     2649.0      662.3 (  4 0.3   2649.0 +
-VFP vfma.f32 (32bit x1) n1                    -          -    -          - +
-NEON vmul.f32 (32bit x2) n1   :    0.300    15994.5     3998.6 (  4 2.0)   15994.+
-NEON vadd.f32 (32bit x2) n1   :    0.300    16006.1     4001.5 (  2.0)   16006.1 +
-NEON vmla.f32 (32bit x2) n1   :    1.804     5322.5      665.3 (  8 0.3   5322.5 +
-NEON vfma.f32 (32bit x2) n1   :        -          -          -             +
-NEON vmul.f32 (32bit x4) n1   :    0.602    15955.7     1994.5 (  8 1.0)   15955.7 +
-NEON vadd.f32 (32bit x4) n1   :    0.603    15922.4     1990.(  1.0)   15922.4 +
-NEON vmla.f32 (32bit x4) n1   :    1.801    10657.9      666.1 ( 16 0.3  10657.9 +
-NEON vfma.f32 (32bit x4) n1   :        -          -          -    -          - +
-NEON vmul.f32 (32bit x4) n12  :    0.900    15998.6     1999.8 (  8 1.0)   15998.6 +
-NEON vadd.f32 (32bit x4) n12  :    0.900    15994.6     1999.3 (  8 1.0)   15994.6 +
-NEON vmla.f32 (32bit x4) n12  :    0.898    32053.6     2003.4 ( 16 1.0)   32053.6 +
-NEON vfma.f32 (32bit x4) n12  :        -          -          -    -          - +
-Average                       :    0.697    13642.8     2429.8 (  7 1.2)   13642.+
-Highest                       :    0.300    32053.6     4003.4 ( 16 2.0  32053.6+
  
  
-* VFP/NEON (double fp) multi-thread +* Group 0:  Thread=4  Clock=1.512000 GHz  (mask:f) 
-                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS +* VFP/NEON (SP fp) multi-thread 
-VFP fmuld (64bit x1) n8       :    0.313     7678.1     3839.0 (  1.9)    7678.1 +                                  TIME(s)   MFLOPS      MOPS     FOP   IPC 
-VFP faddd (64bit x1) n8       :    0.300     8007.    4003.(  2 2.0)    8007.2 +VFP fmuls (32bit x1) n8       :    0.339    10701.7     2675.4  (  4.0 1.8) 
-VFP fmacd (64bit x1) n8       :    0.299    16035.    4008.9 (  2.0)   16035.5 +VFP fadds (32bit x1) n8       :    0.323    11245.3     2811.3  (  4.0 1.9) 
-VFP vfma.f64 (64bit x1) n8    :        -          -          -             +VFP fmacs (32bit x1) n8       :    0.527    13773.3     1721.7  (  8.0 1.1) 
-VFP fmuld (64bit x1) ns4      :    0.600     3999.    1999.(  1.0)    3999.4 +VFP vfma.f32 (32bit x1) n8    :        -          -          -       -   - 
-VFP faddd (64bit x1) ns4      :    0.605     3964.    1982.(  1.0)    3964.8 +NEON vmul.f32 (32bit x2) n8   :    0.322    22549.4     2818.7  (  8.0 1.9) 
-VFP fmacd (64bit x1) ns4      :    1.051     4565.6     1141.(  0.6   4565.6 +NEON vadd.f32 (32bit x2) n8   :    0.328    22128.0     2766.0  (  8.0 1.8) 
-VFP vfma.f64 (64bit x1) ns4   :        -          -          -             +NEON vmla.f32 (32bit x2) n8   :    0.591    24570.6     1535.7  ( 16.0 1.0) 
-VFP fmuld (64bit x1n1       :    0.300     8010.1     4005.1 (  2 2.0)    8010.1 +NEON vfma.f32 (32bit x2) n8   :        -          -          -       -   - 
-VFP faddd (64bit x1) n1       :    0.299     8017.1     4008.(  2 2.0)    8017.+NEON vmul.f32 (32bit x4) n8   :    0.626    23194.    1449. ( 16.0 1.0) 
-VFP fmacd (64bit x1) n1       :    1.806     2658.0      664.(  4 0.3)    2658.0 +NEON vadd.f32 (32bit x4) n8   :    0.630    23050.    1440.6  ( 16.0 1.0) 
-VFP vfma.f64 (64bit x1) n1    :        -          -          -             +NEON vmla.f32 (32bit x4) n8   :    0.630    46066.7     1439.6  ( 32.0 1.0) 
-Average                       :    0.619     6992.    2850.(  1.4)    6992.9 +NEON vfma.f32 (32bit x4) n8   :        -          -          -         
-Highest                       :    0.299    16035.    4008.9 (  2.0)   16035.5+VFP fmuls (32bit x1) ns4      :    0.613     5915.    1478.9  (  4.0 1.0) 
 +VFP fadds (32bit x1) ns4      :    0.608     5971.    1492.8  (  4.0 1.0) 
 +VFP fmacs (32bit x1) ns4      :    1.219     5952.8      744.1  (  8.0 0.5
 +VFP vfma.f32 (32bit x1) ns4   :        -          -          -         
 +NEON vmul.f32 (32bit x2ns4  :    0.609    11918.0     1489.8  (  8.0 1.0) 
 +NEON vadd.f32 (32bit x2) ns4  :    0.607    11947.7     1493.5  (  8.0 1.0) 
 +NEON vmla.f32 (32bit x2) ns4  :    1.227    11827.9      739. ( 16.0 0.5) 
 +NEON vfma.f32 (32bit x2) ns4  :        -          -          -         - 
 +NEON vmul.f32 (32bit x4) ns4  :    0.623    23296.9     1456.1  ( 16.0 1.0) 
 +NEON vadd.f32 (32bit x4) ns4  :    0.623    23288.7     1455.5  ( 16.0 1.0) 
 +NEON vmla.f32 (32bit x4) ns4  :    1.214    23903.3      747.0  ( 32.0 0.5) 
 +NEON vfma.f32 (32bit x4) ns4  :        -          -          -         - 
 +VFP fmuls (32bit x1) n1       :    0.612     5934.1     1483.5  (  4.0 1.0) 
 +VFP fadds (32bit x1) n1       :    0.609     5958.9     1489.7  (  4.1.0) 
 +VFP fmacs (32bit x1) n1       :    2.438     2977.1      372.1  (  8.0 0.2) 
 +VFP vfma.f32 (32bit x1) n1    :        -          -          -         
 +NEON vmul.f32 (32bit x2) n1   :    0.609    11916.6     1489.6  (  8.0 1.0) 
 +NEON vadd.f32 (32bit x2) n1   :    0.609    11913.6     1489.2  (  8.0 1.0) 
 +NEON vmla.f32 (32bit x2) n1   :    2.439     5950.3      371.9  ( 16.0 0.2) 
 +NEON vfma.f32 (32bit x2) n1   :        -          -          -         - 
 +NEON vmul.f32 (32bit x4) n1   :    0.626    23197.    1449.8  ( 16.0 1.0) 
 +NEON vadd.f32 (32bit x4) n1   :    0.626    23180.7     1448.8  ( 16.0 1.0) 
 +NEON vmla.f32 (32bit x4) n1   :    2.440    11897.9      371.8  32.0 0.2) 
 +NEON vfma.f32 (32bit x4) n1   :        -          -          -         - 
 +NEON vmul.f32 (32bit x4) n12  :    0.929    23441.0     1465.1  ( 16.0 1.0) 
 +NEON vadd.f32 (32bit x4) n12  :    0.930    23401.3     1462.6  ( 16.0 1.0) 
 +NEON vmla.f32 (32bit x4) n12  :    0.928    46918.9     1466. ( 32.0 1.0) 
 +NEON vfma.f32 (32bit x4) n12  :        -          -          -         
 +Average                       :    0.848    17266.3     1470.5  ( 13.3 1.0) 
 +Highest                       :    0.322    46918.9     2818.7  ( 32.0 1.9)
  
  
-Matrix 4x4 multi-thread +Group 0:  Thread=4  Clock=1.512000 GHz  (mask:f) 
-                                  TIME(s)   MFLOPS      MOPS    FOP IPC  max MFLOPS +* VFP/NEON (DP fp) multi-thread 
-C++ code                      :    0.449     7978.    3989.(  2 2.0)    7978.2 +                                  TIME(s)   MFLOPS      MOPS     FOP   IPC 
-NEON vmla 128bit A            :    0.208    17198.    8599.(  4.3  17198.1 +VFP fmuld (64bit x1) n8       :    0.354    10241.    2560.2  (  4.0 1.7) 
-NEON vmla  64bit A            :    0.208    17207.    8603.(  2 4.3)   17207.9 +VFP faddd (64bit x1) n8       :    0.320    11325.    2831.3  (  4.0 1.9
-NEON vfma 128bit A            :        -          -          -             +VFP fmacd (64bit x1) n8       :    0.334    21746.    2718.3  (  8.0 1.8) 
-NEON vmla 128bit B            :    0.216    16566.    8283.(  4.1)   16566.0 +VFP vfma.f64 (64bit x1) n8    :        -          -          -         
-NEON vmla  64bit B            :    0.216    16579.    8289.(  4.1)   16579.0 +VFP fmuld (64bit x1) ns4      :    0.608     5969.    1492.3  (  4.1.0) 
-NEON vfma 128bit B            :        -          -          -             +VFP faddd (64bit x1) ns4      :    0.608     5965.    1491.3  (  4.1.0) 
-NEON vfma 128bit C            :        -          -          -             +VFP fmacd (64bit x1) ns4      :    1.224     5930.4      741.3  (  8.0 0.5) 
-Average                       :    0.260    15105.    7552.(  3.7  15105.8 +VFP vfma.f64 (64bit x1) ns4   :        -          -          -         
-Highest                       :    0.208    17207.    8603.(  2 4.3)   17207.9+VFP fmuld (64bit x1) n1       :    0.609     5957.9     1489.5  (  4.0 1.0) 
 +VFP faddd (64bit x1) n1       :    0.609     5961.5     1490.4  (  4.0 1.0) 
 +VFP fmacd (64bit x1) n1       :    2.432     2984.7      373.1  (  8.0 0.2) 
 +VFP vfma.f64 (64bit x1) n1    :        -          -          -         
 +Average                       :    0.789     8453.    1687.5  (  5.1.1
 +Highest                       :    0.320    21746.    2831.3  (  8.0 1.9)
  
  
-cpu0  1512000 408000 +* Group 1:  Thread=1  Clock=2.016000 GHz  (mask:30) 
-cpu1  1512000 408000 +* VFP/NEON (SP fp) 
-cpu2  1512000 408000 +                                  TIME(s)   MFLOPS      MOPS     FOP   IPC 
-cpu3  1512000 408000 +VFP fmuls (32bit x1) n8       :    0.340     3559.3     3559.3  (  1.0 1.8) 
-cpu4  2016000 408000 +VFP fadds (32bit x1) n8       :    0.301     4012.0     4012.0  (  1.0 2.0) 
-cpu5  2016000 408000+VFP fmacs (32bit x1) n8       :    0.301     8027.5     4013.8  (  2.0 2.0) 
 +VFP vfma.f32 (32bit x1) n8    :        -          -          -         - 
 +NEON vmul.f32 (32bit x2) n8   :    0.303     7981.7     3990.8  (  2.0 2.0) 
 +NEON vadd.f32 (32bit x2) n8   :    0.301     8027.1     4013.6  (  2.0 2.0) 
 +NEON vmla.f32 (32bit x2) n8   :    0.302    16030.0     4007.5  (  4.0 2.0) 
 +NEON vfma.f32 (32bit x2) n8   :        -          -          -         - 
 +NEON vmul.f32 (32bit x4) n8   :    0.603     8028.6     2007.2  (  4.0 1.0) 
 +NEON vadd.f32 (32bit x4) n8   :    0.602     8030.9     2007.7  (  4.0 1.0) 
 +NEON vmla.f32 (32bit x4) n8   :    0.603    16059.9     2007.5  (  8.0 1.0) 
 +NEON vfma.f32 (32bit x4) n8   :        -          -          -         - 
 +VFP fmuls (32bit x1) ns4      :    0.602     2007.7     2007.7  (  1.0 1.0) 
 +VFP fadds (32bit x1) ns4      :    0.602     2007.8     2007.8  (  1.0 1.0) 
 +VFP fmacs (32bit x1) ns4      :    1.054     2294.9     1147.5  (  2.0 0.6) 
 +VFP vfma.f32 (32bit x1) ns4   :        -          -          -         - 
 +NEON vmul.f32 (32bit x2) ns4  :    0.602     4015.8     2007.9  (  2.0 1.0) 
 +NEON vadd.f32 (32bit x2) ns4  :    0.602     4015.8     2007.9  (  2.0 1.0) 
 +NEON vmla.f32 (32bit x2) ns4  :    1.054     4589.3     1147.3  (  4.0 0.6) 
 +NEON vfma.f32 (32bit x2) ns4  :        -          -          -         - 
 +NEON vmul.f32 (32bit x4) ns4  :    0.602     8031.7     2007.9  (  4.0 1.0) 
 +NEON vadd.f32 (32bit x4) ns4  :    0.602     8032.5     2008.1  (  4.0 1.0) 
 +NEON vmla.f32 (32bit x4) ns4  :    1.055     9176.5     1147.1  (  8.0 0.6) 
 +NEON vfma.f32 (32bit x4) ns4  :        -          -          -         - 
 +VFP fmuls (32bit x1) n1       :    0.301     4015.6     4015.6  (  1.0 2.0) 
 +VFP fadds (32bit x1) n1       :    0.301     4016.1     4016.1  (  1.0 2.0) 
 +VFP fmacs (32bit x1) n1       :    1.807     1338.5      669.2  (  2.0 0.3) 
 +VFP vfma.f32 (32bit x1) n1    :        -          -          -         - 
 +NEON vmul.f32 (32bit x2) n1   :    0.301     8032.3     4016.1  (  2.0 2.0) 
 +NEON vadd.f32 (32bit x2) n1   :    0.301     8032.0     4016.0  (  2.0 2.0) 
 +NEON vmla.f32 (32bit x2) n1   :    1.808     2676.4      669.1  (  4.0 0.3) 
 +NEON vfma.f32 (32bit x2) n1   :        -          -          -         - 
 +NEON vmul.f32 (32bit x4) n1   :    0.602     8031.9     2008.0  (  4.0 1.0) 
 +NEON vadd.f32 (32bit x4) n1   :    0.602     8031.2     2007.8  (  4.0 1.0) 
 +NEON vmla.f32 (32bit x4) n1   :    1.807     5354.1      669.3  (  8.0 0.3) 
 +NEON vfma.f32 (32bit x4) n1   :        -          -          -         - 
 +NEON vmul.f32 (32bit x4) n12  :    0.904     8031.2     2007.8  (  4.0 1.0) 
 +NEON vadd.f32 (32bit x4) n12  :    0.904     8031.0     2007.8  (  4.0 1.0) 
 +NEON vmla.f32 (32bit x4) n12  :    0.904    16062.4     2007.8  (  8.0 1.0) 
 +NEON vfma.f32 (32bit x4) n12  :        -          -          -         - 
 +Average                       :    0.699     6852.7     2440.6  (  3.3 1.2) 
 +Highest                       :    0.301    16062.4     4016.1  8.0 2.0)
  
-processor : 0 
-model name : ARMv8 Processor rev 4 (v8l) 
-BogoMIPS : 48.00 
-Features : half thumb fastmult vfp edsp neon vfpv3 tls vfpv4 idiva idivt lpae evtstrm aes pmull sha1 sha2 crc32 
-CPU implementer : 0x41 
-CPU architecture: 8 
-CPU variant : 0x0 
-CPU part : 0xd03 
-CPU revision : 4 
  
-processor : 1 +* Group 1 Thread= Clock=2.016000 GHz  (mask:30) 
-model name ARMv8 Processor rev 4 (v8l+* VFP/NEON (DP fp) 
-BogoMIPS 48.00 +                                  TIME(s)   MFLOPS      MOPS     FOP   IPC 
-Features half thumb fastmult vfp edsp neon vfpv3 tls vfpv4 idiva idivt lpae evtstrm aes pmull sha1 sha2 crc32 +VFP fmuld (64bit x1) n8          0.328     3682.8     3682.8   1.0 1.8
-CPU implementer 0x41 +VFP faddd (64bit x1) n8          0.301     4014.0     4014.0  (  1.0 2.0) 
-CPU architecture: 8 +VFP fmacd (64bit x1) n8          0.301     8030.1     4015.1  (  2.0 2.0) 
-CPU variant 0x0 +VFP vfma.f64 (64bit x1) n8                    -          -         - 
-CPU part 0xd03 +VFP fmuld (64bit x1) ns4         0.602     2008.1     2008.1  (  1.0 1.0) 
-CPU revision : 4+VFP faddd (64bit x1) ns4      :    0.603     2007.6     2007.6  (  1.0 1.0) 
 +VFP fmacd (64bit x1) ns4      :    1.054     2294.    1147.4  (  2.0 0.6) 
 +VFP vfma.f64 (64bit x1) ns4                   -          -         - 
 +VFP fmuld (64bit x1) n1          0.301     4016.3     4016.3  (  1.0 2.0) 
 +VFP faddd (64bit x1) n1          0.301     4016.1     4016.1  (  1.0 2.0) 
 +VFP fmacd (64bit x1) n1       :    1.807     1338.6      669.3  (  2.0 0.3) 
 +VFP vfma.f64 (64bit x1) n1    :        -          -          -         - 
 +Average                       :    0.622     3489.8     2841.8  (  1.3 1.4
 +Highest                       :    0.301     8030.1     4016.3  (  2.0 2.0)
  
-processor : 2 
-model name : ARMv8 Processor rev 4 (v8l) 
-BogoMIPS : 48.00 
-Features : half thumb fastmult vfp edsp neon vfpv3 tls vfpv4 idiva idivt lpae evtstrm aes pmull sha1 sha2 crc32 
-CPU implementer : 0x41 
-CPU architecture: 8 
-CPU variant : 0x0 
-CPU part : 0xd03 
-CPU revision : 4 
  
-processor : 3 +* Group 1 Thread=2  Clock=2.016000 GHz  (mask:30) 
-model name ARMv8 Processor rev 4 (v8l+* VFP/NEON (SP fp) multi-thread 
-BogoMIPS 48.00 +                                  TIME(s)   MFLOPS      MOPS     FOP   IPC 
-Features half thumb fastmult vfp edsp neon vfpv3 tls vfpv4 idiva idivt lpae evtstrm aes pmull sha1 sha2 crc32 +VFP fmuls (32bit x1) n8       :    0.333     7254.2     3627.1  (  2.0 1.8) 
-CPU implementer 0x41 +VFP fadds (32bit x1) n8       :    0.302     8015.4     4007.7  (  2.0 2.0) 
-CPU architecture: 8 +VFP fmacs (32bit x1) n8       :    0.302    16041.    4010.3  (  4.0 2.0) 
-CPU variant 0x0 +VFP vfma.f32 (32bit x1) n8                    -          -         - 
-CPU part 0xd03 +NEON vmul.f32 (32bit x2) n8   :    0.302    16035.5     4008.9  (  4.0 2.0) 
-CPU revision : 4+NEON vadd.f32 (32bit x2) n8   :    0.302    16042.2     4010.5  (  4.0 2.0
 +NEON vmla.f32 (32bit x2) n8      0.302    32089.1     4011.1  (  8.0 2.0) 
 +NEON vfma.f32 (32bit x2) n8                   -          -         - 
 +NEON vmul.f32 (32bit x4) n8      0.603    16045.3     2005.7  (  8.0 1.0) 
 +NEON vadd.f32 (32bit x4) n8      0.605    16007.0     2000.9  (  8.0 1.0) 
 +NEON vmla.f32 (32bit x4) n8      0.605    32014.0     2000.9  ( 16.0 1.0) 
 +NEON vfma.f32 (32bit x4) n8                   -          -         - 
 +VFP fmuls (32bit x1) ns4         0.603     4014.7     2007.3  (  2.0 1.0) 
 +VFP fadds (32bit x1) ns4      :    0.603     4014.0     2007.0  (  2.0 1.0) 
 +VFP fmacs (32bit x1) ns4      :    1.055     4584.5     1146.1  (  4.0 0.6) 
 +VFP vfma.f32 (32bit x1) ns4   :        -          -          -         - 
 +NEON vmul.f32 (32bit x2) ns4  :    0.602     8033.0     2008.3  (  4.0 1.0) 
 +NEON vadd.f32 (32bit x2) ns4  :    0.603     8027.9     2007.0  (  4.0 1.0) 
 +NEON vmla.f32 (32bit x2) ns4  :    1.055     9173.4     1146.7  (  8.0 0.6) 
 +NEON vfma.f32 (32bit x2) ns4  :        -          -          -         - 
 +NEON vmul.f32 (32bit x4) ns4  :    0.603    16058.0     2007.2  (  8.0 1.0) 
 +NEON vadd.f32 (32bit x4) ns4  :    0.602    16066.4     2008.3  (  8.0 1.0) 
 +NEON vmla.f32 (32bit x4) ns4  :    1.054    18359.9     1147.5  ( 16.0 0.6) 
 +NEON vfma.f32 (32bit x4) ns4  :        -          -          -         - 
 +VFP fmuls (32bit x1) n1       :    0.301     8028.9     4014.4  (  2.0 2.0) 
 +VFP fadds (32bit x1) n1       :    0.301     8032.6     4016.3  (  2.0 2.0) 
 +VFP fmacs (32bit x1) n1       :    1.808     2675.9      669.0  (  4.0 0.3) 
 +VFP vfma.f32 (32bit x1) n1    :        -          -          -         - 
 +NEON vmul.f32 (32bit x2) n1   :    0.302    16018.6     4004.7  (  4.0 2.0) 
 +NEON vadd.f32 (32bit x2) n1   :    0.301    16058.4     4014.6  (  4.0 2.0) 
 +NEON vmla.f32 (32bit x2) n1   :    1.807     5354.2      669.3  (  8.0 0.3) 
 +NEON vfma.f32 (32bit x2) n1   :        -          -          -         - 
 +NEON vmul.f32 (32bit x4) n1   :    0.603    16043.5     2005.4  (  8.0 1.0) 
 +NEON vadd.f32 (32bit x4) n1   :    0.603    16041.9     2005.2  (  8.0 1.0) 
 +NEON vmla.f32 (32bit x4) n1   :    1.808    10706.7      669.2  ( 16.0 0.3) 
 +NEON vfma.f32 (32bit x4) n1   :        -          -          -         - 
 +NEON vmul.f32 (32bit x4) n12  :    0.904    16062.1     2007.8  (  8.0 1.0) 
 +NEON vadd.f32 (32bit x4) n12  :    0.904    16063.5     2007.9  (  8.0 1.0) 
 +NEON vmla.f32 (32bit x4) n12  :    0.904    32117.4     2007.3  ( 16.0 1.0) 
 +NEON vfma.f32 (32bit x4) n12  :        -          -          -         - 
 +Average                       :    0.699    13702.7     2442.0  (  6.7 1.2) 
 +Highest                       :    0.301    32117.4     4016.3  ( 16.0 2.0)
  
-processor : 4 
-model name : ARMv8 Processor rev 2 (v8l) 
-BogoMIPS : 48.00 
-Features : half thumb fastmult vfp edsp neon vfpv3 tls vfpv4 idiva idivt lpae evtstrm aes pmull sha1 sha2 crc32 
-CPU implementer : 0x41 
-CPU architecture: 8 
-CPU variant : 0x0 
-CPU part : 0xd08 
-CPU revision : 2 
  
-processor 5 +* Group 1 Thread=2  Clock=2.016000 GHz  (mask:30) 
-model name ARMv8 Processor rev 2 (v8l+* VFP/NEON (DP fp) multi-thread 
-BogoMIPS 48.00 +                                  TIME(s)   MFLOPS      MOPS     FOP   IPC 
-Features half thumb fastmult vfp edsp neon vfpv3 tls vfpv4 idiva idivt lpae evtstrm aes pmull sha1 sha2 crc32 +VFP fmuld (64bit x1) n8          0.302     8011.4     4005.7   2.0 2.0
-CPU implementer 0x41 +VFP faddd (64bit x1) n8          0.301     8032.8     4016.4  (  2.0 2.0) 
-CPU architecture: 8 +VFP fmacd (64bit x1) n8          0.302    16013.5     4003.4  (  4.0 2.0) 
-CPU variant 0x0 +VFP vfma.f64 (64bit x1) n8                    -          -         - 
-CPU part 0xd08 +VFP fmuld (64bit x1) ns4         0.602     4015.5     2007.  2.0 1.0) 
-CPU revision : 2 +VFP faddd (64bit x1) ns4         0.603     4013.0     2006.5  (  2.0 1.0) 
- +VFP fmacd (64bit x1) ns4         1.063     4552.2     1138.1  (  4.0 0.6) 
- +VFP vfma.f64 (64bit x1) ns4                   -          -         - 
-ARMv8 Processor rev 4 (v8l)+VFP fmuld (64bit x1) n1       :    0.301     8029.8     4014.9  (  2.0 2.0) 
 +VFP faddd (64bit x1) n1       :    0.302     8014.6     4007.3  (  2.0 2.0) 
 +VFP fmacd (64bit x1) n1       :    1.807     2677.1      669.3  (  4.0 0.3) 
 +VFP vfma.f64 (64bit x1) n1    :        -          -          -         - 
 +Average                       :    0.620     7040.0     2874.  2.7 1.4) 
 +Highest                       :    0.301    16013.5     4016.4  (  4.0 2.0)
  
-2019/01/05 16:06:40  
 </code> </code>
  
opengl/vfpbenchlog.1597327272.txt.gz · 最終更新: 2020/08/13 23:01 by oga

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki