両方とも前のリビジョン前のリビジョン次のリビジョン | 前のリビジョン |
opengl:cpufop [2016/04/08 20:48] – [SIMD sp] oga | opengl:cpufop [2020/12/31 14:09] (現在) – [IPC] oga |
---|
| |
| |
===== Scalar ===== | |
| ===== IPC ====== |
| |
| ^ float 32bit ^^^^^ Scalar (32bit) ^^^^ SIMD 2 (64bit) ^^^^ SIMD 4 (128bit) ^^^^ SIMD 8 (256bit) ^^^^ SIMD 16 (512bit) ^^^^ |
| ^ CPU/SoC ^ CPU core ^ FPU ^ SIMD Width ^^ add ^ mul ^ mad/fma ^ total ^ add ^ mul ^ mad/fma ^ total ^ add ^ mul ^ mad/fma ^ total ^ add ^ mul ^ mad/fma ^ total ^ add ^ mul ^ mad/fma ^ total ^ |
| | BCM2835 | ARM1176JZF-S | VFPv2 | 64bit | 64bit mad | 0.5 | 0.5 | 0.5 | 0.5 | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | |
| | S5PC100 | Cortex-A8 | VFPv3 NEON | 128bit | 128bit mad | 0.1 | 0.1 | 0.1 | 0.1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | BCM2836 | Cortex-A7 | VFPv4 NEON | 32bit | 32bit fma | 1 | 1 | 1 | 1 | 0.5 | 0.5 | 0.5 | 0.5 | 0.25 | 0.25 | 0.25 | 0.25 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple S1 | Cortex-A7 | VFPv4 NEON | 32bit | 32bit fma | 1 | 1 | 1 | 1 | 0.5 | 0.5 | 0.5 | 0.5 | 0.25 | 0.25 | 0.25 | 0.25 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple S2 | Cortex-A7 | VFPv4 NEON | 32bit | 32bit fma | 1 | 1 | 1 | 1 | 0.5 | 0.5 | 0.5 | 0.5 | 0.25 | 0.25 | 0.25 | 0.25 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Tegra 2 | Cortex-A9 | VFPv3 | 64bit | 64bit mad | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple A5 | Cortex-A9 | VFPv3 NEON | 128bit | 128bit mad | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Tegra 4 | Cortex-A15 | VFPv4 NEON | 128bit | 64bit fma x2 | 1 | 1 | 1 | 1 | 2 | 2 | 2 | 2 | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | BCM2837 | Cortex-A53 | AArch64 ASIMD | 128bit | 64bit fma x2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Snapdragon 845 | (Cortex-A55) | AArch64 ASIMD FP16 | 128bit | 64bit fma x2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Tegra X1 | Cortex-A57 | AArch64 ASIMD | 128bit | 64bit fma x2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | BCM2711 | Cortex-A72 | AArch64 ASIMD | 128bit | 64bit fma x2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Snapdragon 835 | (Cortex-A73) | AArch64 ASIMD | 128bit | 64bit fma x2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Snapdragon 845 | (Cortex-A75) | AArch64 ASIMD FP16 | 128bit | 64bit fma x2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple A6 | Swift | VFPv4 NEON | 128bit | 128bit fma | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple A7 | Cyclone | AArch64 ASIMD | 384bit | 128bit add + 128bit fma x2 | 3 | 2 | 2 | 3 | 3 | 2 | 2 | 3 | 3 | 2 | 2 | 3 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple A8 | Typhoon | AArch64 ASIMD | 384bit | 128bit add + 128bit fma x2 | 3 | 2 | 2 | 3 | 3 | 2 | 2 | 3 | 3 | 2 | 2 | 3 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple A9 | Twister | AArch64 ASIMD | 384bit | 128bit fma x3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple A10 | Hurricane | AArch64 ASIMD | 384bit | 128bit fma x3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple A11 | Monsoon | AArch64 ASIMD | 384bit | 128bit fma x3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple M1 | Firestorm | AArch64 ASIMD FP16 | 512bit | 128bit add/mul + 128bit fma x3 | 4 | 4 | 3 | 4 | 4 | 4 | 3 | 4 | 4 | 4 | 3 | 4 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple S6 | Icestorm? | AArch64 ASIMD FP16 | 256bit | 128bit add + 128bit fma | 2 | 1 | 1 | 2 | 2 | 1 | 1 | 2 | 2 | 1 | 1 | 2 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Tegra K1 | Denver | AArch64 ASIMD | 256bit | 128bit add + 128bit fma | 2 | 1 | 1 | 2 | 2 | 1 | 1 | 2 | 2 | 1 | 1 | 2 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Snapdragon MSM8250 | Scorpion | VFPv3 NEON | 128bit | 128bit mad | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Snapdragon S4 Pro MSM8264 | Krait | VFPv4 NEON | 128bit | 128bit fma | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Snapdragon 820 | Kryo | AArch64 ASIMD | 256bit | 128bit add + 128bit fma | 2 | 1 | 1 | 2 | 2 | 1 | 1 | 2 | 2 | 1 | 1 | 2 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Atom Z2560 | Saltwell | SSSE3 | 192bit | 128bit add + 64bit mul | 1 | 1 | (1) | 2 | -- | -- | -- | -- | 1 | 0.5 | (0.7) | 0.7 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Celeron J1900 | SIlvermont | SSE4.2 | 192bit | 128bit add + 64bit mul | 1 | 1 | (1) | 2 | -- | -- | -- | -- | 1 | 0.5 | (0.7) | 0.7 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Atom x7-Z8700 | Airmont | SSE4.2 | 192bit | 128bit add + 64bit mul | 1 | 1 | (1) | 2 | -- | -- | -- | -- | 1 | 0.5 | (0.7) | 0.7 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Core 2 | Penryn | SSE4.1 | 256bit | 128bit add + 128bit mul | 1 | 1 | (1) | 2 | -- | -- | -- | -- | 1 | 1 | (1) | 2 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Core i7-2700 | SandyBridge | AVX | 512bit | 256bit add + 256bit mul | 1 | 1 | (1) | 2 | -- | -- | -- | -- | 1 | 1 | (1) | 2 | 1 | 1 | (1) | 2 | -- | -- | -- | -- | |
| | Core i7-3615QM | IvyBridge | AVX | 512bit | 256bit add + 256bit mul | 1 | 1 | (1) | 2 | -- | -- | -- | -- | 1 | 1 | (1) | 2 | 1 | 1 | (1) | 2 | -- | -- | -- | -- | |
| | Core i7-4790K | Haswell | AVX2/FMA3 | 512bit | 256bit fma/add + 256bit fma/mul | 1 | 2 | 2 | 2 | -- | -- | -- | -- | 1 | 2 | 2 | 2 | 1 | 2 | 2 | 2 | -- | -- | -- | -- | |
| | Core i7-6700K | Skylake | AVX2/FMA3 | 512bit | 256bit fma + 256bit fma | 2 | 2 | 2 | 2 | -- | -- | -- | -- | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | -- | -- | -- | -- | |
| | Core i7-1030NG7 | IceLake | AVX512FVLBWDQ | 512bit | 256bit fma + 256bit fma | 2 | 2 | 2 | 2 | -- | -- | -- | -- | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 1 | 1 | 1 | 1 | |
| | Athlon 5350 | Jaguar | AVX | 256bit | 128bit add + 128bit mul | 1 | 1 | (1) | 2 | -- | -- | -- | -- | 1 | 1 | (1) | 2 | 0.5 | 0.5 | (0.5) | 0.5 | -- | -- | -- | -- | |
| | A10-7870K | Steamroller | AVX/FMA3 | 256bit | 128bit fma + 128bit fma | 2 | 2 | 2 | 2 | -- | -- | -- | -- | 2 | 2 | 2 | 2 | 1 | 1 | 1 | 1 | -- | -- | -- | -- | |
| | Ryzen 7 1800X | Zen | AVX2/FMA3 | 512bit | 128bit add x2 + 128bit mul x2 | 2 | 2 | 2 | 3 | -- | -- | -- | -- | 2 | 2 | 2 | 3 | 1 | 1 | 1 | 2 | -- | -- | -- | -- | |
| | Ryzen 5 3400G | Zen+ APU | AVX2/FMA3 | 512bit | 128bit add x2 + 128bit mul x2 | 2 | 2 | 2 | 3 | -- | -- | -- | -- | 2 | 2 | 2 | 3 | 1 | 1 | 1 | 2 | -- | -- | -- | -- | |
| | Ryzen 7 PRO 4750G | Zen2 APU | AVX2/FMA3 | 1024bit | 256bit add x2 + 256bit mul x2 | 2 | 2 | 2 | 4 | -- | -- | -- | -- | 2 | 2 | 2 | 4 | 2 | 2 | 2 | 4 | -- | -- | -- | -- | |
| | Ryzen 9 3950X | Zen2 | AVX2/FMA3 | 1024bit | 256bit add x2 + 256bit mul x2 | 2 | 2 | 2 | 4 | -- | -- | -- | -- | 2 | 2 | 2 | 4 | 2 | 2 | 2 | 4 | -- | -- | -- | -- | |
| |
| |
| |
| |
| ^ float 64bit ^^^^^ Scalar (64bit) ^^^^ SIMD 2 (128bit) ^^^^ SIMD 4 (256bit) ^^^^ SIMD 8 (512bit) ^^^^ |
| ^ CPU/SoC ^ CPU core ^ FPU ^ SIMD Width ^^ add ^ mul ^ mad/fma ^ total ^ add ^ mul ^ mad/fma ^ total ^ add ^ mul ^ mad/fma ^ total ^ add ^ mul ^ mad/fma ^ total ^ |
| | BCM2835 | ARM1176JZF-S | VFPv2 | 64bit | 64bit mad | 0.5 | 0.5 | 0.5 | 0.5 | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | |
| | S5PC100 | Cortex-A8 | VFPv3 NEON | 128bit | 128bit mad | 0.1 | 0.1 | 0.1 | 0.1 | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | |
| | BCM2836 | Cortex-A7 | VFPv4 NEON | 32bit | 32bit fma | 1 | 0.2 | 0.2 | 0.2 | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple S1 | Cortex-A7 | VFPv4 NEON | 32bit | 32bit fma | 1 | 0.2 | 0.2 | 0.2 | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple S2 | Cortex-A7 | VFPv4 NEON | 32bit | 32bit fma | 1 | 0.2 | 0.2 | 0.2 | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Tegra 2 | Cortex-A9 | VFPv3 | 64bit | 64bit mad | 1 | 0.5 | 0.5 | 0.5 | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple A5 | Cortex-A9 | VFPv3 NEON | 128bit | 128bit mad | 1 | 0.5 | 0.5 | 0.5 | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Tegra 4 | Cortex-A15 | VFPv4 NEON | 128bit | 64bit fma x2 | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | |
| | BCM2837 | Cortex-A53 | AArch64 ASIMD | 128bit | 64bit fma x2 | 2 | 2 | 2 | 2 | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Snapdragon 845 | (Cortex-A55) | AArch64 ASIMD FP16 | 128bit | 64bit fma x2 | 2 | 2 | 2 | 2 | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Tegra X1 | Cortex-A57 | AArch64 ASIMD | 128bit | 64bit fma x2 | 2 | 2 | 2 | 2 | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | BCM2711 | Cortex-A72 | AArch64 ASIMD | 128bit | 64bit fma x2 | 2 | 2 | 2 | 2 | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Snapdragon 835 | (Cortex-A73) | AArch64 ASIMD | 128bit | 64bit fma x2 | 2 | 2 | 2 | 2 | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Snapdragon 845 | (Cortex-A75) | AArch64 ASIMD FP16 | 128bit | 64bit fma x2 | 2 | 2 | 2 | 2 | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple A6 | Swift | VFPv4 NEON | 128bit | 128bit fma | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple A7 | Cyclone | AArch64 ASIMD | 384bit | 128bit add + 128bit fma x2 | 3 | 2 | 2 | 3 | 3 | 2 | 2 | 3 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple A8 | Typhoon | AArch64 ASIMD | 384bit | 128bit add + 128bit fma x2 | 3 | 2 | 2 | 3 | 3 | 2 | 2 | 3 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple A9 | Twister | AArch64 ASIMD | 384bit | 128bit fma x3 | 3 | 2 | 2 | 3 | 3 | 2 | 2 | 3 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple A10 | Hurricane | AArch64 ASIMD | 384bit | 128bit fma x3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple A11 | Monsoon | AArch64 ASIMD | 384bit | 128bit fma x3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | 3 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple M1 | Firestorm | AArch64 ASIMD FP16 | 512bit | 128bit add/mul + 128bit fma x3 | 4 | 4 | 3 | 4 | 4 | 4 | 3 | 4 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Apple S6 | Icestorm? | AArch64 ASIMD FP16 | 256bit | 128bit add + 128bit fma | 2 | 1 | 1 | 2 | 2 | 1 | 1 | 2 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Tegra K1 | Denver | AArch64 ASIMD | 256bit | 128bit add + 128bit fma | 2 | 1 | 1 | 2 | 2 | 1 | 1 | 2 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Snapdragon MSM8250 | Scorpion | VFPv3 NEON | 128bit | 128bit mad | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Snapdragon S4 Pro MSM8264 | Krait | VFPv4 NEON | 128bit | 128bit fma | 1 | 1 | 1 | 1 | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Snapdragon 820 | Kryo | AArch64 ASIMD | 256bit | 128bit add + 128bit fma | 2 | 1 | 1 | 2 | 2 | 1 | 1 | 2 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Atom Z2560 | Saltwell | SSSE3 | 192bit | 128bit add + 64bit mul | 1 | 0.5 | (0.7) | 0.7 | 0.5 | 0.25 | (0.3) | 0.3 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Celeron J1900 | SIlvermont | SSE4.2 | 192bit | 128bit add + 64bit mul | 1 | 0.5 | (0.7) | 0.7 | 0.5 | 0.25 | (0.3) | 0.3 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Atom x7-Z8700 | Airmont | SSE4.2 | 192bit | 128bit add + 64bit mul | 1 | 0.5 | (0.7) | 0.7 | 0.5 | 0.25 | (0.3) | 0.3 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Core 2 | Penryn | SSE4.1 | 256bit | 128bit add + 128bit mul | 1 | 1 | (1) | 2 | 1 | 1 | (1) | 2 | -- | -- | -- | -- | -- | -- | -- | -- | |
| | Core i7-2700 | SandyBridge | AVX | 512bit | 256bit add + 256bit mul | 1 | 1 | (1) | 2 | 1 | 1 | (1) | 2 | 1 | 1 | (1) | 2 | -- | -- | -- | -- | |
| | Core i7-3615QM | IvyBridge | AVX | 512bit | 256bit add + 256bit mul | 1 | 1 | (1) | 2 | 1 | 1 | (1) | 2 | 1 | 1 | (1) | 2 | -- | -- | -- | -- | |
| | Core i7-4790K | Haswell | AVX2/FMA3 | 512bit | 256bit fma/add + 256bit fma/mul | 1 | 2 | 2 | 2 | 1 | 2 | 2 | 2 | 1 | 2 | 2 | 2 | -- | -- | -- | -- | |
| | Core i7-6700K | Skylake | AVX2/FMA3 | 512bit | 256bit fma + 256bit fma | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | -- | -- | -- | -- | |
| | Core i7-1030NG7 | IceLake | AVX512FVLBWDQ | 512bit | 256bit fma + 256bit fma | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 1 | 1 | 1 | 1 | |
| | Athlon 5350 | Jaguar | AVX | 256bit | 128bit add + 128bit mul | 1 | 1 | (1) | 2 | 1 | 1 | (1) | 2 | 0.5 | 0.5 | (0.5) | 0.5 | -- | -- | -- | -- | |
| | A10-7870K | Steamroller | AVX/FMA3 | 256bit | 128bit fma + 128bit fma | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 2 | 1 | 1 | 1 | 1 | -- | -- | -- | -- | |
| | Ryzen 7 1800X | Zen | AVX2/FMA3 | 512bit | 128bit add x2 + 128bit mul x2 | 2 | 2 | 2 | 3 | 2 | 2 | 2 | 3 | 1 | 1 | 1 | 2 | -- | -- | -- | -- | |
| | Ryzen 5 3400G | Zen+ APU | AVX2/FMA3 | 512bit | 128bit add x2 + 128bit mul x2 | 2 | 2 | 2 | 3 | 2 | 2 | 2 | 3 | 1 | 1 | 1 | 2 | -- | -- | -- | -- | |
| | Ryzen 7 PRO 4750G | Zen2 APU | AVX2/FMA3 | 1024bit | 256bit add x2 + 256bit mul x2 | 2 | 2 | 2 | 4 | 2 | 2 | 2 | 4 | 2 | 2 | 2 | 4 | -- | -- | -- | -- | |
| | Ryzen 9 3950X | Zen2 | AVX2/FMA3 | 1024bit | 256bit add x2 + 256bit mul x2 | 2 | 2 | 2 | 4 | 2 | 2 | 2 | 4 | 2 | 2 | 2 | 4 | -- | -- | -- | -- | |
| |
| |
| * mad/fma = カッコ付き表記は積和命令を持っていない代わりに add + mul の 2 命令を実行したときの値です。 |
| * total = 同時に実行できる命令数の最大値 |
| |
| |
| |
| ---- |
| ===== FOP ===== |
| |
| ==== Scalar ==== |
| |
| * 注意: この数値は実行可能な命令数 (IPC) ではなく FLOPS の算出に用いる 1 cycle で実行可能な浮動小数点演算数 (FOP) です。例えば fma の値に CPU clock を乗算すると FLOPS が求まります。 |
| |
^ Scalar ^^ single float (32bit x1) ^^^^ double float (64bit x1) ^^^^ ^ | ^ Scalar ^^ single float (32bit x1) ^^^^ double float (64bit x1) ^^^^ ^ |
| Scorpion | VFPv3 + NEON | 1 | 1 | 2 | -- | 0.5 | 1 | 1 | -- | Nexus One | | | Scorpion | VFPv3 + NEON | 1 | 1 | 2 | -- | 0.5 | 1 | 1 | -- | Nexus One | |
| Krait (400) | VFPv4 + NEON | 1 | 1 | 2 | 2 | 1 | 1 | 1.6 | 2 | Nexus 4/5, Nexus 7 (2013) | | | Krait (400) | VFPv4 + NEON | 1 | 1 | 2 | 2 | 1 | 1 | 1.6 | 2 | Nexus 4/5, Nexus 7 (2013) | |
| | Kryo 64 | AArch64 NEON | 1 | 2 | - | 2 | 1 | 2 | -- | 2 | HTC 10 | |
| A6 Swift | VFPv4 + NEON | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | iPhone 5, iPad 4 | | | A6 Swift | VFPv4 + NEON | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | iPhone 5, iPad 4 | |
| A7 Cyclone 32 | AArch32 NEON | 1 | 1 | 2 | 2 | 2 | 3 | 3 | 3 | iPhone 5s, iPad Air | | | A7 Cyclone 32 | AArch32 NEON | 1 | 1 | 2 | 2 | 2 | 3 | 3 | 3 | iPhone 5s, iPad Air | |
| Core i7 Sandy 64 | SSE4.2/AVX | 1 | 1 | (2) | -- | 1 | 1 | (2) | -- | | | | Core i7 Sandy 64 | SSE4.2/AVX | 1 | 1 | (2) | -- | 1 | 1 | (2) | -- | | |
| Core i7 Ivy 64 | SSE4.2/AVX | 1 | 1 | (2) | -- | 1 | 1 | (2) | -- | | | | Core i7 Ivy 64 | SSE4.2/AVX | 1 | 1 | (2) | -- | 1 | 1 | (2) | -- | | |
| Core i7 Haswell 64 | SSE4.2/AVX2/FMA3 | 2 | 1 | (2) | 4 | 2 | 1 | (2) | 4 | Core i7-4790K | | | Core i7 Haswell 64 | SSE4.2/AVX2/FMA3 | 1.6 | 1 | -- | 3.2 | 1.6 | 1 | -- | 3.2 | Core i7-4790K | |
| Celeron Haswell 64 | SSE4.2 | 2 | 1 | (2) | -- | 2 | 1 | (2) | -- | Celeron 2955U | | | Celeron Haswell 64 | SSE4.2 | 1.6 | 1 | (1.6) | -- | 1.6 | 1 | (1.6) | -- | Celeron 2955U | |
| | Core i7 Skylake 64 | SSE4.2/AVX2/FMA3 | 2 | 2 | -- | 4 | 2 | 2 | -- | 4 | Core i7-6700K | |
| | Ryzen 7 1800X 64 | SSE4.2/AVX2/FMA3 | 2 | 2 | -- | 3.2 | 2 | 2 | -- | 3.2 | Ryzen 7 1800X | |
| |
| |
| |
| |
===== SIMD sp ===== | ==== SIMD sp ==== |
| |
| * 注意: この数値は実行可能な命令数 (IPC) ではなく FLOPS の算出に用いる 1 cycle で実行可能な浮動小数点演算数 (FOP) です。例えば fma の値に CPU clock を乗算すると FLOPS が求まります。 |
| |
| |
^ SIMD (Vector) sp ^^ SIMD2 single fp (32bit x2) ^^^^ SIMD4 single fp (32bit x4) ^^^^ SIMD8 single fp (32bit x8) ^^^^ | ^ SIMD (Vector) sp ^^ SIMD2 single fp (32bit x2) ^^^^ SIMD4 single fp (32bit x4) ^^^^ SIMD8 single fp (32bit x8) ^^^^ |
| Scorpion | VFPv3 + NEON | 2 | 2 | 4 | -- | 4 | 4 | 8 | -- | -- | -- | -- | -- | | | Scorpion | VFPv3 + NEON | 2 | 2 | 4 | -- | 4 | 4 | 8 | -- | -- | -- | -- | -- | |
| Krait 400 | VFPv4 + NEON | 2 | 2 | 4 | 4 | 4 | 4 | 8 | 8 | -- | -- | -- | -- | | | Krait 400 | VFPv4 + NEON | 2 | 2 | 4 | 4 | 4 | 4 | 8 | 8 | -- | -- | -- | -- | |
| | Kyro | AArch64 NEON | 2 | 4 | -- | 4 | 2 | 4 | -- | 4 | -- | -- | -- | -- | |
| A6 Swift | VFPv4 + NEON | 2 | 2 | 4 | 4 | 4 | 4 | 8 | 8 | -- | -- | -- | -- | | | A6 Swift | VFPv4 + NEON | 2 | 2 | 4 | 4 | 4 | 4 | 8 | 8 | -- | -- | -- | -- | |
| A7 Cyclone 32 | AArch32 NEON | 4 | 6 | 8 | 8 | 8 | 12 | 16 | 16 | -- | -- | -- | -- | | | A7 Cyclone 32 | AArch32 NEON | 4 | 6 | 8 | 8 | 8 | 12 | 16 | 16 | -- | -- | -- | -- | |
| Core i7 Haswell 64 | SSE4.2/AVX2/FMA3 | -- | -- | -- | -- | 8 | 4 | (8) | 16 | 16 | 8 | (16) | 32 | | | Core i7 Haswell 64 | SSE4.2/AVX2/FMA3 | -- | -- | -- | -- | 8 | 4 | (8) | 16 | 16 | 8 | (16) | 32 | |
| Celeron Haswell 64 | SSE4.2 | -- | -- | -- | -- | 8 | 4 | (8) | -- | -- | -- | -- | -- | | | Celeron Haswell 64 | SSE4.2 | -- | -- | -- | -- | 8 | 4 | (8) | -- | -- | -- | -- | -- | |
| | Core i7 Skylake 64 | SSE4.2/AVX2/FMA3 | -- | -- | -- | -- | 8 | 8 | (8) | 16 | 16 | 16 | (16) | 32 | |
| | Ryzen 7 1800X 64 | SSE4.2/AVX2/FMA3 | -- | -- | -- | -- | 8 | 8 | (12) | 12 | 8 | 8 | (16) | 16 | |
| |
| |
| |
| |
===== SIMD dp ===== | ==== SIMD dp ==== |
| |
| * 注意: この数値は実行可能な命令数 (IPC) ではなく FLOPS の算出に用いる 1 cycle で実行可能な浮動小数点演算数 (FOP) です。例えば fma の値に CPU clock を乗算すると FLOPS が求まります。 |
| |
^ SIMD (Vector) dp ^^ SIMD2 double fp (64bit x2) ^^^^ SIMD4 double fp (64bit x4) ^^^^ | ^ SIMD (Vector) dp ^^ SIMD2 double fp (64bit x2) ^^^^ SIMD4 double fp (64bit x4) ^^^^ |
| A7 Cyclone 64 | AArch64 NEON | 4 | 6 | -- | 8 | -- | -- | -- | -- | | | A7 Cyclone 64 | AArch64 NEON | 4 | 6 | -- | 8 | -- | -- | -- | -- | |
| A8 Typhoon 64 | AArch64 NEON | 4 | 6 | -- | 8 | -- | -- | -- | -- | | | A8 Typhoon 64 | AArch64 NEON | 4 | 6 | -- | 8 | -- | -- | -- | -- | |
| | A9 Twister 64 | AArch64 NEON | 4 | 6 | -- | 8 | -- | -- | -- | -- | |
| | Kyro 64 | AArch64 NEON | 1 | 2 | -- | 2 | -- | -- | -- | -- | |
| Denver 64 | AArch64 NEON | 2 | 3 | -- | 4 | -- | -- | -- | -- | | | Denver 64 | AArch64 NEON | 2 | 3 | -- | 4 | -- | -- | -- | -- | |
| Atom Bonnell 32 | SSSE3 | 0.4 | 0.5 | -- | -- | -- | -- | -- | -- | | | Atom Bonnell 32 | SSSE3 | 0.4 | 0.5 | -- | -- | -- | -- | -- | -- | |
| Core i7 Haswell 64 | SSE4.2/AVX2/FMA3 | 4 | 2 | (4) | 8? | 8 | 4 | (8) | 16? | | | Core i7 Haswell 64 | SSE4.2/AVX2/FMA3 | 4 | 2 | (4) | 8? | 8 | 4 | (8) | 16? | |
| Celeron Haswell 64 | SSE4.2 | 4 | 2 | (4) | -- | -- | -- | -- | -- | | | Celeron Haswell 64 | SSE4.2 | 4 | 2 | (4) | -- | -- | -- | -- | -- | |
| | Core i7 Skylake 64 | SSE4.2/AVX2/FMA3 | 4 | 4 | -- | 8 | 8 | 8 | -- | 16 | |
| | Ryzen 7 1800X 64 | SSE4.2/AVX2/FMA3 | 4 | 4 | -- | 6.3 | 4 | 4 | (8) | 8 | |
| |
| |