ユーザ用ツール

サイト用ツール


ai:npu

差分

このページの2つのバージョン間の差分を表示します。

この比較画面へのリンク

両方とも前のリビジョン前のリビジョン
次のリビジョン
前のリビジョン
ai:npu [2019/07/04 23:12] – [Neural Network Accelerator (NPU/NNE)] ogaai:npu [2020/06/13 19:51] (現在) – [SBC] oga
行 43: 行 43:
 参考にしたもの 参考にしたもの
  
-  * [[https://wlog.flatlib.jp/archive/1/2019-6-16|Snapdragon 845 ARMv8.2A 半精度 fp16 演算命令を使ってみる / Deep Learning 命令]]+
   * [[https://ark.intel.com/content/www/jp/ja/ark/products/186605/intel-core-i9-9900k-processor-16m-cache-up-to-5-00-ghz.html|Core i9-9900K]]   * [[https://ark.intel.com/content/www/jp/ja/ark/products/186605/intel-core-i9-9900k-processor-16m-cache-up-to-5-00-ghz.html|Core i9-9900K]]
   * [[https://en.wikichip.org/wiki/hisilicon/kirin/970|Kirin 970 NPU]]   * [[https://en.wikichip.org/wiki/hisilicon/kirin/970|Kirin 970 NPU]]
行 52: 行 52:
   * [[https://images.nvidia.com/content/pdf/tesla/Volta-Architecture-Whitepaper-v1.1-jp.pdf]]   * [[https://images.nvidia.com/content/pdf/tesla/Volta-Architecture-Whitepaper-v1.1-jp.pdf]]
  
 +関連
  
 +  * [[https://wlog.flatlib.jp/archive/1/2019-6-16|Snapdragon 845 ARMv8.2A 半精度 fp16 演算命令を使ってみる / Deep Learning 命令]]
 ===== NVIDIA TensorCore ===== ===== NVIDIA TensorCore =====
  
行 69: 行 71:
  
  
-^ SBC                              ^ SoC              ^ CPU core        ^ core ^ CPU clock   ^ GPU                            sp ^ GPU clock   ^ GPU fp32     ^ GPU fp16    ^ NPU        ^ NPU int16   ^ RAM                  ^ MEM B/W           ^ ROM             ^ +^ SBC                          ^ SoC              ^ CPU core       ^ IA     ^ core ^ CPU clock    ^ CPU fp32    ^ GPU                  GPU API                      sp ^ GPU clock   ^ GPU fp32     ^ GPU fp16     ^ ROP ^ NPU        ^ NPU         ^ RAM                  ^ MEM B/W           ^ ROM             ^ price   
-| Coral Dev Board                  | NXP i.MX 8M      | Cortex-A53      |    4 |     1.5 GHz | Vivante GC7000 Lite         16 sp |     1.0 GHz |    32 GFLOPS |   64 GFLOPS | Edge TPU        4 TOPS |    LPDDR4-3200   1GB |   32bit 12.8 GB/s |       eMMC  8GB | +| Coral Dev Board              | NXP i.MX 8M      | Cortex-A53     |ARMv8.0A|    4 |      1.5 GHz |   48 GFLOPS | Vivante GC7000 Lite  | ES3.x                     16 sp |     1.0 GHz    32 GFLOPS |    64 GFLOPS |   1 | Edge TPU        4 TOPS |    LPDDR4-3200   1GB |   32bit 12.8 GB/s |       eMMC  8GB |    $150 | 
-| NVIDIA Jetson Nano               | Tegra X1         | Cortex-A57      |    4 |     1.GHz | Maxwell                    128 sp |    0.92 GHz |   236 GFLOPS |  472 GFLOPS |         -- |          -- |    LPDDR4-3200   4GB |   64bit 25.6 GB/s |       eMMC 16GB | +| ASUS Tiner Edge T            | NXP i.MX 8M      | Cortex-A53     |ARMv8.0A|    4 |      1.5 GHz |   48 GFLOPS | Vivante GC7000 Lite  | ES3.x                     16 sp |     1.0 GHz |    32 GFLOPS |    64 GFLOPS |   | Edge TPU        4 TOPS |    LPDDR4-3200   1GB |   32bit 12.8 GB/s |       eMMC  8GB |         | 
-| Raspberry Pi 4                   | BCM2711          | Cortex-A72      |    4 |     1.5 GHz | VideoCore VI                   sp |     0.5 GHz |       GFLOPS |             |         -- |          -- |    LPDDR4-2400   4GB    ?bit    ? GB/s |              -- | +| ASUS Tiner Edge R            | RK3399Pro        | Cortex-A72+A53 |ARMv8.0A|  2+4 |  1.8+1.4 GHz |      GFLOPS | Mali-T860MP4         | ES3.x                        sp |     800 MHz |       GFLOPS |       GFLOPS |     | NPU        |      3 TOPS |    LPDDR4      4+2GB |   64bit      GB/s |       eMMC 16GB |         
-| Raspberry Pi 3                 | BCM2837B0        | Cortex-A53      |    4 |     1.4 GHz | VideoCore IV                48 sp |     0.3 GHz |  28.8 GFLOPS |             |         -- |          -- |    LPDDR2-900    1GB |   32bit  3.6 GB/s |              -- |+| NVIDIA Jetson Nano (DevKit)  | Tegra X1         | Cortex-A57     |ARMv8.0A|    4 |     1.43 GHz |   46 GFLOPS | Maxwell              ES3.2/GL4.6/Vulkan/CUDA |  128 sp |     922 MHz |   236 GFLOPS |   472 GFLOPS |  16 |         -- |          -- |    LPDDR4-3200   4GB |   64bit 25.6 GB/s |              -- |     $99 | 
 +| NVIDIA Jetson Xavier NX      | Xavier NX        | Carmel         |ARMv8.2A|    6 |  1.4-1.9 GHz |      GFLOPS | Volta                | ES3.2/GL4.6/Vulkan/CUDA |  384 sp |    1100 MHz | 844.8 GFLOPS |1689.6 GFLOPS |     | Tensor Core|     21 TOPS |    LPDDR4-3200   8GB |  128bit 51.2 GB/s |       eMMC 16GB |    $399 
 +| Raspberry Pi 4B              | BCM2711          | Cortex-A72     |ARMv8.0A|    4 |      1.5 GHz |   48 GFLOPS | VideoCore VI         ES3.x                        sp |     500 MHz |       GFLOPS |       GFLOPS |     |         -- |          -- |    LPDDR4-2400 1-8GB   32bit  9.6 GB/s |              -- |  $35-75 
 +| Raspberry Pi 3B            | BCM2837B0        | Cortex-A53     |ARMv8.0A|    4 |      1.4 GHz |   45 GFLOPS | VideoCore IV         ES2.0                     48 sp |     300 MHz |  28.8 GFLOPS |           -- |   4 |         -- |          -- |    LPDDR2-900    1GB |   32bit  3.6 GB/s |              -- |     $35 | 
 +| Raspberry Pi 3B              | BCM2837          | Cortex-A53     |ARMv8.0A|    4 |      1.2 GHz |   38 GFLOPS | VideoCore IV         | ES2.                  |   48 sp |     300 MHz |  28.8 GFLOPS |           -- |   4 |         -- |          -- |    LPDDR2-900    1GB |   32bit  3.6 GB/s |              -- |     $35 | 
 +| Raspberry Pi 2B v1.2         | BCM2837          | Cortex-A53     |ARMv8.0A|    4 |      0.9 GHz |   29 GFLOPS | VideoCore IV         | ES2.0                     48 sp |     300 MHz |  28.8 GFLOPS |           -- |   |         -- |          -- |    LPDDR2-900    1GB |   32bit  3.6 GB/s |              -- |     $35 | 
 +| Raspberry Pi 2B              | BCM2836          | Cortex-A7      |ARMv7A  |    4 |      0.9 GHz |    7 GFLOPS | VideoCore IV         | ES2.0                     48 sp |     250 MHz |  24.0 GFLOPS |           -- |   4 |         -- |          -- |    LPDDR2-900    1GB |   32bit  3.6 GB/s |              -- |     $35 | 
 +| Raspberry Pi 1B              | BCM2835          | ARM1176JFZ-S   |ARMv6      1 |      0.7 GHz |  0.7 GFLOPS | VideoCore IV         | ES2.0                     48 sp |     250 MHz |  24.0 GFLOPS |           -- |   4 |         -- |          -- |                0.5GB |                                -- |     $35 | 
 +| Dragonboard 410c             | Snapdragon 410   | Cortex-A53     |ARMv8.0A|    4 |      1.2 GHz |   38 GFLOPS | Adreno 306           | ES3.0                     24 sp |     450 MHz |  21.6 GFLOPS |           -- |  2? |         -- |          -- |    LPDDR3-1066   1GB |   32bit  4.3 GB/s |       eMMC  8GB |     $75 | 
 +| ASUS Tinker Board            | RK3288           | Cortex-A17     |ARMv7A  |    4 |      1.8 GHz |   58 GFLOPS | Mali-T764MP4         | ES3.x                     68 sp |     600 MHz |  81.6 GFLOPS | 163.2 GFLOPS |   4 |         -- |          -- |    LPDDR3        2GB |   64bit      GB/s |              -- |     $60 | 
 +| ASUS Tinker Board S          | RK3288           | Cortex-A17     |ARMv7A  |    4 |      1.8 GHz |   58 GFLOPS | Mali-T764MP4         | ES3.x                     68 sp |     600 MHz |  81.6 GFLOPS | 163.2 GFLOPS |   4 |         -- |          -- |    LPDDR3        2GB |   64bit      GB/s |       eMMC 16GB |         | 
 + 
 + 
 + 
 + 
 + 
 +  * [[https://www.asus.com/jp/Single-Board-Computer/Tinker-Board/specifications/|ASUS: Tinker Board]] 
 +  * [[https://www.4gamer.net/games/137/G013737/20131031011/|4Gamer: ARM,新世代GPUコア「Mali-T700」を発表。シェーダコア倍増のハイエンド市場向けと,Androidに特化したエントリー市場向けの2本立て]] 
 + 
 +<code> 
 +Mali-T760  17sp/core 
 +</code>
  
  
ai/npu.1562249565.txt.gz · 最終更新: 2019/07/04 23:12 by oga

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki