ユーザ用ツール

サイト用ツール


ai:npu

差分

この文書の現在のバージョンと選択したバージョンの差分を表示します。

この比較画面にリンクする

両方とも前のリビジョン 前のリビジョン
次のリビジョン
前のリビジョン
ai:npu [2019/10/08 23:32]
oga [SBC]
ai:npu [2019/12/10 22:15] (現在)
oga [SBC]
ライン 43: ライン 43:
 参考にしたもの 参考にしたもの
  
-  * [[https://​wlog.flatlib.jp/​archive/​1/​2019-6-16|Snapdragon 845 ARMv8.2A 半精度 fp16 演算命令を使ってみる / Deep Learning 命令]]+
   * [[https://​ark.intel.com/​content/​www/​jp/​ja/​ark/​products/​186605/​intel-core-i9-9900k-processor-16m-cache-up-to-5-00-ghz.html|Core i9-9900K]]   * [[https://​ark.intel.com/​content/​www/​jp/​ja/​ark/​products/​186605/​intel-core-i9-9900k-processor-16m-cache-up-to-5-00-ghz.html|Core i9-9900K]]
   * [[https://​en.wikichip.org/​wiki/​hisilicon/​kirin/​970|Kirin 970 NPU]]   * [[https://​en.wikichip.org/​wiki/​hisilicon/​kirin/​970|Kirin 970 NPU]]
ライン 52: ライン 52:
   * [[https://​images.nvidia.com/​content/​pdf/​tesla/​Volta-Architecture-Whitepaper-v1.1-jp.pdf]]   * [[https://​images.nvidia.com/​content/​pdf/​tesla/​Volta-Architecture-Whitepaper-v1.1-jp.pdf]]
  
 +関連
  
 +  * [[https://​wlog.flatlib.jp/​archive/​1/​2019-6-16|Snapdragon 845 ARMv8.2A 半精度 fp16 演算命令を使ってみる / Deep Learning 命令]]
 ===== NVIDIA TensorCore ===== ===== NVIDIA TensorCore =====
  
ライン 69: ライン 71:
  
  
-^ SBC                          ^ SoC              ^ CPU core     ^ core ^ CPU clock   ^ GPU                  ^ GPU API                 ​^ ​     sp ^ GPU clock   ^ GPU fp32     ^ GPU fp16    ^ NPU        ^ NPU int16   ^ RAM                  ^ MEM B/W           ^ ROM             ^ price  +^ SBC                          ^ SoC              ^ CPU core     ^ IA     ^ core ^ CPU clock   ^ CPU fp32    ​^ GPU                  ^ GPU API                 ​^ ​     sp ^ GPU clock   ^ GPU fp32     ^ GPU fp16     ^ ROP ^ NPU        ^ NPU int16   ^ RAM                  ^ MEM B/W           ^ ROM             ^ price   ​
-| Coral Dev Board              | NXP i.MX 8M      | Cortex-A53 ​  ​| ​   4 |     1.5 GHz | Vivante GC7000 Lite  | ES3.x                   ​| ​  16 sp |     1.0 GHz |    32 GFLOPS |   ​64 GFLOPS | Edge TPU   ​| ​     4 TOPS |    LPDDR4-3200 ​  1GB |   32bit 12.8 GB/s |       ​eMMC ​ 8GB |   ​$150 | +| Coral Dev Board              | NXP i.MX 8M      | Cortex-A53 ​  |ARMv8.0A|    4 |     1.5 GHz |   48 GFLOPS ​| Vivante GC7000 Lite  | ES3.x                   ​| ​  16 sp |     1.0 GHz |    32 GFLOPS |    64 GFLOPS ​|   ​1 ​| Edge TPU   ​| ​     4 TOPS |    LPDDR4-3200 ​  1GB |   32bit 12.8 GB/s |       ​eMMC ​ 8GB |    $150 | 
-| NVIDIA Jetson Nano (DevKit) ​ | Tegra X1         | Cortex-A57 ​  ​| ​   4 |    1.43 GHz | Maxwell ​             | ES3.2/​GL4.6/​Vulkan/​CUDA |  128 sp |     922 MHz |   236 GFLOPS |  472 GFLOPS |         -- |          -- |    LPDDR4-3200 ​  4GB |   64bit 25.6 GB/s |              -- |    $99 | +| NVIDIA Jetson Nano (DevKit) ​ | Tegra X1         | Cortex-A57 ​  |ARMv8.0A|    4 |    1.43 GHz |   46 GFLOPS ​| Maxwell ​             | ES3.2/​GL4.6/​Vulkan/​CUDA |  128 sp |     922 MHz |   236 GFLOPS |   ​472 GFLOPS ​|  16 |         -- |          -- |    LPDDR4-3200 ​  4GB |   64bit 25.6 GB/s |              -- |     ​$99 | 
-| Raspberry Pi 4B              | BCM2711 ​         | Cortex-A72 ​  ​| ​   4 |     1.5 GHz | VideoCore VI         | ES3.x                   ​| ​     sp |     500 MHz |       ​GFLOPS |             ​|         -- |          -- |    LPDDR4-2400 ​  ​4GB |  ​32?​bit ​9.6GB/s |              -- |    $35 | +| Raspberry Pi 4B              | BCM2711 ​         | Cortex-A72 ​  |ARMv8.0A|    4 |     1.5 GHz |   48 GFLOPS ​| VideoCore VI         | ES3.x                   ​| ​     sp |     500 MHz |       ​GFLOPS |       GFLOPS |     |         -- |          -- |    LPDDR4-2400 ​1-4GB |   32bit  9.6 GB/s |              -- |  $35-55 
-| Raspberry Pi 3B+             | BCM2837B0 ​       | Cortex-A53 ​  ​| ​   4 |     1.4 GHz | VideoCore IV         | ES2.0                   ​| ​  48 sp |     300 MHz |  28.8 GFLOPS |          -- |         -- |          -- |    LPDDR2-900 ​   1GB |   ​32bit ​ 3.6 GB/s |              -- |    $35 | +| Raspberry Pi 3B+             | BCM2837B0 ​       | Cortex-A53 ​  |ARMv8.0A|    4 |     1.4 GHz |   45 GFLOPS ​| VideoCore IV         | ES2.0                   ​| ​  48 sp |     300 MHz |  28.8 GFLOPS ​|           -- |   4 |         ​-- ​|          -- |    LPDDR2-900 ​   1GB |   ​32bit ​ 3.6 GB/s |              -- |     $35 | 
-| Dragonboard 410c             | Snapdragon 410   | Cortex-A53 ​  ​| ​   4 |     1.2 GHz | Adreno 306           | ES3.0                   ​| ​  24 sp |     450 MHz |  21.6 GFLOPS |          -- |         -- |          -- |    LPDDR3-1066 ​  1GB |   ​32bit ​ 4.3 GB/s |       ​eMMC ​ 8GB |    $75 |+| Raspberry Pi 3B              | BCM2837 ​         | Cortex-A53 ​  ​|ARMv8.0A| ​   4 |     1.2 GHz |   38 GFLOPS | VideoCore IV         | ES2.0                   ​| ​  48 sp |     300 MHz |  28.8 GFLOPS |           -- |   ​4 ​|         -- |          -- |    LPDDR2-900 ​   1GB |   ​32bit ​ 3.6 GB/s |              -- |     $35 | 
 +| Raspberry Pi 2B v1.2         | BCM2837 ​         | Cortex-A53 ​  ​|ARMv8.0A|    ​4 |     0.9 GHz |   29 GFLOPS | VideoCore IV         | ES2.0                   ​| ​  48 sp |     300 MHz |  28.8 GFLOPS |           -- |   4 |         -- |          -- |    LPDDR2-900 ​   1GB |   ​32bit ​ 3.6 GB/s |              -- |     $35 | 
 +| Raspberry Pi 2B              | BCM2836 ​         | Cortex-A7 ​   |ARMv7A ​ |    4 |     0.9 GHz |    7 GFLOPS | VideoCore IV         | ES2.0                   ​| ​  48 sp |     250 MHz |  24.0 GFLOPS |           -- |   4 |         -- |          -- |    LPDDR2-900 ​   1GB |   ​32bit ​ 3.6 GB/s |              -- |     $35 | 
 +| Raspberry Pi 1B              | BCM2835 ​         | ARM1176JFZ-S |ARMv6 ​  ​| ​   1 |     0.7 GHz |  0.7 GFLOPS | VideoCore IV         | ES2.0                   ​| ​  48 sp |     250 MHz |  24.0 GFLOPS |           -- |   4 |         -- |          -- |                0.5GB |                   ​| ​             -- |     $35 | 
 +| Dragonboard 410c             | Snapdragon 410   | Cortex-A53 ​  |ARMv8.0A|    4 |     1.2 GHz |   38 GFLOPS ​| Adreno 306           | ES3.0                   ​| ​  24 sp |     450 MHz |  21.6 GFLOPS |           ​-- |  2? |         -- |          -- |    LPDDR3-1066 ​  1GB |   ​32bit ​ 4.3 GB/s |       ​eMMC ​ 8GB |     ​$75 
 +| ASUS Tinker Board            | RK3288 ​          | Cortex-A17 ​  ​|ARMv7A ​ |    4 |     1.8 GHz |   58 GFLOPS | Mali-T764MP4 ​        | ES3.x                   ​| ​  68 sp |     600 MHz |  81.6 GFLOPS | 163.2 GFLOPS |   4 |         -- |          -- |    LPDDR3 ​       2GB |   ​64bit ​     GB/s |              -- |     ​$60 ​|
  
 +
 +
 +
 +
 +  * [[https://​www.asus.com/​jp/​Single-Board-Computer/​Tinker-Board/​specifications/​|ASUS:​ Tinker Board]]
 +  * [[https://​www.4gamer.net/​games/​137/​G013737/​20131031011/​|4Gamer:​ ARM,新世代GPUコア「Mali-T700」を発表。シェーダコア倍増のハイエンド市場向けと,Androidに特化したエントリー市場向けの2本立て]]
 +
 +<​code>​
 +Mali-T760 ​ 17sp/core
 +</​code>​
  
  
ai/npu.1570545177.txt.gz · 最終更新: 2019/10/08 23:32 by oga