打印
[资料干货]

新出Ascend 310B

[复制链接]
98|0
手机看帖
扫描二维码
随时随地手机跟帖
跳转到指定楼层
楼主
QQ2224043166|  楼主 | 2025-7-9 14:25 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
SC, ce, 集成, AC, or, he
芯片简介
1.1 功能描述
Ascend 310B 是面向中高性能的 AI 处理器解决方案,内部集成了 1 个 DaVinciV300 AI
core;4 个 64 位 TaishanV200M 处理器核。为了减小操作延迟和保证数据一致性,提
供了全系统 Cache 一致性和虚拟地址一致性方案;为了加速业务处理能力及留出更多
的 CPU 处理性能以支持灵活的业务扩展,集成了图像处理器,视频编解码器等多种加
速引擎。包括硬件 QoS 管理,及安全处理。此外还集成了通用的处理器接口,包括 96
● 数据处理支持大、小端模式,大端模式为 BE-8,端模式上电后寄存器可配。指令
处理固定为小端;
● 支持对 Memory 非对齐访问;
● 支持基于 PMUv3 架构的性能监测单元(PMU);
● 支持 TrustZone 安全扩展;
● 集成 4 个定时器,定时器有 32 位和 64 位使用模式;
● 集成中断控制器处理器接口;
● 支持 CPU 虚拟化;
● 集成 VFP,支持 VFPv4 指令集;
● 支持 64bit 模式;
● 支持 SVE/NEON 指令,支持 SIMD 运算;
● 支持 ARM v8 AArch64 指令架构下 VFP,NEON 和 SVE 协处理;
● CPU 的 L1 cache、L2 cache 支持 maintain 操作的原子性,即不需要软件加锁;
● 支持功能模式下启动 L1 和 L2 Cache 的 memory MBIST 测试;
● 基于 ARMv8 调试架构,支持 Coresight;
● 支持 trace 功能;
● 支持 PTM(Program Trace Macrocell),能够跟踪程序执行流程;
● 支持调试系统频率多级可调,与处理器频率无强制耦合关系;
● 支持 cross trigger 多核联合调试;
● 数据 Cache 支持 ECC 校验。
存储特性
● 支持 3 级 Cache,每个 CPU Core 集成一个 64KB 大小的一级指令 Cache 和一个
64KB 大小的数据 Cache,数据 Cache 支持 ECC 校验,指令 Cache 支持奇偶校验;
每个 CPU 核集成一个 512KB 大小的二级 Cache;
● 集成 1 个 3MB 的 L3 cache;
● 支持基于 Skyros 协议的互联,基于 MOESI 一致性协议,以 Directory 结构支持片
内 L1/L2/L3 Cache、Memory、IO、Accelerator 的完全数据一致性互联;
● 提供 1 个 96 bits LPDDR4X 存储器接口,最高数据率 4266Mbps,可以访问最大
24GB 外存空间;
● 支持全局的双指令(Exclusive)原子操作,可完成加、减、与、或、SWAP 读-改-
写原子操作;
bits 的 LPDDR4X 接口、GE、PCIe、USB、SATA、CAN-FD 等。
1.1.1 芯片特性
Ascend 310B 是为中高性能的 AI 应用开发的一款多核 SoC 或 PCIe Device 处理器芯片。
集成了 DaVinciV300 AI core,TaishanV200M 处理器核,针对主控应用集成了丰富的
IO,集成了媒体专用加速引擎,并集成了多种通用的处理器接口。
处理器特性
● 4 个 64 位 TAISHANV200M 处理器核;
● 支持 ARMv8-A 架构全部的特性;
● 超标量结构,乱序执行的流水线;
● 支持动态分支预测,包含 Branch Target Buffer (BTB) 和、Global History Buffer
(GHB)、返回栈和间接预测;
● 集成 2 级页表硬件转换 MMU,支持虚拟地址到物理地址的映射;
● 提供一个数据和指令混合的 Fabric 接口,接口能够通过 Coherency Fabric 保证多个
CPU 间以及与 IO 和加速器的数据一致性,读写数据位宽各为 256 bits;
● 提供 256KB 的片上 SRAM,SRAM 额外支持加、减、与、或的单指令原子操作加
速(单次写完成原子操作),支持配置固定空间作为片上安全存储;
● 提供独立的 DMA 单元,加速各 Memory/IO 之间的数据搬运;
● 全系统存储空间的访问支持 QoS 进行流量管理;
● 提供独立的内存管理单元 BMU,支持缓存动态申请和释放,BMU 以链表存储块的
方式管理内存,并针对报文存储资源提供基于通道和端口的反压与丢弃;
加速器特性
● 集成 1 个 DaVinciV300 AI core,支持 AI 计算框架;
● 集成 1 个 DaVinciV300 Vector core,支持 CV 计算框架;
● 集成 1 个 ARM Mali G52 单核 GPU,支持 OpenGL 图形框架;
● 集成 4 个 ISP pipe,支持最多 4 个 RAW 摄像头输入;
● 集成 H.264/H.265Video encoder,支持 16~24 路 FHD 30FPS 编码;
● 集成 H.264/H.265Video decoder,支持 32~40 路 FHD 30FPS 解码;
● 集成 VPC,用于图像 crop 和 resize 等操作,支持等效 32~40 路 FHD 30FPS 处理能
力;
● 集成 Audio 处理器,支持最多 2 路多 slot 音频输入;
● 集成 Jpeg encoder,支持等效 FHD 256FPS;
● 集成 Jpeg decoder,支持等效 FHD 512FPS;
● 集成显示控制器,提供 1 个 DSI 显示输出;
提供硬件加解密加速模块 SEC,可加速认证、数据加解密等安全应用。

使用特权

评论回复

相关帖子

发新帖 我要提问
您需要登录后才可以回帖 登录 | 注册

本版积分规则

83

主题

232

帖子

2

粉丝