您现在的位置:主页 > 文明建设 >

文明建设

燧原科技发布第二代AI芯片年底量产

发布时间:2021-11-23

  7月7日,腾讯投资的国内AI芯片初创企业燧原科技发布第二代人工智能训练产品——“邃思2.0”芯片、基于邃思2.0的“云燧T20”训练加速卡和“云燧T21”训练OAM模组,全面升级的“驭算TopsRider”软件平台以及全新的“云燧集群”。

  燧原科技创始人、CEO赵立东在接受第一财经专访时表示,“邃思2.0”和第一代产品均由格芯的12nm FinFET工艺打造,“邃思2.0”将于年底量产。

  为了获得高的性能,大部分AI云端芯片厂商都采用最新的制程,为何燧原科技第二代产品没有使用更先进工艺?

  “英特尔的芯片技术发展战略是Tick–Tock模式,Tick阶段升级工艺,Tock阶段升级处理器架构。对我们来说,我们第一代芯片是一个全新的架构,第二代我们有一个选项,架构保持大致不变,工艺向前演进,然后再架构再工艺,这就是沿着传统的Tick–tock这条路走。第一代芯片在落地过程和客户磨合过程当中,我们觉得架构的演进比工艺演进更重要。”赵立东告诉第一财经。

  他表示,通过对市场的理解和对竞品的分析确定第一代芯片架构,第二代最大的区别是有了实际的用户,基于实际的业务模型。“在这些业务使用当中有新的算法、模型出现,这是AI跟传统CPU、GPU不一样的地方,再加上其他国际大厂也在迭代。”

  具体而言,燧原科技新一代全自研的GCU-CARA全域计算架构,针对人工智能计算的特性进行深度优化,支持全面的计算精度,涵盖从FP32、TF32、FP16、BF16到INT8,单精度FP32峰值算力达40 TFLOPS,单精度张量TF32峰值算力达到160 TFLOPS。

  其实成本也是影响工艺选择的重要因素。赵立东表示,从设计到流片,12纳米制程和7纳米制程成本完全不同,“一个3亿多人民币,一个7亿多,公司的商业本质还是要考虑成本。”

  此外,同时改架构和工艺的风险太大,他介绍称,“如果最后有问题不知道是工艺造成的还是架构造成的。先进制程的性能、功耗会更好,但是综合考虑成本、风险和供应商产能,我们选择改架构。”

  目前,半导体行业产能紧缺,考验着芯片设计企业的供应链管理能力。此前,有媒体报道,格芯单方取消部分企业订单。对此,赵立东表示,和格芯的合作一直很顺利,“同样一家公司,它给你多强的技术支持是不一样的,包括价格,还有交货周期,长6个月短则4个月,完全看你和它的关系。”

  在市场应用方面,去年9月,燧原科技宣布,“云燧T10”和由其组成的多卡分布式训练集群已在云数据中心落地,正式进入商用阶段。赵立东介绍称,燧原科技今年在泛互联网、传统行业(金融、交通、电力、医疗、工业等)以及新基建三大业务方向上都将有营收。

  腾讯是燧原科技的投资方,也是其重要的合作伙伴。2018年8月,燧原科技由腾讯领投,获得Pre-A轮融资3.4亿元人民币。

  “腾讯在AI这个领域,有足够的数据、应用场景,业务需求,也愿意和我们坐在一起深入地进行技术交流。对我们的产品开发帮助很大,真正了解底层到底是什么,加速到底是什么,怎样才能做得更好。”赵立东透露,在泛互联网领域,公司还在与其他互联网大厂谈商业落地,“包括有自研芯片团队的泛互联网厂商都有在接触。”

  汽车数字座舱平台,采用7nm制程,8核处理器,运算能力比上一代820A提升了10倍,CPU和GPU的运行速度分别是上一代的8.5倍和20倍。8155芯片的赋能,多款车型实现了多屏显示、个性化AI、沉浸式影音、5G链接等功能。星越L :采用亿咖通与吉利联合研发的最新一代车机——吉利银河OS系统,选用高通8155芯片,CPU算力105K DMIPS,GPU算力1000 GFLPOS, NPU达到8 TOPS。吉利银河OS 系统硬件基础来源:吉利汽车基于强大的硬件基础,银河OS系统具备人车交互、全车智控、边缘AI、开放生态四大核心功能。◆ 人车交互:星越L 采用AR-HUD、仪表、中控、副驾屏四屏体系

  提升硬件很重要,但不能陷入“唯算力论”的怪圈。最近,一则新闻震动业界,赛灵思亚太地区实验室首席工程师、实验室主任胡成臣确认加入蔚来汽车,在技术规划领域担任首席专家、助理副总裁一职。这则新闻的背后,是蔚来汽车自研AI芯片的加速。蔚来汽车的目的很清楚,就是像特斯拉一样,建立起自动驾驶能力闭环。而要建立这种闭环,芯片是绕不过去的一关。实际上,从去年开始,我们发现,智能芯片(AI芯片)这个领域再次迅速进入高光时刻,除了云端居垄断地位的英伟达,国内无论是地平线,还是黑芝麻,都引起了业界极大关注。而算力的不断提升,也让各大车企对进入算力的“军备竞赛”产生焦虑。比如,今年英伟达发布业内首款

  11月3日,寒武纪发布第三代云端 AI 芯片思元 370、基于思元 370 的两款加速卡 MLU370-S4 和 MLU370-X4、全新升级的 Cambricon Neuware 软件栈。▲ 寒武纪第三代云端 AI 芯片思元 370IT之家获悉,基于 7nm 制程工艺,思元 370 是寒武纪首款采用 chiplet(芯粒)技术的 AI 芯片,集成了 390 亿个晶体管,最大算力高达 256TOPS (INT8),是寒武纪第二代产品思元 270 算力的 2 倍。凭借寒武纪最新智能芯片架构 MLUarch03,相较于峰值算力的提升,思元 370 实测性能表现更为优秀:以 ResNet-50 为例,MLU370-S4 加速卡(半高半长

  思元370 /

  随着智能驾驶和智能座舱时代到来以及AI技术的兴起,汽车智能化成为了当前全球各个企业的目标和需求导向,自动驾驶和智能座舱在当前和未来的汽车开发和应用场景中备受关注,这对AI芯片需求量大大增加,也对当前AI芯片及芯片厂商提出更高挑战。在自动驾驶和智能座舱领域,目前英伟达、英特尔、德州仪器等不少芯片国际巨头公司已布局良久。在此背景下,国产AI芯片公司如何突破国外技术封锁?本文从国产芯片新星黑芝麻智能关于智能驾驶AI芯片的设计及制造流程来看如何实现弯道超车。所谓AI芯片,神经网络加速器是其必不可少的一部分,目前所有的神经网络算法在硬件层面最消耗计算资源的就是乘和累加运算,即卷积,分解到硬件就是MAC(Multiply

  的设计与制造流程 /

  随着智能驾驶和智能座舱时代到来以及AI技术的兴起,汽车智能化成为了当前全球各个企业的目标和需求导向,自动驾驶和智能座舱在当前和未来的汽车开发和应用场景中备受关注,这对AI芯片需求量大大增加,也对当前AI芯片及芯片厂商提出更高挑战。在自动驾驶和智能座舱领域,目前英伟达、英特尔、德州仪器等不少芯片国际巨头公司已布局良久。在此背景下,国产AI芯片公司如何突破国外技术封锁?本文从国产芯片新星黑芝麻智能关于智能驾驶AI芯片的设计及制造流程来看如何实现弯道超车。所谓AI芯片,神经网络加速器是其必不可少的一部分,目前所有的神经网络算法在硬件层面最消耗计算资源的就是乘和累加运算,即卷积,分解到硬件就是MAC(Multiply

  的设计与制造流程 /

  经历了2016—2019年的野蛮生长期,2019的洗牌期,自动驾驶走入了发展新阶段。谷歌Waymo、百度Apollo、特斯拉、英伟达、Mobileye等行业领先企业技术不断迭代,场景化应用落地加速,为此,《中国电子报》推出“驶向自动驾驶新纪元”系列报道,通过梳理自动驾驶技术升级、厂商布局、产业发展等,描摹自动驾驶产业新面貌。AI芯片很热,自动驾驶AI芯片更热。英伟达、英特尔、特斯拉、高通、地平线、黑芝麻智能等国内外传统芯片厂、新锐企业纷纷涌入车载AI芯片市场。如今,L2+ADAS自动驾驶商业变现风头正劲,L4高级别自动驾驶落地路线也越来越清晰,毫无疑问,自动驾驶正成为头部芯片企业争相抢占的高地。从各大

  【有奖直播报名】TI 最新C2000实时控制芯片 — F28003X

  单片机开启嵌入式到云端之旅 系列在线研讨会

  跟 TI工程师 立下你的金猪Flag!立Flag & 分享赢双重好礼!

  3小时实战+剖析:TI工程师手把手带你全面入门MSP430(限量售$4.3开发套件,助你参与动手实验)

  下载有礼|是德科技电子书 《通过了解测试精度的基础知识, 提高良率并降低风险》,不做“差不多先生”

  看视频瓜分红包:面向高效高密度开关电源的先进功率 MOSFET 技术及应用

  站点相关:市场动态半导体生产材料技术封装测试工艺设备光伏产业平板显示电子设计电子制造视频教程