2025-01-25 智能化学会动态 0
端侧大模型的革命性变革:美国禁华为芯片后,未来将如何演变?
在美国对华为芯片的禁令之后,端侧大模型是否能带来颠覆性的变化成为了一个备受关注的话题。2024年世界人工智能大会上,爱芯元智创始人、董事长仇肖莘提出了这一问题,并表示目前端侧大模型的应用仍处于探索阶段,因此难以判断其是否会引领革命。
在过去几年中,我们已经见证了AI技术在各个领域的广泛应用,从智能手机到城市摄像头,都实现了AI拍照、美颜和车牌识别等功能。然而,这些早期AI算法,如CNN和RNN,对数据处理能力有限,成本较高。而现在的大型语言模型(LLM)如GPT-3具有更强大的计算能力,但它们需要大量资源才能运行。
谈及颠覆之前,大型语言模型首先需要解决的是落地的问题。在视觉领域,大型语言模型面临可靠性、稳定性和理解不够全面等挑战。真实准确描述客观世界是视觉大型语言模型落地的关键。
内存大小、带宽限制成为端侧大型语言模型落地最底层挑战。大型语言模型需要巨量数据进行训练,而这也意味着巨大的内存需求。此外,由于带宽限制,大型数据集不能轻易传输,使得算力无法得到充分释放。因此,在开发出能够支持端侧使用的大型语言模式时,行业专家们正在积极探索DDR用Wafer to Wafer形式以及HBM(高带宽内存)的使用,以解决这些问题。
汽车、手机和PC都是预计率先采用端侧大类型化学习的人类活动场景。这要求原生支持Transformer架构的处理器。如果这些设备能够有效整合并优化这样的处理器,那么它们将能够提供比传统方案更好的性能,同时可能降低成本。
爱芯元智公司正致力于推动这一转变,他们已发布了一款名为“爱芯通元”的AI处理器,该处理器设计时就考虑到了各种不同类型的神经网络结构,其中包括Transformer架构。这使得该公司在智慧城市与辅助驾驶两个领域实现了规模化生产,并且可以支持以文搜图、通用检测等多种复杂任务。
尽管如此,无论是技术还是市场策略上的挑战,都存在许多未知因素。一方面,如果能成功推广这种新技术,它可能会彻底改变我们的生活方式;另一方面,如果失败,它可能导致资源浪费并延缓科技进步。在这个不断变化的情况下,只有持续创新与适应,我们才能真正认识到端侧大类型化学习究竟有多大的潜力,以及它何时、何地以及如何会发生突破性的变化。